EViews计量经济学实验报告-多重共线性的诊断与修正

时间                       地点                   

实验题目  多重共线性的诊断与修正 

一、实验目的与要求:

要求目的:1、对多元线性回归模型的多重共线性的诊断;

            2、对多元线性回归模型的多重共线性的修正。

二、实验内容

根据书上第四章引子“农业的发展反而会减少财政收入”,1978-20##年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV软件,做回归分析,判断是否存在多重共线性,以及修正。

三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等)

(一)模型设定及其估计

经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。研究“农业的发展反而会减少财政收入”这个问题。

设定如下形式的计量经济模型:=+++++++

其中,为财政收入CS/亿元;为农业增加值NZ/亿元;为工业增加值GZ/亿元;为建筑业增加值JZZ/亿元;为总人口TPOP/万人;为最终消费CUM/亿元;为受灾面积SZM/千公顷。

图1:                  1978~20##年财政收入及其影响因素数据

利用EV软件,生成等数据,采用这些数据对模型进行OLS回归。

(二)诊断多重共线性

1、双击“Eviews”,进入主页。输入数据:点击主菜单中的File/Open /EV Workfile—Excel—多重共线性的数据.xls ;

2、在EV主页界面的窗口,输入“ls y c x2 x3 x4 x5 x6 x7”,按“Enter”.出现OLS回归结果,图2:

图2:                 OLS 回归结果

由此可见,该模型的可决系数为0.995,修正的可决系数为0.993,模型拟和很好,F统计量为701.47,模型拟和很好,回归方程整体上显著。

但是当=0.05时,==2.069,不仅X4、X5、X6、X7的系数t检验不显著,而且X2、X4、X6系数的符号与预期相反,这表明很可能存在严重的多重共线性。(即除了农业增加值、工业增加值外,其他因素对财政收入的影响都不显著,且农业增加值、建筑业增加值、最终消费的回归系数还是负数,这说明很可能存在严重的多重共线性。)

3、计算各解释变量的相关系数:

在Workfile窗口,选择X2、X3、X4、X5、X6、X7数据,点击“Quick”—Group Statistics—Correlations—OK,出现相关系数矩阵,如图3:

图3:                                    相关系数矩阵

由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,特别是农业增加值、工业增加值、建筑业增加值、最终消费之间,相关系数都在0.8以上。

这表明模型存在着多重共线性。

(三)修正多重共线性

1、采用逐步回归法,去检验和解决多重共线性问题。分别作Y对X2、X3、X4、X5、X6、X7的一元回归,结果如下图4:在EV主页界面的窗口,输入“ls y c x2”,“回车键”。

依次如上推出X3、X4、X5、X6、X7的一元回归。综上所述,结果如下图4:

图4.一元回归估计结果

 

2、其中,加入最大,以为基础,顺次加入其他变量逐步回归。结果如下图5:

依照上面,在顺次加入X4、X5、X6、X7,进行逐步回归。综合结果如下图5:

图5.加入新变量的回归结果(一)

经比较,新加入的方程= 0.993152 ,改进最大, 但是得系数为负,这显然不符题意。

的基础上分别加入其他变量后发现,的系数都为负,与预期估计违背。因此这些变量都会引起严重的多重共线性,全部剔除,只保留。修正的回归结果为:

= -1075.289 +  0.426817

(-1.884708) (28.90168)

= 0.967567   =0.966408   F=835.3074

这说明在其他因素不变的情况下,工业增加值每增加1亿元,财政收入平均增加0.426817亿元。

四、实践结果报告:

为研究“农业的发展反而会减少财政收入”的问题,根据1978-20##年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV软件,做回归分析,判断是否存在多重共线性,以及修正。

最后修正的回归结果为:

= -1075.289 +  0.426817

(-1.884708) (28.90168)

= 0.967567   =0.966408   F=835.3074

这说明在其他因素不变的情况下,工业增加值每增加1亿元,财政收入平均增加0.426817亿元。

可决系数为0.967567,较高,说明模型拟合优度高;F值为835.3074,说明整个方程显著;斜率系数的t值28.90168,大于t统计量,t检验显著,符合题意。

逐步回归后的结果虽然实现了减轻多重共线性的目的,但反映农业增加值,建筑业增加值的X2,X3等也一并从模型中剔除出去了,可能会带来设定偏误,这是在使用逐步回归时需要注意的问题。

附加:

1、 分别作Y对X2、X3、X4、X5、X6、X7的一元回归,结果如下:

ls y c x2

ls y c x3

ls y c x4

ls y c x5 

ls y c x6

ls y c x7



2、 以为基础,顺次加入其他变量逐步回归。

X3、X2:

X3、X4:

X3、X5:

X3、X6:

X3、X7:

教师评阅意见:

相关推荐