用Eviews软件建立一元线性回归模型并进行相关检验的实验报告1.数据
表1列出了某年中国部分省市城镇居民每个家庭平均全年可支配收入X与消费性支出Y 的统计数据。
2.建立模型
应用EViews软件,以表1的数据可绘出可支配收入X与消费性支出Y的散点图(图2-1)。从该三点图可以看出,随着可支配收入的增加,消费性支出也在增加,大致程线性关系。据此,我们可以建立一元线性回归模型:
Y=β0+β1·X+μ
图2-1
对模型作普通最小二乘法估计,在Eviews软件下,OLS的估计结果如图(2-2)所示。
Dependent Variable: Y
Method: Least Squares
Date: 12/07/11 Time: 21:00
Sample: 1 20
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
X 0.755368 0.023274 32.45486 0.0000
C 271.1197 159.3800 1.701090 0.1061
R-squared 0.983198 Mean dependent var 5199.515
Adjusted R-squared 0.982265 S.D. dependent var 1625.275
S.E. of regression 216.4435 Akaike info criterion 13.68718
Sum squared resid 843260.4 Schwarz criterion 13.78675
Log likelihood -134.8718 Hannan-Quinn criter. 13.70661
F-statistic 1053.318 Durbin-Watson stat 1.302512
Prob(F-statistic) 0.000000
图2-2
OLS估计结果为
^
Y=271.12+0.76X
(1.70) (32.45)
R2=0.9832 D.W. =1.3025 F=1053.318
3.模型检验
从回归估计的结果看,模型拟合较好。可绝系数R2=0.983198,表明城镇居民每个家庭平均全年消费性支出变化的98.3198%可由可支配收的变化来解释。从斜率项β1的t检验看,大于5%显著性水平下自由度为n-2=18的临界值t0.025(18)=2.101,且该斜率值满足0<0.755368<1,符合经济理论中边际消费倾向在0与之间的绝对收入假说,表明中国城镇居民平均全年可支配收入每增加1元,消费性支出增加0.755368元。
4.预测
假设我们需要关注2012年平均年可支配收入在20000元这一水平下的中国城镇居民平均年消费支出问题。由上述回归方程可得该类家庭人均消费支出的预测值:
^
Y0=271.1197+0.755368×20000=15378.4797 下面给出该类居民平均年消费支出95%置信度的预测区间。
由于平均可支配收入X的样本均值与样本方差为E(X)=6222.209 Var(X)=1994.033 于是,在95%的置信度下,E(Y0) 的预测区间为(874.28,16041.68)。
而如果我们想知道某地区城镇居民年均可支配收入为20000元时,该居民消费支出的个值预测,则仍为15378.4797。同样地,在95%的置信度下,该居民年均消费支出的预测区间为(14581.14,16175.82)。
5.异方差性检验
对于经济发达地区和经济落后地区,消费支出的决定因素不一定相同甚至差异很大,比如经济越落后储蓄率反而会越高,可能就会出现异方差性的问题。
(1)G-Q检验
在对20个样本按X从大到小排序,去掉中间4个,对前后两个样本进行OLS估计,样本容量为n1=n2=8。
前一个样本的OLS估计结果如图5-1所示。
Dependent Variable: Y
Method: Least Squares
Date: 12/07/11 Time: 22:21
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
X 0.762141 0.060187 12.66299 0.0000
C 210.9340 529.3998 0.398440 0.7041
R-squared 0.963932 Mean dependent var 6760.478
Adjusted R-squared 0.957920 S.D. dependent var 1556.814
S.E. of regression 319.3541 Akaike info criterion 14.58280
Sum squared resid 611922.2 Schwarz criterion 14.60266
Log likelihood -56.33118 Hannan-Quinn criter. 14.44885
F-statistic 160.3514 Durbin-Watson stat 1.720479
Prob(F-statistic) 0.000015
图5-1
后一个样本的OLS估计结果如图5-2所示。
Dependent Variable: Y Method: Least Squares Date: 12/07/11 Time: 22:26 Sample: 1 8
Included observations: 8
Variable
Coefficient Std. Error t-Statistic Prob. X 0.554126 0.311432 1.779287 0.1255 C
1277.161
1540.604 0.829000
0.4388
R-squared 0.345397 Mean dependent var 4016.814 Adjusted R-squared 0.236296 S.D. dependent var 166.1712 S.E. of regression 145.2172 Akaike info criterion 13.00666 Sum squared resid 126528.3 Schwarz criterion 13.02652 Log likelihood -50.02663 Hannan-Quinn criter. 12.87271 F-statistic 3.165861 Durbin-Watson stat 3.004532
Prob(F-statistic)
0.125501
图5-2
于是得到如下F 统计量: F=
)118/()118/(21----RSS RSS =6
/3.1265286
/2.611922=4.84
在5%的显著性水平下,自由度为(6,6)的F 分布的临界值为F 0.05(6,6)=4.28。所以,拒绝无异方差性假设,表明原模型存在异方差。
(2)怀特检验 记
e
~
2
对原始模型进行普通最小二乘回归得到的残差平方项,将其与X 及X 2作辅助
回归,得到结果如图5-3所示。
Heteroskedasticity Test: Breusch-Pagan-Godfrey
F-statistic
14.50681 Prob. F(2,17)
0.0002 Obs*R-squared 12.61088 Prob. Chi-Square(2) 0.0018 Scaled explained SS
5.525171 Prob. Chi-Square(2) 0.0631
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares Date: 12/09/11 Time: 19:30
Sample: 1 20
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
C -176606.0 102909.4 -1.716130 0.1043
X 48.22291 28.82429 1.672996 0.1126
X^2 -0.002044 0.001840 -1.111001 0.2820
R-squared 0.630544 Mean dependent var 42163.02
Adjusted R-squared 0.587079 S.D. dependent var 44992.75
S.E. of regression 28911.87 Akaike info criterion 23.51937
Sum squared resid 1.42E+10 Schwarz criterion 23.66873
Log likelihood -232.1937 Hannan-Quinn criter. 23.54853
F-statistic 14.50681 Durbin-Watson stat 0.982684
Prob(F-statistic) 0.000211
图5-3
e~ 2 =–176606.0+48.22X–0.002044 X2
(–1.716) (1.673) (-1.111)
R2=0.6305
怀特统计量nR2=20×0.6305=12.61,该值大于5%显著性水平下、自由度为2的χ2分布的相应临界值χ20.05= 5.99,因此,拒绝同方差的原假设。
(3)采用加权最小二乘法对原模型进行回归
为了寻找适当的权,作lne2关于OLS回归,结果如图5-4所示。
Dependent Variable: LOG(E^2)
Method: Least Squares
Date: 12/09/11 Time: 20:07
Sample: 1 20
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
X 0.000459 0.000165 2.786510 0.0122
C 6.829297 1.128582 6.051218 0.0000
R-squared 0.301368 Mean dependent var 9.825601
Adjusted R-squared 0.262555 S.D. dependent var 1.784758
S.E. of regression 1.532654 Akaike info criterion 3.786518
Sum squared resid 42.28250 Schwarz criterion 3.886091 Log likelihood -35.86518 Hannan-Quinn criter. 3.805956 F-statistic 7.764640 Durbin-Watson stat 2.216470
Prob(F-statistic)
0.012184
图5-4
结果为:
lne 2=6.829297+0.000459X
(6.0512) (2.7865) R 2=0.3014
于是,可生成权序列w i =1/)000459.0829297.6(e X xp 。对原模型进行加权最小二乘估计得到如图5-5所示。
Dependent Variable: Y Method: Least Squares Date: 12/09/11 Time: 20:25 Sample: 1 20
Included observations: 20 Weighting series: W
Variable
Coefficient Std. Error t-Statistic Prob. X 0.740255 0.035669 20.75368 0.0000 C 357.8106
197.5751 1.811010 0.0869
Weighted Statistics
R-squared
0.959885 Mean dependent var 4650.593 Adjusted R-squared 0.957657 S.D. dependent var 881.0317 S.E. of regression 171.9364 Akaike info criterion 13.22677 Sum squared resid 532118.2 Schwarz criterion 13.32634 Log likelihood -130.2677 Hannan-Quinn criter. 13.24620 F-statistic 430.7153 Durbin-Watson stat 1.556017
Prob(F-statistic)
0.000000
Unweighted Statistics
R-squared 0.982748 Mean dependent var 5199.515 Adjusted R-squared 0.981790 S.D. dependent var 1625.275 S.E. of regression 219.3233 Sum squared resid 865848.5
Durbin-Watson stat
1.309635
图5-5
对原模型进行加权最小二乘估计(WLS)得到
^
Y=357.81+0.74X
(1.811)(20.754)
R2=0.9599 D.W. =1.556 F=430.715可以看出,与不加权的OLS相比,加权最小二乘估计使得X前的参数值略有下降,说明可支配收入对消费支出的影响被略微高估了,标准差增大了,说明OLS估计低估了X对应参数的标准差。
下面women检验是否加权的回归模型已不存在异方差性。记经w i加权的回归模型为
wY=β0w+β1X+μ*
该模型的普通最小二乘回归结果为
^
w Y=357.81w+0.74wX
记该回归模型的残差估计的平方为e2*,将其与w,wX及其平方项作辅助回归,得
e2*=-5519.69+
19027339w-50471wX-805000000w2-28.998(wX)2
(-1.42) (1.36) (-1.12) (-1.36) (20.42)
R2=0.153
怀特统计量nR2=20×0.153=0.306,该值小于5%显著性水平下、自由度为4的χ2分布的相应临界值χ20.05=9.49,因此,不拒绝同方差的原假设。
(4)异方差稳健标准误法进行修正
异方差稳健标准误法修正的结果如图5-6所示
Dependent Variable: Y
Method: Least Squares
Date: 12/09/11 Time: 21:19
Sample: 1 20
Included observations: 20
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
X 0.755368 0.031596 23.90741 0.0000
C 271.1197 181.5470 1.493386 0.1527
R-squared 0.983198 Mean dependent var 5199.515
Adjusted R-squared 0.982265 S.D. dependent var 1625.275
S.E. of regression 216.4435 Akaike info criterion 13.68718
Sum squared resid 843260.4 Schwarz criterion 13.78675
Log likelihood -134.8718 Hannan-Quinn criter. 13.70661
F-statistic 1053.318 Durbin-Watson stat 1.302512
Prob(F-statistic) 0.000000
图5-6
异方差稳健标准误法修正的结果为
^
Y=271.12+0.7554X
(1.493)(23.907)
R2=0.9832 D.W. =1.3025 F=1053.38 可以看出,估计的参数与OLS相比较,结果几乎相同,只是改变了标准差,标准差变大,从而t检验值变小。
6.序列相关性检验
(1) D.W.检验法
在Eviews软件下,根据图2-2的OLS估计结果,D.W.值为1.3025,大于显著性水平为5%下,样本容量为20的D.W.分布的下限临界值d L=1.20,小于上限临界值d U=1.41,所以D.W.检验法不能确定该模型是否存在一阶自相关性。
(2)拉格朗日成数检验(LM)检验
在Eviews软件下,含1阶滞后残差项的LM检验如图6-1所示。
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 1.097067 Prob. F(1,17) 0.3096 Obs*R-squared 1.212426 Prob. Chi-Square(1) 0.2709
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/11/11 Time: 14:33
Sample: 1 20
Included observations: 20
Presample missing value lagged residuals set to zero.
Variable Coefficien
t Std. Error t-Statistic Prob.
X -0.000383 0.023215 -0.016491 0.9870
C 1.106239 158.9555 0.006959 0.9945 RESID(-1) 0.248195 0.236961 1.047410 0.3096
R-squared 0.060621 Mean dependent var -4.11E-1
3
Adjusted R-squared -0.049894 S.D. dependent var 210.6707
S.E. of regression 215.8623 Akaike info criterion 13.72464
Sum squared resid 792140.9 Schwarz criterion 13.87400
Log likelihood -134.2464 Hannan-Quinn criter. 13.75380
F-statistic 0.548534 Durbin-Watson stat 1.796899
Prob(F-statistic) 0.587687
图6-1
含1阶滞后残差项的辅助回归为
e~t =1.106–0.000383X+0.248e~t-1
(0.00696) (-0.0165) (1.0474)
R2=0.0606
于是,LM=20×0.0606=1.212,该值小于显著性水平为5%、自由度为1的χ2分布的相应临界值χ20.05(1)=3.84,由此判断原模型不存在1阶序列相关性。
所以,原模型没有违背随机扰动项的不序列相关性的假设。
实验一 Eviews 的基本使用、线性回归模型的估计和检验 实验目的与要求:熟悉Eviews 软件基本使用功能、掌握线性回归模型的参数估计及其检验。 实验内容:建立一个工作文件、数据的输入、数据的保存、生成新序列、 作序列图和相关图。线性回归模型的参数估计及其检验。 实验步骤:(具体步骤同学们可按照课堂讲解的程序进行也可按下面的指导操作,无论怎么操作,只要得到正确的结果即可) 一、模型的构建 表 2002年中国各地区城市居民人均年消费支出和可支配收入 作城市居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)的散点图,如图 从散点图可以看出居民家庭平均每人每年消费支出 (Y)和城市居民人均年可支配 收入(X)大体呈现为线性关系, 4000 6000 8000 10000 12000 4000 6000 8000 10000 12000 14000 X Y
所以建立的计量经济模型为如下线性模型: 12i i i Y X u ββ=++ 二、估计参数 利用EViews 作简单线性回归分析的步骤如下: 1、建立工作文件 首先,双击EViews 图标,进入EViews 主页。在菜单一次点击File\New\Workfile ,出现对话框“Workfile Range ”。在“Workfile frequency ”中选择数据频率: Annual (年度) Weekly ( 周数据 ) Quartrly (季度) Daily (5 day week ) ( 每周5天日数据 ) Semi Annual (半年) Daily (7 day week ) ( 每周7天日数据 ) Monthly (月度) Undated or irreqular (未注明日期或不规则的) 在本例中是截面数据,选择“Undated or irreqular ”。并在“Start date ”中输入开始时间或顺序号,如“1”在“end date ”中输入最后时间或顺序号,如“31”点击“ok ”出现“Workfile UNTITLED ”工作框。其中已有变量:“c ”—截距项 “resid ”—剩余项。 在“Objects ”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK ”出现数据编辑窗口。 若要将工作文件存盘,点击窗口上方“Save ”,在“SaveAs ”对话框中给定路径和文件名,再点击“ok ”,文件即被保存。 2、输入数据 在数据编辑窗口中,首先按上行键“↑”,这时对应的“obs”字样的空格会自动上跳,在对应列的第二个“obs”有边框的空格键入变量名,如“Y ”,再按下行键“↓”,对因变量名下的列出现“NA ”字样,即可依顺序输入响应的数据。其他变量的数据也可用类似方法输入。 也可以在EViews 命令框直接键入“data X Y ”(一元时) 或 “data Y 1X 2X … ”(多元时),回车出现“Group”窗口数据编辑框,在对应的Y 、X 下输入数据。 若要对数据存盘,点击 “fire/Save As”,出现“Save As ”对话框,在“Drives ”点所要存的盘,在“Directories ”点存入的路径(文件名),在“Fire Name ”对所存文件命名,或点已存的文件名,再点“ok ”。 若要读取已存盘数据,点击“fire/Open”,在对话框的“Drives”点所存的磁盘名,在“Directories”点文件路径,在“Fire Name”点文件名,点击“ok”即可。
使用eviews做线性回归分析 关键字: linear regression Glossary: ls(least squares)最小二乘法 R-sequared样本决定系数(R2):值为0-1,越接近1表示拟合越好,>0.8认为可以接受,但是R2随因变量的增多而增大,解决这个问题使用来调整 Adjust R-seqaured() S.E of regression回归标准误差 Log likelihood对数似然比:残差越小,L值越大,越大说明模型越正确Durbin-Watson stat:DW统计量,0-4之间 Mean dependent var因变量的均值 S.D. dependent var因变量的标准差 Akaike info criterion赤池信息量(AIC)(越小说明模型越精确) Schwarz ctiterion:施瓦兹信息量(SC)(越小说明模型越精确) Prob(F-statistic)相伴概率 fitted(拟合值) 线性回归的基本假设: 1.自变量之间不相关 2.随机误差相互独立,且服从期望为0,标准差为σ的正态分布 3.样本个数多于参数个数 建模方法: ls y c x1 x2 x3 ... x1 x2 x3的选择先做各序列之间的简单相关系数计算,选择同因变量相关系数大而自变量相关系数小的一些变量。模型的实际业务含义也有指导意义,比如 m1同gdp肯定是相关的。 模型的建立是简单的,复杂的是模型的检验、评价和之后的调整、择优。 模型检验: 1)方程显著性检验(F检验):模型拟合样本的效果,即选择的所有自变量对因变量的解释力度 F大于临界值则说明拒绝0假设。 Eviews给出了拒绝0假设(所有系统为0的假设)犯错误(第一类错误或α错误)的概率(收尾概率或相伴概率)p值,若p小于置信度(如0.05)则可以拒绝0假设,即认为方程显著性明显。 2)回归系数显著性检验(t检验):检验每一个自变量的合理性 |t|大于临界值表示可拒绝系数为0的假设,即系数合理。t分布的自由度为 n-p-1,n为样本数,p为系数位置
第一部分EViews基本操作 第一章预备知识 一、什么是EViews EViews (Econometric Views)软件是QMS(Quantitative Micro Software)公司开发的、基于Windows平台下的应用软件,其前身是DOS操作系统下的TSP软件。EViews具有现代Windows软件可视化操作的优良性。可以使用鼠标对标准的Windows菜单和对话框进行操作。操作结果出现在窗口中并能采用标准的Windows技术对操作结果进行处理。EViews还拥有强大的命令功能和批处理语言功能。在EViews的命令行中输入、编辑和执行命令。在程序文件中建立和存储命令,以便在后续的研究项目中使用这些程序。 EViews是Econometrics Views的缩写,直译为计量经济学观察,通常称为计量经济学软件包,是专门从事数据分析、回归分析和预测的工具,在科学数据分析与评价、金融分析、经济预测、销售预测和成本分析等领域应用非常广泛。 应用领域 ■ 应用经济计量学■ 总体经济的研究和预测 ■ 销售预测■ 财务分析 ■ 成本分析和预测■ 蒙特卡罗模拟 ■ 经济模型的估计和仿真■ 利率与外汇预测 EViews引入了流行的对象概念,操作灵活简便,可采用多种操作方式进行各种计量分析和统计分析,数据管理简单方便。其主要功能有: (1)采用统一的方式管理数据,通过对象、视图和过程实现对数据的各种操作; (2)输入、扩展和修改时间序列数据或截面数据,依据已有序列按任意复杂的公式生成新的序列; (3)计算描述统计量:相关系数、协方差、自相关系数、互相关系数和直方图; (4)进行T 检验、方差分析、协整检验、Granger 因果检验; (5)执行普通最小二乘法、带有自回归校正的最小二乘法、两阶段最小二乘法和三阶段最小二乘法、非线性最小二乘法、广义矩估计法、ARCH 模型估计法等; (6)对选择模型进行Probit、Logit 和Gompit 估计; (7)对联立方程进行线性和非线性的估计; (8)估计和分析向量自回归系统; (9)多项式分布滞后模型的估计; (10)回归方程的预测; (11)模型的求解和模拟; (12)数据库管理; (13)与外部软件进行数据交换 EViews可用于回归分析与预测(regression and forecasting)、时间序列(Time Series)以及横截面数据(cross-sectional data )分析。与其他统计软件(如EXCEL、SAS、SPSS)相比,EViews 功能优势是回归分析与预测,其功能框架见表1.1.1。 本手册以EViews5.1版本为蓝本介绍该软件的使用。
EVIEWS 之变系数回归模型 1 变系数回归模型 前面讨论的是变截距模型,并假定不同个体的解释变量的系数是相同的,然而在现实中变化的经济结构或者不同的经济背景等不可观测的反映个体差异的因素会导致经济结构的参数随着横截面个体的变化而变化,即解释变量对被解释变量的影响要随着截面的变化而变化。这时要考虑系数随着横截面个体的变化而变化的变系数模型。 1.变系数回归模型原理 变系数模型一般形式如下: ,1,2,,,1,2,,it i it i it y x u i N t T αβ=++==(1) 其中:it y 为因变量,it x 为1k ?维解释变量向量,N 为截面成员个数,T 为每个截面成员的观测时期总数。参数i α表示模型的常数项,i β为对应于解释变量的系数向量。随机误差项it u 相互独立,且满足零均值、等方差的假设。 在式子(1)中所表示的变系数模型中,常数项和系数向量都是随着截面个体变化而变化,因此将该模型改写为: it it i it y x u λ=+ (2) 其中:1(1)(1,)it it k x x ?+=,'(,)i i i λαβ= 模型的矩阵形式为: u X Y +?= (3) 其中:11N NT y Y y ?????=??????;121i i i iT T y y y y ???????=??????;????????????=N X X X X 00000021;1121112 22212i i ki i i ki i iT iT kiT T k x x x x x x x x x x ???????=??????,12(1)1N N k λλλ+????????=??????,11N NT u u u ?????=??????,121i i i iT T u u u u ???????=??????