搜档网
当前位置:搜档网 › 第二章异方差性、自相关性和多重共线性思考与练习

第二章异方差性、自相关性和多重共线性思考与练习

第二章异方差性、自相关性和多重共线性思考与练习
第二章异方差性、自相关性和多重共线性思考与练习

第二章异方差性、自相关性和多重共线性思考与练习

参考答案

2.1参考答案

答:随机误差项方差随观察单位而变的现象为异方差。

影响:

(1)尽管OLS估计仍无偏,但起方差不再有效(即最小方差性不具备),且模型误差项方差估计有偏.

(2)t检验、F 检验失效,从而对参数、模型整体的显著性判断不可靠.

(3)预测精度低,模型的应用失效.

2.2参考答案

答:G---Q检验原理:

(1)假定随机误差项方差σ2

t 与某一解释变量X

ti

成正(负)相关;

(2)对样本观察值按X

i

升序排列后去除中间的部分样本值;

(3)分别以剩下的两部分样本值为子样,利用OLS法计算各自的方差估计

值;

(4)以两子样的方差估计值构造F统计量,判断两子样的方差是否差异显著。

若显著,则存在异方差;否则反之。

White检验原理:

通过构造辅助回归模型e2

t =

β+

ti

p

i

i

x

=1

β+

tj

p

j

i

ti

ij

x

x

=1

,

β

来判断零假设

H

0:①E(U

t

)=2

σ(t=1,2,3……N) ,并且②模型设定Y=XB+U正

确若检验显著,则否定零假设,从而认为存在异方差或者模型设定错误;若检验不显著,则接受零假设。

White、Park和Glecses检验均使用辅助回归模型来探测住回归方程系数显著性检验来探测异方差性。其间区别在于:Park和Glecses检验是通过辅助回归方程系数显著性来探测异方差;而White检验则是通过辅助回归方程整体显著性来检验探测主回归模型是否存在异方差性或者设定误差。

2.3参考答案

答:WLS发实质上为模型变换法.

考虑回归模型Y t =b 0+b 1x t +U t ,假设其存在异方差性并且Var(U t )=2t σ=K 2其中K 为常数,对远模型使用权数为W t =1/)/(t x t 的WLS 法进行估计时,实质上是对原模型作了变换,变换后的形式为:

)(t t

x f Y =)(0

t x f b +)(1t t

x f x b +)(t t

x f v

经过转换后,模型的异方差性被清除了。

构造多个权数变量进行调试的目的是 找到合适的函数)(t x f

2.4参考答案

答:根据随机误差项跨期相关的阶数可把自相关性分为一阶自相关和高阶自相关.存在自相关性时,若直接用OLS 法估计参数.

影响:

(1)不改变OLS 估计的无偏性,但该估计的最小方差性失去;

(2)将高估和低估模型参数的实际方差;

(3)使t 检验和F 检验失真;

(5) 经济预测将失效.

在多数的存在自相关的情况下,随机误差项与解释变量正相关,模型参数的方差将被低估,对应的t 统计量将增大,原先不显著的参数可能因此变显著.这样就容易将不太重要的因素作为影响显著的变量引入模型.

2.5参考答案

答:使用DW 统计量检验自相关性的原理:

(1) 以OLS 残差t e 计算统计量DW=:∑∑--221/)(t t t e e e ;

(2) 令∑∑-=21/?t t t e e e ρ

,则DW ≈2(1-ρ?)。 当DW 显著接近于0(或4)时,认为存在正(负)相关;

当DW 显著接近于2时,则认为不存在(一阶)自相关性.

DW 检验的局限性:

(1) 回归模型包含截距;

(2) 只能判断是否存在一阶自相关性;

(3) 存在两个无法判断的区域;

(4) 回归变量中不得含滞后因变量.

2.6参考答案

答:进行广义差分变换的前提是ρ值已知.ρ值是随机误差项t ε的相关系数,但t

ε

的不可观测性使得ρ值也是未知的.这样,进行广义差分变换时,需要事先估计ρ

值. ρ值的估计方法如下:首先,在大样本条件下,以方程ρ

?=1-DW/2得到ρ?值的近似估计,而在小样本情况下,则使用Theie.H 的ρ

?值估计式;然后. ρ?值的近似估计为初值,通过迭代运算,使得ρ的估计值逐步提高直至达到需要的精度.

2.7参考答案

答:(1)考虑线性回归模型t t t U B X Y +=,(t=1,2……,N )

D (t y )=D (t u )及cov(t y ,s y )=cov(t u ,s u ),可知因变量的方差和协方差即随机误差项的方差和协方差.因此可以通过分析残差来探测随机误差项的异方差性和自相关性.

(2)残差是随机误差项的估计,包含了随机误差项的全部样本信息.因此,可以通过分析残差来探测随机误差项的异方差性和自相关性.

2.8参考答案

答:(2)White 检验

首先,建立回归模型 y t =b 0+b 1x t +u t ,OLS 残差e t .然后建立辅助回归模型 e 2t =0β+1βx+11βx 2t +v t ,求出统计量nR 2=6.27043,只要显著性水平

[prob>=0.043]辅助方程就成立。

white 检验结果显著,零假设(H 0=1β=11β=0)被否定,认为存在异方差. Park 方法:

Ln(e 2t )=-7.69280+1.83936Ln(x t )

R 2=0.5022,F=10.37,[ prob >F]=0.048

Gleises 方法:

t e =-0.03529+0.01992x t

R 2=0.5022, F=18.16,[ prob >F]=0.0005

t e =-1.25044+0.32653t X

R 2=0.4730, F=16.16,[ prob>F]=0.0008

(3)以W t =1/2t σ为权数的WLS 法建立的样本回归模型为:

t

Y ?=0.70766+0.03879t x Std. Error 0.20827 0.00539

e value 3.40 7.20 prob>t 0.0032 <0.0001

2.9参考答案

答:(1)居民储蓄S与个人收入X呈上凹的抛物线关系。当个人的收入较低时,由于某些原因,随X的增加S反而降低;只有当X突破某临界点后,S才会随X的增加而增加。

(2)分别以2/1t t e W =和2/1t t x W = 进行WLS估计。

2.10参考答案

答:(1)线性样本回归模型为

t t t t e P S Y +++-=23984.001256.013

Std. Error 991 0.01800 0.19859

为进行White 检验,建立以下辅助回归模型

t t t t t t t t v p p s s p s e ++++++=222122112102ββββββ

对其进行OLS 估计后,求出统计量8899.0182?=nR ,又prob>2nR =0.007 因此异方差显著。

(2)双对数样本回归模型为

t t t t e p s Y +++-=ln 5336.0ln 8482.08367.6ln

Std. Error 6.2241 0.8360 0.8064

建立相应的W 检验的辅助回归模型,求出统计量

2nR =18?0.2570,prob>2nR =0.463。因此异方差不显著。

(3)①权数t t P W /1=的WLS 法估计的模型为

=t

Y ?t t p s 15134.002208.0152++- Std. Error 242 0.01281 0.13772

=2R 0.7106 F=18.42

White 检验结果为

2nR =18?0.41672,prob>2nR =0.186。

因此异方差不显著。

②权数2/1t t e W =的WLS 法估计的模型为

=t

Y ?t t p s 08959.002733.0205++- Std. Error 149 0.00539 0.08079

=2R 0.0.9834 F=445.30

White 检验结果为

2nR =18?0.41672,prob >2nR =0.186。

即异方差不显著。

2.11参考答案

答:(1)/*DW test */

=t

Y ?862+0.09957t x Std. Error 63 0.00205

=2R 0.9824 F=2356.97 DW=0.822

/*partest Aueeorreletion test*/

PAC(1)=0.47799 PAC(2)=-0.26181

/*BG test*/

根据辅助回归模型 t t t t u e e e +++=--22110βββ

求出统计量=-2).(R p n (20-2)?0.5186,其相应的显著性为

[prob>2).(R p n -]=0.09

(2)考虑了序列相关情形的模型估计为

t Y =836+0.1019t X +t e `

t e =1.06761-t e -0.63382-t e +t v

t v ∽IN(0,20309)

(3)预测Y

?=9194,区间预测[8672,9717]

2.13参考答案

答: 古典回归假定之一为:解释变量间不相关,即不存在多重共线性. 存在多重共线性的情形下,OLS 估计仍然无偏,但又不再有效 .具体影响如下:

⑴有较大的方差和协方差,难以得到精确的估计;

⑵参数估计不稳健.对异常值,模型设定的轻微修改等敏感;

⑶参数估计的标准差增大,T 检验失效;

⑷产生有偏的预测知心区间.

2.14参考答案

答: 多重共线性的主要原因在于:经济领域中很难通过控制性试验获得数据,而这正是古典回归模型的出发点;此外,可能有经济变量结构上的原因,也有数据收集与模型设定上的原因.

解决思路: 共线性轻微,不会影响参数估计,则允许其存在;若共线性仅由次要因素引起,则从模型中直接删除次要因素;若共线性由重要因素引起,则必须进行补救,常用方法有:①利用事前信息法;②变换模型法;③改变样本或增加样本容量;④采用逐步回归法;⑤主成分回归法;⑥在模型中引入附加方程.

2.15参考答案

答:异方差,序列相关和多重共线性都会降低T 检验的可靠性.

2.16参考答案

答:(1) 多重共线性;

(2)转化模型为 εα++=L

K A L Y ln ln ln (3)略

3.17参考答案

答: (2)逐步回归的最后模型为

Y ?=-302+0.440431x +0.490335

x Std.Error 147 0.13019 0.12643

F=1506.27

多重共线性习题及答案

多重共线性 一、单项选择题 1、当模型存在严重的多重共线性时,OLS估计量将不具备() A、线性 B、无偏性 C、有效性 D、一致性 2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF() A、大于 B、小于 C、大于5 D、小于5 3、模型中引入实际上与解释变量有关的变量,会导致参数的OLS估计量方差() A、增大 B、减小 C、有偏 D、非有效 4、对于模型y t=b0+b1x1t+b2x2t+u t,与r12=0相比,r12=0.5时,估计量的方差将是原来的() A、1倍 B、1.33倍 C、1.8倍 D、2倍 5、如果方差膨胀因子VIF=10,则什么问题是严重的() A、异方差问题 B、序列相关问题 C、多重共线性问题 D、解释变量与随机项的相关性 6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( ) A 异方差 B 序列相关 C 多重共线性 D 高拟合优度 7、存在严重的多重共线性时,参数估计的标准差() A、变大 B、变小 C、无法估计 D、无穷大 8、完全多重共线性时,下列判断不正确的是() A、参数无法估计 B、只能估计参数的线性组合 C、模型的拟合程度不能判断 D、可以计算模型的拟合程度 二、多项选择题 1、下列哪些回归分析中很可能出现多重共线性问题() A、资本投入与劳动投入两个变量同时作为生产函数的解释变量 B、消费作被解释变量,收入作解释变量的消费函数 C、本期收入和前期收入同时作为消费的解释变量的消费函数 D、商品价格、地区、消费风俗同时作为解释变量的需求函数 E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型 2、当模型中解释变量间存在高度的多重共线性时() A、各个解释变量对被解释变量的影响将难以精确鉴别 B、部分解释变量与随机误差项之间将高度相关 C、估计量的精度将大幅度下降 D、估计对于样本容量的变动将十分敏感 E、模型的随机误差项也将序列相关 3、下述统计量可以用来检验多重共线性的严重性() A、相关系数 B、DW值 C、方差膨胀因子 D、特征值 E、自相关系数 4、多重共线性产生的原因主要有() A、经济变量之间往往存在同方向的变化趋势 B、经济变量之间往往存在着密切的关联 C、在模型中采用滞后变量也容易产生多重共线性 D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性 E、以上都正确 5、多重共线性的解决方法主要有() A、保留重要的解释变量,去掉次要的或替代的解释变量 B、利用先验信息改变参数的约束形式 C、变换模型的形式 D、综合使用时序数据与截面数据 E、逐步回归法以及增加样本容量 6、关于多重共线性,判断错误的有() A、解释变量两两不相关,则不存在多重共线性 B、所有的t检验都不显著,则说明模型总体是不显著的

用SPSS进行单因素方差分析报告和多重比较

SPSS——单因素方差分析 单因素方差分析 单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure 过程。 [例子] 调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表1-1所示。 表1-1 不同水稻品种百丛中稻纵卷叶螟幼虫数

3 40 35 35 38 34 数据保存在“data1.sav”文件中,变量格式如图1-1。 图1-1 分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。 。 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统 打开单因素方差分析设置窗口如图1-2。 图1-2 单因素方差分析窗口

3)设置分析变量 因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。 因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。 4)设置多项式比较 单击“Contrasts”按钮,将打开如图1-3所示的对话框。该对话框用于设置均值的多项式比较。 图1-3 “Contrasts”对话框 定义多项式的步骤为: 均值的多项式比较是包括两个或更多个均值的比较。例如图1-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:第一组均值的1.

EVIEWS案例:(消除多重共线性)影响国内旅游市场收入的主要因素分析

第四章 案例分析 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长 22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的 1994—2003年的统 计数据,如表4.2所示: 表4.2 1994年—2003年中国旅游收入及相关数据

数据来源:《中国统计年鉴2004》 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3 由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据, Views/Open Selected/One Windows/Open Group 点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

多重共线性回归分析及其实验报告

实验报告 实验题目:多重共线性的研究指导老师: 学生一: 学生二: 实验时间:2011年10月

多重线性回归分析及其实验报告 实验目的:为了更好地了解财政收入构成,需要定量地分析影响财政收入的因素 模型设定及其估计:经分析,影响财政收入的主要因素,农业增加值X1,工业增加值X2,建筑业增加值X3,总人口X4,受灾面积X5.为此设定了如下形式的计量经济模型: Y=β 1+β 2 X1+β 3 X2+β 4 X3+β 5 X4+β 6 X5+u0 其中,Y为财政收入(元),X1农业增加值(元),X2为工业增加值(元),X3为建筑业增加值(元),X4为总人口(万人),X5为受灾面积(千公顷) 为估计模型参数,收集1978~2007年财政收入及其影响因素数据,如图: 1978~2007年财政收入及其影响因素数据 年份 财政收入CS/亿 元 农业增加值 NZ/亿元 工业增加值 GZ/亿元 建筑业增加 值JZZ/亿元 总人口 TPOP/万 人 受灾面积 SZM/千公顷1978 1132.3 1027.5 1607 138.2 96259 50790 1979 1146.6 1270.2 1769.7 143.8 97542 39370 1980 1159.9 1371.4 1996.5 195.5 98705 44526 1981 1175.8 1559.5 2048.5 207.1 100072 39790 1982 1212.3 1777.4 2162.3 220.7 101654 33130 1983 1367 1978.5 2375.8 270.6 103008 34710 1984 1642.5 2316.1 2789 316.7 104357 31890 1985 2004.6 2564.3 3448.5 417.9 105851 44365 1986 2122 2788.7 3987.5 525.7 107507 47170 1987 2199.4 3233 4565.9 665.8 109300 42090 1988 2357.6 3865.4 5062 810 111026 50870 1989 2664.5 5062 8087.3 794 112704 46991 1990 2937.4 5342.3 10284.5 859.4 114333 38474

(完整版)多重共线性检验与修正.doc

问题: 选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y 的因素有:农业化肥施 用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程: y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下: 解: 1、检验多重共线性 (1)在命令栏中输入: ls y c x1 x2 x3 x4 x5,则有; 可以看到,可决系数R2 和 F 值都 很高,二自变量x1 到 x5 的 t 值 均较小,并且x4 和 x5 的 t 检验 不显著,说明方程很可能存在多 重共线性。 (2)对自变量做相关性分析: 将x1—— x5 作为组打开, view —— covariance analysis—— correlation ,结果如下: 可以看到x1 和 x4 的相关系数 为 0.96,非常高,说明原模型 存在多重共线性

2、多重共线性的修正 (1)逐步回归法 第一步:首先确定一个基准的解释变量,即从 x1, x2, x3, x4, x5 中选择解释 y 的最好的一个建 立基准模型。分别用 x1, x2, x3, x4, x5 对 y 求回归,结果如下: 从上面 5 个输出结果可以知道,y 对 x1 的可决系数R2=0.89(最高),因此选择 第一个方程作为基准回归模型。即: Y = 30867.31062 + 4.576114592* x1 在基准模型的基础上,逐步将x2, x3 等加入到模型中, 加入 x2,结果:

拟合优度R2=0.961395 ,显著提高; 并且参数符号符合经济常识,且均显著。 所以将模型修改为: Y= -44174.52+ 4.576460*x1+ 0.672680*x2 再加入 x3,结果: 拟合优度R2=0.984174 ,显著提高; 并且参数符号符合经济常识(成灾面积越大,粮食产 量越低),且均显著。 所以将模型修改为: Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3 再加入 x4,结果: 拟合优度R2=0.987158 ,虽然比上一次拟 合提高了; 但是变量x4 的系数为 -0.091271 ,符号不 符合经济常识(农业机械总动力越高, 粮食产量越高),并且 x4 的 t 检验不显著。 因此应该从模型中剔除x4。

第四章多重共线性答案(1)

第四章 多重共线性 一、判断题 1、多重共线性是一种随机误差现象。(F ) 2、多重共线性是总体的特征。(F ) 3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。(F ) 4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。(T ) 5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(T ) 6、变量的两两高度相关并不表示高度多重共线性。(F ) 7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。(T ) 8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。(F ) 9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。( F ) 10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。(T ) 12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。(F ) 13、多重共线性的存在会降低OLS 估计的方差。(F ) 14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。(T ) 17、多重共线性问题是随机扰动项违背古典假定引起的。(F ) 18、存在多重共线性时,模型参数无法估计。(F ) 二、单项选择题 1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非 零 常 数 , 则 表 明 模 型 中 存 在 ( B ) A 、异方差 B 、多重共线性 C 、序列相关 D 、随机解释变量 2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型 中存在

用SPSS进行单因素方差分析和多重比较

方差分析 方差分析可以用来检验来多个均值之间差异的显著性,可以看成是两样本t检验的扩展。统计学原理中涉及的方差分析主要包括单因素方差分析、两因素无交互作用的方差分析和两因素有交互作用的方差分析三种情况。虽然Excel可以进行这三种类型的方差分析,但对数据有一些限制条件,例如不能有缺失值,在两因素方差分析中各个处理要有相等的重复次数等;功能上也有一些不足,例如不能进行多重比较。而在方差分析方面SPSS的功能特别强大,很多输出结果已经超出了统计学原理的范围。 用SPSS检验数据分布的正态性 方差分析需要以下三个假设条件:(1)、在各个总体中因变量都服从正态分布;(2)、在各个总体中因变量的方差都相等;(3)、各个观测值之间是相互独立的。 在SPSS中我们很方便地对前两个条件进行假设检验。同方差性检验一般与方差分析一起进行,这一小节我们只讨论正态性的检验问题。 [例7.4] 检验生兴趣对考试成绩的影响的例子中各组数据的正态性。 在SPSS中输入数据(或打开数据文件),选择Analyze→Descriptive Statistics→Explore,在Explore对话框中将统计成绩作为因变量,兴趣作为分类变量(Fator),单击Plots按钮,选中“Histogram”复选框和“Normality plots with Test”,单击“Continue”按钮,在单击主对话框中的“OK”,可以得到分类别的描述统计信息。从数据的茎叶图、直方图和箱线图都可以对数据分布的正态性做出判断,由于这些内容前面已经做过讲解,这里就不再进一步说明了。 图7-2 用Expore过程进行正态性检验 top↑

计量经济学Eviews多重共线性实验报告

计量经济学E v i e w s多重共线性实验报告 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

实验报告课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期: 2014 年 05 月 11日 广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日 说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。

四、预备知识:最小二乘法估计的原理、t检验、F检验、2R值。 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ () 录入数据,得到图。 2.2.1)采用OLS 估计参数 在主界面命令框栏中输入 ls y c x1 x2 x3 x4 x5 x6 x7回车,即可得到参数的估计结果。 由此可见,该模型的可决系数为,修正的可决系数为,模型拟和很好,F 统计量为,回归方程整体上显着。 可是其中的lnX3、lnX4、lnX6对lnY 影响不显着,不仅如此,lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。 3、多重共线性模型的识别

多重共线性问题的几种解决方法

多重共线性问题的几种解决方法 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释 变量之间不存在线性关系,也就是说,解释变量X 1,X 2 ,……,X k 中的任何一个 都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 这里,我们总结了8个处理多重共线性问题的可用方法,大家在遇到多重共线性问题时可作参考: 1、保留重要解释变量,去掉次要或可替代解释变量 2、用相对数变量替代绝对数变量 3、差分法 4、逐步回归分析 5、主成份分析 6、偏最小二乘回归 7、岭回归 8、增加样本容量 这次我们主要研究逐步回归分析方法是如何处理多重共线性问题的。 逐步回归分析方法的基本思想是通过相关系数r、拟合优度R2和标准误差三个方面综合判断一系列回归方程的优劣,从而得到最优回归方程。具体方法分为两步: 第一步,先将被解释变量y对每个解释变量作简单回归: 对每一个回归方程进行统计检验分析(相关系数r、拟合优度R2和标准误差),并结合经济理论分析选出最优回归方程,也称为基本回归方程。

第二步,将其他解释变量逐一引入到基本回归方程中,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别: 1.如果新引进的解释变量使R2得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。 2.如果新引进的解释变量对R2改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。 3.如果新引进的解释变量不仅改变了R2,而且对其他回归系数的数值或符号具有明显影响,则认为该解释变量为不利变量,引进后会使回归模型出现多重共线性问题。不利变量未必是多余的,如果它可能对被解释变量是不可缺少的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计。如果通过检验证明回归模型存在明显线性相关的两个解释变量中的其中一个可以被另一个很好地解释,则可略去其中对被解释变量影响较小的那个变量,模型中保留影响较大的那个变量。 下边我们通过实例来说明逐步回归分析方法在解决多重共线性问题上的具体应用过程。 具体实例 例1设某地10年间有关服装消费、可支配收入、流动资产、服装类物价指数、总物价指数的调查数据如表1,请建立需求函数模型。 表1 服装消费及相关变量调查数据

多重共线性考试考试与答案

第七章 多重共线性习题与答案 1、多重共线性产生的原因是什么? 2、检验多重共线性的方法思路是什么?有哪些克服方法? 3、考虑一下模型: Y t =β1+β2X t +β3X 1-t +4βX 2-t +5βX 3-t +6βX 4-t +u t 其中Y =消费,X =收入,t =时间。上述模型假定了时间t 的消费支出不仅是时间t 的收入,而且是以前多期的收入的函数。例如,1976年第一季度的消费支出是同季度收入合1975年的四个季度收入的函数。这类模型叫做分布滞后模型(distributed lag models )。我们将在以后的一掌中加以讨论。 (1) 你预期在这类模型中有多重共线性吗?为什么? (2)如果预期有多重共线性,你会怎么样解决这个问题? 4、已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。随机扰动项μ的分布未知,其他所有假设都满足。 (1)从直观及经济角度解释α和β。 (2)OLS 估计量α ?和β?满足线性性、无偏性及有效性吗?简单陈述理由。 (3)对参数的假设检验还能进行吗?简单陈述理由。 5、根据1899—1922年在美国制造业部门的年度数据,多尔蒂(Dougherty )获得如下回归结果: LogY=2.81 - 0.53logK+ 0.91logL + 0.047t Se =(1.38)(0.34) (0.14) (0.021) R 2=0.97 F=189.8 其中Y =实际产生指数,K=实际资本投入指数,L=实际劳力投入指数,t =时间或趋势。利用同样数据,他又获得一下回归: (1)回归中有没有多重共线性?你怎么知道? (2)在回归(1)中,logK 的先验符号是什么?结果是否与预期的一致?为什么或为什么不? (3)你怎样替回归的函数形式(1)做辩护:(提示:柯柏—道格拉斯生产函数。) (4)解释回归(1)在此回归中趋势变量的作用为何? (5)估计回归(2)的道理何在? (6)如果原先的回归(1)有多重共线性,是否已被回归(2)减弱?你怎样知道?

多重共线性 多重共线性实验案例与独立实验问题

实验五 多重共线性模型的检验与处理(1) 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设 施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4.2所示: 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3

由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 三、消除多重共线性 采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归,结果如表4.5所示: 表4.5

计量经济学多元线性回归、多重共线性、异方差实验报告记录

计量经济学多元线性回归、多重共线性、异方差实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到亿人次,同比增长%,国内旅游收入万亿元,同比增长%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β 1 X 1 +β 2 X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

多元线性回归模型习题及答案

多元线性回归模型 一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为( D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B ) A. i C (消费)=500+i I (收入) B. d i Q (商品需求)=10+i I (收入)+i P (价格) C. s i Q (商品供给)=20+i P (价格) D. i Y (产出量)=0.6i L (劳动)0.4i K (资本) 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显著性水平上对 1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t 大于等于( C ) A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B ) A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...) t H b i k ==时,所用的统计量 服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数 与多重判定系数 之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。 A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 、B 、C 都不对 9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n ≥k+1 B n

单因素方差分析与多重比较

单因素方差分析 单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure过程。 [例子] 调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。 表5-1 不同水稻品种百丛中稻纵卷叶螟幼虫数 数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。 图5-1 分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。 1)准备分析数据

在数据编辑窗口中输入数据。建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。或者打开已存在的数据文件“DATA5-1.SAV”。 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击 “0ne-Way ANOVA”项,系统 打开单因素方差分析设置窗口如图5-2。 图5-2 单因素方差分析窗口 3)设置分析变量 因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。 因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。 4)设置多项式比较 单击“Contrasts”按钮,将打开如图5-3所示的对话框。该对话框用于设置均值的多项式比较。

计量经济学Eviews多重共线性实验报告

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期: 2014 年 05 月 11日

广东商学院教务处制姓名实验报告成绩 评语: 指导教师(签名)

年月日 说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 R值。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98 至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ (2.1) 2.1录入数据,得到图。

第四章-多重共线性-答案(1)

) 第四章 多重共线性 一、判断题 1、多重共线性是一种随机误差现象。(F ) 2、多重共线性是总体的特征。(F ) 3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。(F ) 4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。(T ) 5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(T ) 6、变量的两两高度相关并不表示高度多重共线性。(F ) - 7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。(T ) 8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。(F ) 9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。( F ) 10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。(T ) 12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。(F ) 13、多重共线性的存在会降低OLS 估计的方差。(F ) 14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。(T ) : 15、解释变量和随机误差项相关,是产生多重共线性的原因。(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。(T ) 17、多重共线性问题是随机扰动项违背古典假定引起的。(F ) 18、存在多重共线性时,模型参数无法估计。(F ) 二、单项选择题 1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在 ( B ) A 、异方差 B 、多重共线性 '

计量经济学多元线性回归、多重共线性、异方差实验报告概要

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β1X 1 +β2X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

计量经济学题库及答案71408

计量经济学题库(超完整版)及答案 一、单项选择题(每小题1分) 1.计量经济学是下列哪门学科的分支学科(C )。 A .统计学 B .数学 C .经济学 D .数理统计学 2.计量经济学成为一门独立学科的标志是(B )。 A .1930年世界计量经济学会成立 B .1933年《计量经济学》会刊出版 C .1969年诺贝尔经济学奖设立 D .1926年计量经济学(Economics )一词构造出来3.外生变量和滞后变量统称为(D )。 A .控制变量 B .解释变量 C .被解释变量 D .前定变量 4.横截面数据是指(A )。 A .同一时点上不同统计单位相同统计指标组成的数据 B .同一时点上相同统计单位相同统计指标组成的数据 C .同一时点上相同统计单位不同统计指标组成的数据 D .同一时点上不同统计单位不同统计指标组成的数据 5.同一统计指标,同一统计单位按时间顺序记录形成的数据列是(C )。 A .时期数据 B .混合数据 C .时间序列数据 D .横截面数据 6.在计量经济模型中,由模型系统内部因素决定,表现为具有一定的概率分布的随机变量,其数值受模型中其他变量影响的变量是()。 A .内生变量 B .外生变量 C .滞后变量 D .前定变量 7.描述微观主体经济活动中的变量关系的计量经济模型是()。 A .微观计量经济模型 B .宏观计量经济模型 C .理论计量经济模型 D .应用计量经济模型 8.经济计量模型的被解释变量一定是()。 A .控制变量 B .政策变量 C .内生变量 D .外生变量 9.下面属于横截面数据的是()。 A .1991-2003年各年某地区20个乡镇企业的平均工业产值 B .1991-2003年各年某地区20个乡镇企业各镇的工业产值 C .某年某地区20个乡镇工业产值的合计数 D .某年某地区20个乡镇各镇的工业产值10.经济计量分析工作的基本步骤是()。 A .设定理论模型→收集样本资料→估计模型参数→检验模型 B .设定模型→估计参数→检验模型→应用模型 C .个体设计→总体估计→估计模型→应用模型 D .确定模型导向→确定变量及方程式→估计模型→应用模型 11.将内生变量的前期值作解释变量,这样的变量称为()。 A .虚拟变量 B .控制变量 C .政策变量 D .滞后变量 12.()是具有一定概率分布的随机变量,它的数值由模型本身决定。 A .外生变量 B .内生变量 C .前定变量 D .滞后变量 13.同一统计指标按时间顺序记录的数据列称为()。 A .横截面数据 B .时间序列数据 C .修匀数据 D .原始数据 14.计量经济模型的基本应用领域有()。 A .结构分析、经济预测、政策评价 B .弹性分析、乘数分析、政策模拟 C .消费需求分析、生产技术分析、 D .季度分析、年度分析、中长期分析 15.变量之间的关系可以分为两大类,它们是()。 A .函数关系与相关关系 B .线性相关关系和非线性相关关系

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告

表2 由此可见,该模型,可决系数很高,F 检验值 173.3525,明显显著。但是当时,不仅、 系数的t 检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 9954.02=R 9897.02 =R 05.0=α776 .2)610()(025.02=-=-t k n t α2X 6X 6X

②.计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵 表3 由关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性相。 4.消除多重共线性 ①采用逐步回归的办法,去检验和解决多重共线性问题。 分别作Y 对X2、X3、X4、X5、X6的一元回归 如下图所示 变量 X2 X3 X4 X5 X6 参数估计值 0.0842 9.0523 11.6673 34.3324 2014.146 t 统计量 8.6659 13.1598 5.1967 6.4675 8.7487 0.9037 0.9558 0.7715 0.8394 0.9054 表4 按的大小排序为:X3、X6、X2、X5、X4。 以X3为基础,顺次加入其他变量逐步回归。首先加入X6回归结果为: t=(2.9086) (0.46214) 2R 2 R 6 31784.285850632.7639.4109?X X Y t ++-=957152.02 =R

1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 表1:1994年—2003年中国游旅收入及相关数据

相关主题