搜档网
当前位置:搜档网 › 第四章-多重共线性-答案

第四章-多重共线性-答案

第四章-多重共线性-答案
第四章-多重共线性-答案

第四章 多重共线性

一、判断题

1、多重共线性是一种随机误差现象。(F )

2、多重共线性是总体的特征。(F )

3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。(F )

4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。(T )

5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(T )

6、变量的两两高度相关并不表示高度多重共线性。(F )

7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。(T )

8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。(F )

9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。( F )

10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。(T )

12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。(F )

13、多重共线性的存在会降低OLS 估计的方差。(F )

14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββΛ,n 1i ,,Λ=;如果132X X X -=,模型必然存在解释变量的多重共线性问题。(T )

17、多重共线性问题是随机扰动项违背古典假定引起的。(F ) 18、存在多重共线性时,模型参数无法估计。(F )

二、单项选择题

1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在 ( B ) A 、异方差 B 、多重共线性 C 、序列相关 D 、随机解释变量

2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型中存在 ( C ) A 、异方差性 B 、序列相关

C 、多重共线性

D 、拟合优度低

3、对于模型i i 22i 110i u X X Y +++=βββ,与0r 12=相比,当50r 12.=时,估计量1β?的方差()

1

β?var 将是原来的 ( B ) A 、 1 倍 B 、 1.33 倍 C 、1.96 倍 D 、 2 倍 4、如果方差膨胀因子VIF =10,则认为什么问题是严重的( C )

A 、异方差问题

B 、序列相关问题

C 、多重共线性问题

D 、 解释变量与随机项的相关性 5、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF ( C )。

A 、大于1

B 、小于1

C 、大于10

D 、小于10 6、模型中引入实际上与解释变量有关的变量,会导致参数的OLS 估计量方差( A ) A 、增大 B 、减小 C 、有偏 D 、非有效 7、存在严重的多重共线性时,参数估计的标准差( A )。

A 、变大

B 、变小

C 、无穷大

D 、无法估计 8、完全多重共线性时,下列判断不正确的是( D )。

A 、参数无法估计

B 、只能估计参数的线性组合

C 、模型的拟合程度不能判断

D 、可以计算模型的拟合程度

9、模型中引入一个无关的解释变量( C )

A 、对模型参数估计量的性质不产生任何影响

B 、导致普通最小二乘估计量有偏

C 、导致普通最小二乘估计量精度下降

D 、导致普通最小二乘估计量有偏,同时精度下降

三、多项选择题

1、关于多重共线性的影响,下面哪些正确:( ABCD )

A 、增大回归系数的标准差

B 、难以区分单个自变量的影响

C 、t 检验倾向于不显著

D 、回归参数估计值不稳定 2、下列哪些回归分析中很可能出现多重共线性问题( AC

E )。

A 、资本投入与劳动投入两个变量同时作为生产函数的解释变量

B 、消费作被解释变量,收入作解释变量的消费函数

C 、本期收入和前期收入同时作为消费的解释变量的消费函数

D 、商品价格、地区、消费风俗同时作为解释变量的需求函数

E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型

3、当模型中解释变量间存在高度的多重共线性时( ACD )。

A、各个解释变量对被解释变量的影响将难以精确鉴别

B、部分解释变量与随机误差项之间将高度相关

C、估计量的精度将大幅度下降

D、估计对于样本容量的变动将十分敏感

E、模型的随机误差项也将序列相关

4、下述统计量可以用来检验多重共线性的严重性( ACD )。

A、相关系数

B、DW值

C、方差膨胀因子

D、特征值

E、自相关系数

5、多重共线性产生的原因主要有(ABCDE )。

A、经济变量之间往往存在同方向的变化趋势

B、经济变量之间往往存在着密切的关联

C、在模型中采用滞后变量也容易产生多重共线性

D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性

E、以上都正确

6、多重共线性的解决方法主要有( ABCDE )。

A、保留重要的解释变量,去掉次要的或替代的解释变量

B、利用先验信息改变参数的约束形式

C、变换模型的形式

D、综合使用时序数据与截面数据

E、逐步回归法以及增加样本容量

7、关于多重共线性,判断错误的有( ABC )。

A、解释变量两两不相关,则不存在多重共线性

B、所有的t检验都不显著,则说明模型总体是不显著的

C、有多重共线性的计量经济模型没有应用的意义

D、存在严重的多重共线性的模型不能用于结构分析

8、模型存在完全多重共线性时,下列判断正确的是( AB )。

A、参数无法估计

B、只能估计参数的线性组合

C、模型的可决系数为0

D、模型的可决系数为1

9、下列判断正确的有( ABC )。

A、在严重多重共线性下,OLS估计量仍是最佳线性无偏估计量。

B、多重共线性问题的实质是样本现象,因此可以通过增加样本信息得到改善。

C、虽然多重共线性下很难精确区分各个解释变量的单独影响,但可据此模型进行预测。

D、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。

10、检测多重共线性的方法有( AC )。

A 、 简单相关系数检测法

B 、 样本分段比较法

C 、 方差膨胀因子检测法

D 、 可决系数增量贡献法

E 、 工具变量法

四、简答题

1、什么是多重共线性?产生多重共线性的原因是什么?

答:多重共线性是指解释变量之间存在完全或近似的线性关系。产生多重共线性主要有下述原因:(1)经济变量之间具有共同变化趋势(2)模型中包含滞后变量(3)利用截面数据建立模型(4)样本数据的自身原因,例如抽样仅限于总体中解释变量取值的一个有限范围。 2、什么是完全多重共线性?什么是不完全多重共线性?

答:完全多重共线:对于解释变量k 32X X X 1,,,,Λ,如果存在不全为0的数k 21λλλ,,,Λ,使得

()n 21i 0X X X ki k i 33i 221,,, ΛΛ==++++λλλλ

则称解释变量k 32X X X 1,,,,Λ之间存在着完全的多重共线性。

不完全多重共线性:对于解释变量k 32X X X 1,,,,Λ,如果存在不全为0的数k 21λλλ,,,Λ,使得

()n 21i 0v X X X i ki k i 33i 221,,, ΛΛ==+++++λλλλ

式中,i v 为随机变量,则称解释变量k 32X X X 1,,,,Λ之间存在着不完全的多重共线性。 3、完全多重共线性对OLS 估计量的影响有哪些?

答:(1)参数的估计值不确定,不能独立分辨各个解释变量对被解释变量的影响。(2)参数估计值的方差无穷大。

4、不完全多重共线性对OLS 估计量的影响有哪些?

答:(1)回归的参数估计值很不稳定,普通最小二乘估计不精确。(2)参数估计值的方差与协方差增大。(3)对参数区间估计时,置信区间趋于变大。(4)严重多重共线性时,假设检验容易作出错误的判断,t 检验可能倾向于不显著,甚至可能回归系数的正负号得不到合理的经济解释。

5、从哪些症状中可以判断可能存在多重共线性?

答:(1)模型总体性检验F 值和R 2

值都很高,但各回归系数估计量的方差很大,t 值很低,系数不能通过显著性检验。

(2)回归系数值难以置信或符号错误。

(3)参数估计值对删除或增加少量观测值,以及删除一个不显著的解释变量非常敏感。 6、什么是方差膨胀因子检验法?

答:所谓方差膨胀因子是存在多重共线性时回归系数估计量的方差与无多重共线性时回归系数估计量的方差对比而得出的比值系数。 若1VIF j =时,认为原模型不存在“多重共线性问题”;若1VIF j >时,则认为原模型存在“多重共线性问题”;若10VIF j ≥时,则模型的“多重共线性问题”的程度是很严重的,而且是非常有害的。

五、计算题

1、考虑下表中的数据

Y-10-8-6-4-20246810 X11234567891011 X213579111315171921

假设你做Y对X1和X2的多元回归,你能估计模型的参数吗?为什么?

答:不能。因为X1和X2存在完全的多重共线性,即X2=2 X1-1,或X1=0.5(X2+1)。

2、下表给出了以美元计算的每周消费支出(Y),每周收入(X1)和财富(X2)的假想数据。

(1)作Y对X1和X2的OLS

(2)直观地判断这一回归方程中是否存在多重共线性?为什么?

(3)分别作Y对X1和X2的回归,这些回归结果表明了什么?

(4)作X2对X1的回归。这一回归结果表明了什么?

答:

(1)2

1X 0350X 872033724Y ...?-+=T (3.875) (2.773) (-1.160) R 2

=0.9682

(2)可能存在多重共线性。因为财富的系数解释是随着财富的增加,消费支出的金额在减少,这与经济理论不相符。而且,财富的系数不显著。因此可能是由于多重共线性引起的。 (3)

1

X 509045524Y ..?+=

T (3.813) (14.243) R 2

=0.962

2

X 048045226Y ..?+=

T (3.132) (10.575) R 2

=0.9332

回归结果表明两个解释变量对消费支出的影响都是显著的,并且解释能力较强。 (4)

1

2X 373103643X ..?+-=

T (-0.046) (25.253) R 2

=0.988

回归结果表明每周的收入与财富是高度线性相关的,二者同时作为解释变量会产生严重的多重共线性。

3、某地区供水部门利用最近15年的用水年度数据得出如下估计模型:

rain 1231price 8717pcy 0050pop 3630house 30509326water ......---++-=

t=(-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8)

938F 930R 2.,.==

其中,water-用水总量(百万立方米),house-住户总数(千户),pop-总人口(千人),pcy-人均收入(元),price-价格(元/100 立方米),rain-降水量(毫米)。 (1)根据经济理论和直觉,请估计回归系数的符号的正负(不包括常量),为什么?观察符号与你的直觉相符吗?(2)在5%的显著性水平下,请进行变量的t 检验和方程的F 检验。t 检验与F 检验结果有相矛盾的现象吗? 答:(1)在其他变量不变的情况下,一层是的人口越多或房屋数量越多,则对用水的需求越高。所以可期望house 和pop 的符号为正;收入较高的个人可能用水较多,因此pcy 的预期符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期price 的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可以期望rain 的系数符号为负。从估计的模型看,除了pcy 之外,所有符号都与预期相符。 (2)t 统计量检验单个变量的显著性,F 统计值检验变量是否是联合显著的。这里t 检验的自由度为15-5-1=9,在5%的显著性水平的临界值为2.262。可见,所有参数估计值的t 值的绝对值都小于该值,所以即使在5%的水平下这些变量也是不显著的。这里,F 统计量的分子自由度为5,分母自由度为9。5%显著性水平下,F 分布的临界值为3.45。可见,计算的F 值大于该临界值,表明回归系数是联合显著的。

t 检验与F 检验结果的矛盾性可能是由于多重共线性造成的。house 、pop 、pcy 是高度相关的,这将使它们的t 值降低且表现为不显著。Price 和rain 不显著另有原因。根据经验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能很好地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度量。 4.某计量经济学家曾用1921-1941年与1945-1950年(1942-1944年战争期间略去)美国国内消费C 和工资收入W 、非工资-非农业收入P 、农业收入A 的时间序列资料,利用普通最小二乘法估计得出了以下回归方程:

)

.()

.()

.()

.(....?0916********A 1210P 4520W 05911338Y

+++= 37.10795

.02==F R

式下括号中的数字为相应参数估计量的标准误。试对该模型进行评析,指出其中存在的问题。 答:该消费模型的可决系数95.02=R ,F统计量的值37.107=F ,均很高,表明模型的整体拟合程度很高。

计算各回归系数估计量的t 统计量值得:91.092.8133.80=÷=t ,

2361700591t 1...=÷=,6806604520t 2...=÷=,11.009.1121.03=÷=t 。除1t 外,

其余T 值均很小。临界值()42427t 0250..=-,故工资收入W 的系数t 检验值虽然显著,但该系数的估计值却过大,该值为工资收入对消费的边际效应,它的值为1.059意味着工资收入每增加一美元,消费支出增长将超过一美元,这与经济理论和生活常识都不符。另外,尽管从理论上讲,非工资—非农业收入P 与农业收入A 也是消费行为的重要解释变量,但二者各自的t 检验却显示出它们的效应与0无明显差异。这些迹象均表明模型中存在严重的多重

共线性,不同收入部分之间的相互关系掩盖了各个部分对解释消费行为的单独影响。 5.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:

方程A :3

215.10.10.150.125?X X X Y +--= 75.02=R 方程B :4217.35.50.140.123?X X X Y

-+-= 73.02=R 其中:Y ——某天慢跑者的人数 1X ——该天降雨的英寸数 2X ——该天日照的小时数

3X ——该天的最高温度(按华氏温度) 4X ——第二天需交学期论文的班级数

请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么? (2)为什么用相同的数据去估计相同变量的系数得到不同的符号?

答:(1)第2个方程更合理一些,因为某天慢跑者的人数同该天日照的小时数应该是正相关的。

(3)出现不同符号的原因很可能是由于2X 与3X 高度相关而导致出现多重共线性的缘故。从生活经验来看也是如此,日照时间长,必然当天的最高气温也就高。而日照时间长度和第二天需交学期论文的班级数是没有相关性的。

6.某公司经理试图建立识别对管理有利的个人能力模型,他选取了15 名新近提拔的职员, 作一系列测试,确定他们的交易能力(X 1)、与他人联系的能力(X 2)及决策能力(X 3)、每名职员的个人能力(y ),原始数据如下表。

利用eviews

请回答以下问题:

(1) 建立回归模型i i 33i 22i 110u x b x b x b b y ++++=,并进行回归分析。 (2) 模型是否显著?

(3) 单个变量是否显著?是否存在多重共线性?

答:(1)

()()()()()

()()()55165215330242718913030431t 4402700494385020063903531430X 6831450X 2522891X 144424205869039Y 3

21i ............?-=+++-=

11df 2881414F 1764535SE 7957840R 2====,.,.,.

由模型估计结果可以看出:交易能力(X 1)、与他人联系的能力(X 2)及决策能力(X 3)、每

名职员的个人能力(y )正相关。平均而言,交易能力每增加1个单位,个人能力将增加0.1444242个单位;以他人联系能力每增加1个单位,个人能力将增加1.252289个单位;决策能力每增加1个单位,个人能力将增加0.683145个单位。

(2)针对0123:0H b b b ===,给定显著性水平050.=α,在F 分布表中查出自由度为

31k =-和11k n =-的临界值()5873113F 050.,.=,由表中得到58732881414F ..>=,

则应拒绝原假设,说明模型显著。

(3)根据单个系数的t 检验结果可以知道,交易能力(X 1)与决策能力(X 3)均为不显著,因此可以考虑多重共线性的存在。

7.指出下列假想模型中的错误,并说明理由:

(1)RS RI IV t t t =-+83000024112...其中,t RS 为第t 年社会消费品零售总额(亿元),

RI t 为第t 年居民收入总额(亿元)(城镇居民可支配收入总额与农村居民纯收入总额之和),

t IV 为第t 年全社会固定资产投资总额(亿元)。

(2)t t Y C 2.1180+=,其中,C 、Y 分别是城镇居民消费支出和可支配收入。 (3)t t t L K Y ln 28.0ln 62.115.1ln -+=其中,Y 、K 、L 分别是工业总产值、工业生产资金和职工人数。

答:(1)模型中RI t 的系数符号为负,不符合常理。居民收入越多意味着消费越多,二者应该是正相关关系。

(2)t Y 的系数是1.2,这就意味着每增加一元钱,居民消费支出平均增加1.2元,处于一种入不敷出的状态,这是不可能的,至少对一个表示一般关系的宏观计量经济模型来说是不可能的。

(3) t L 的系数符号为负,不合理。职工人数越多工业总产值越少是不合理的。这很可能是由于工业生产资金和职工人数两者相关造成多重共线性产生的。

多重共线性的解决之法

第七章 多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews 软件解决多重共线性的实际问题。 第一节 多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X 1,X 2,……,X k 中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型 i ki k i i i X X X Y μββββ+++++= 22110 (7-1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共线性。 从矩阵形式来看,就是0' =X X , 即1)(-

(2)不完全多重共线性 不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。 如对于多元线性回归模型(7-1)存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=++++i ki k i i u λλλ (7-3) 其中i u 为随机误差项,则可以说解释变量k X ,,X ,X 21 之间存在不完全多重共线性。随机误差项表明上述线性关系是一种近似的关系式,大体上反映了解释变量间的相关程度。 完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。 二、多重共线性产生的原因 多重共线性在经济现象中具有普遍性,其产生的原因很多,一般较常见的有以下几种情况。 (一)经济变量间具有相同方向的变化趋势 在同一经济发展阶段,一些因素的变化往往同时影响若干经济变量向相同方向变化,从而引起多重共线性。如在经济上升时期,投资、收入、消费、储蓄等经济指标都趋向增长,这些经济变量在引入同一线性回归模型并作为解释变量时,往往存在较严重的多重共线性。 (二)经济变量间存在较密切关系 由于组成经济系统的各要素之间是相互影响相互制约的,因而在数量关系上也会存在一定联系。如耕地面积与施肥量都会对粮食总产量有一定影响,同时,二者本身存在密切关系。 (三)采用滞后变量作为解释变量较易产生多重共线性 一般滞后变量与当期变量在经济意义上关联度比较密切,往往会产生多重共线性。如在研究消费规律时,解释变量因素不但要考虑当期收入,还要考虑以往各期收入,而当期收入与滞后收入间存在多重共线性的可能很大。 (四)数据收集范围过窄,有时会造成变量间存在多重共线性问题。 三、多重共线性产生的后果 由前述可知,多重共线性分完全多重共线性和不完全多重共线性两种情况,两种情况都会对模

EVIEWS案例:(消除多重共线性)影响国内旅游市场收入的主要因素分析

第四章 案例分析 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长 22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的 1994—2003年的统 计数据,如表4.2所示: 表4.2 1994年—2003年中国旅游收入及相关数据

数据来源:《中国统计年鉴2004》 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3 由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据, Views/Open Selected/One Windows/Open Group 点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

第四章多重共线性答案(1)

第四章 多重共线性 一、判断题 1、多重共线性是一种随机误差现象。(F ) 2、多重共线性是总体的特征。(F ) 3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。(F ) 4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。(T ) 5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(T ) 6、变量的两两高度相关并不表示高度多重共线性。(F ) 7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。(T ) 8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。(F ) 9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。( F ) 10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。(T ) 12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。(F ) 13、多重共线性的存在会降低OLS 估计的方差。(F ) 14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。(T ) 17、多重共线性问题是随机扰动项违背古典假定引起的。(F ) 18、存在多重共线性时,模型参数无法估计。(F ) 二、单项选择题 1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非 零 常 数 , 则 表 明 模 型 中 存 在 ( B ) A 、异方差 B 、多重共线性 C 、序列相关 D 、随机解释变量 2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型 中存在

第八章(多重共线性)

第八章 多重共线性 一、多重共线性及其产生原因 定义:对于多元线性回归模型: 01122...i i i k ki i y x x x u ββββ=+++++ 如果模型的解释变量之间存在着较强的线性相关关系,或者说,存在一组不全为零的常数12,,....,k λλλ,使得: 1122...0i i k ki i x x x v λλλ+++=,i v 是随机误差项。 则称模型存在着多重..共线性,如果0i v =,则称存在完全的多重共线性。 ?直观地看,多重共线性是不是造成了冗余变量,这里的冗余的含义是什么? 思考:只有一个解释变量会出现多重共线性吗? 产生原因: 1.经济变量的内在联系,这是根本原因,这导致多重共线性无法克服。 2.经济变量变化趋势的“共向性”。 3.解释变量中含有滞后变量。 二、多重共线性的影响 古典回归模型要求模型不存在完全的多重共线性。所以,即使存在严重的多重共线性,OLS 估计仍然是最佳线性无偏估计(BLUE )。但会产生以下问题: (一) 增大OLS 估计的方差 设模型为二元线性, 01122i i i i y x x u βββ=+++ 可以证明, 2 12 21112 1 ()()1i D x x r σβ= ? --∑ VIF 被称为方差膨胀因子。 分别计算12r 分别等于0,0.5,0.9时的方差膨胀因子。 ?方差变得过大,有什么不好?? (二) 难以区分每个解释变量的独立影响 对于多元线性回归模型,回归系数为

i i y x β?= ?,根据偏导数的概念,i β的经济含义是什么? (三) T 检验的可靠性降低 可能使T 检验失效,原来显著的T 值变成不显著的,从而将有重要影响的变量剔除出模型。 思考:比较一下和模型存在异方差及自相关时对T 检验的影响有何不同? (四) 回归模型缺乏稳定性 参数估计值对样本的变化比较敏感,这实际上也是OLS 估计方差较大的另一个表现。 例子来说明: 见表一 如果改成: 再重新进行回归,看会发生什么情况? 一个理念:多重共线性不可避免。 三、多重共线性的检验 外在症兆:R-平方很高,但只有极个别或少数几个解释变量前的系数显著(T 值偏小)。 1.相关系数检验 利用相关系数可以分析解释变量之间的两两相关情况。 例:服装需求函数。根据理论和经验分析,影响居民服装需求的主要因素有:可支配收入X ,流动资产拥有量K ,服装类价格指数P1和总物价指数P0。下表给出了有关统计资料。

多重共线性 多重共线性实验案例与独立实验问题

实验五 多重共线性模型的检验与处理(1) 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设 施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4.2所示: 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3

由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 三、消除多重共线性 采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归,结果如表4.5所示: 表4.5

第4章多重共线性

计量经济学课程教案

第四章 多重共线性 § 什么是多重共线性 一、多重共线性的概念 对于模型 Y i = 1 + 2 X 2i + 3X 3i ++ k X ki + i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。 如果存在 c 1X 1i +c 2X 2i +…+c k X ki =0 i=1,2,…,n 其中: c i 不全为0,则称为解释变量间存在完全共线性(perfect multicollinearity )。 在矩阵表示的线性回归模型 Y=X + 中,完全共线性指:秩(X)

(2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。 (3)样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本:简单线性模型,往往存在多重共线性。 截面数据样本:问题不那么严重,但多重共线性仍然是存在的。 § 多重共线性产生的后果 一、完全共线性下参数估计量不存在 μX βY += 的OLS 估计量为: Y X X X β''=-1)(? 如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。 二、近似共线性下OLS 估计量非有效 近似共线性下,可以得到OLS 参数估计量, 但参数估计量方差的表达式为 12)()?(-'=X X β σCov 由于|X’X| 0,引起(X’X)-1主对角线元素较大,使参数估计值的方差增大,OLS 参数估计量非有效。

第七章 多共线性及其处理

第七章 多重共线性及其处理 第一部分 学习辅导 一、本章学习目的与要求 1.理解多重共线性的概念; 2.掌握多重共线性存在的主要原因; 3.理解多重共线性可能造成的后果; 4.掌握多重共线性的检验与修正的方法。 二、本章内容提要 本章主要介绍计量经济模型的计量经济检验。即多重共线性问题。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t 统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 (一)多重共线性及其产生的原因 当我们利用统计数据进行分析时,解释变量之间经常会出现高度多重共线性的情况。 1.多重共线性的基本概念 多重共线性(Multicollinearity )一词由弗里希(Frish )于1934年在其撰写的《借助于完全回归系统的统计合流分析》中首次提出。它的原义是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系。 如果在经典回归模型Y X βε=+中,经典假定(5)遭到破坏,则有()1R X k <+,此时称解释变量k X X X ,,,21ΛΛ间存在完全多重共线性。解释变量的完全多重共线性,也就是解释变量之间存在严格的线性关系,即数据矩阵X 的列向量线性相关。因此,必有一个列向量可由其余列向量线性表示。 同时还有另外一种情况,即解释变量之间虽然不存在严格的线性关系,但是却有近似的线性关系,即解释变量之间高度相关。 2.多重共线性产生的原因 多元线性回归模型产生多重共线性的原因很多,主要有: (1)经济变量的内在联系 这是产生多重共线性的根本原因。 (2)解释变量中含有滞后变量 (3)经济变量变化趋势的“共向性” 必须指出,多重共线性基本上是一种样本现象。因为人们在设定模型时,总是尽量避免将理论上具有严格线性关系的变量作为解释变量收集在一起,因此,实际问题中的多重共线性并不是解释变量之间存在理论上或实际上的线性关系造成的,而是由所收集的数据(解释变量观察值)之间存在近似的线性关系所致。 (二)多重共线性的影响 多重共线性会产生以下问题: (1)增大了OLS 估计量的方差 (2)难以区分每个解释变量的单独影响 (3)回归模型缺乏稳定性 (4)t 检验的可靠性降低 (三)多重共线性的判别 在应用多元回归模型中,人们总结了许多检验多重共线性的方法。 1.系数判定法

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告

表2 由此可见,该模型,可决系数很高,F 检验值 173.3525,明显显著。但是当时,不仅、 系数的t 检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 9954.02=R 9897.02 =R 05.0=α776 .2)610()(025.02=-=-t k n t α2X 6X 6X

②.计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵 表3 由关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性相。 4.消除多重共线性 ①采用逐步回归的办法,去检验和解决多重共线性问题。 分别作Y 对X2、X3、X4、X5、X6的一元回归 如下图所示 变量 X2 X3 X4 X5 X6 参数估计值 0.0842 9.0523 11.6673 34.3324 2014.146 t 统计量 8.6659 13.1598 5.1967 6.4675 8.7487 0.9037 0.9558 0.7715 0.8394 0.9054 表4 按的大小排序为:X3、X6、X2、X5、X4。 以X3为基础,顺次加入其他变量逐步回归。首先加入X6回归结果为: t=(2.9086) (0.46214) 2R 2 R 6 31784.285850632.7639.4109?X X Y t ++-=957152.02 =R

1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 表1:1994年—2003年中国游旅收入及相关数据

最新多重共线性的解决之法

多重共线性的解决之 法

第七章多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews软件解决多重共线性的实际问题。 第一节多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,X k中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型

i ki k i i i X X X Y μββββ+++++= 22110 (7- 1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: 0X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共 线性。 从矩阵形式来看,就是0'=X X , 即1)(-

第八章练习题参考解答

第八章练习题参考解答: 练习题 8.1 Sen 和Srivastava (1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型: 2.409.39ln 3.36((ln 7))i i i i Y X D X =-+-- (4.37) (0.857) (2.42) R 2=0.752 其中:X 是以美元计的人均收入; Y 是以年计的期望寿命; Sen 和Srivastava 认为人均收入的临界值为1097美元(ln10977=),若人均收 入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国。 括号内的数值为对应参数估计值的t-值。 (1)解释这些计算结果。 (2)回归方程中引入()ln 7i i D X -的原因是什么?如何解释这个回归解释变量? (3)如何对贫穷国进行回归?又如何对富国进行回归? (4)从这个回归结果中可得到的一般结论是什么? 8.2 表中给出1965—1970年美国制造业利润和销售额的季度数据。假定利润不仅与销售额有关,而且和季度因素有关。要求: (1)如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量? (2)如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量? (3)如果认为上述两种情况都存在,又应当如何引入虚拟变量? (4)对上述三种情况分别估计利润模型,进行对比分析。 8.3 在统计学教材中,采用了方差分析方法分析了不同班次对劳动效率的影响,其样本数据为 早班 中班 晚班

34 49 39 37 47 40 35 51 42 33 48 39 33 50 41 35 51 42 36 51 40 试采用虚拟解释变量回归的方法对上述数据进行方差分析。 8.4 Joseph Cappelleri 基于1961—1966年的200只Aa 级和Baa 级债券的数据(截面数据和时间序列数据的合并数据),分别建立了LPM 和Logit 模型: LPM i i i i i i u X X X X Y ++++++=5544332 211βββββ Logit i i i i i i i u X X X X p p In Li ++++++=-=5544332 211)1( βββββ 其中:i Y =1 债券信用等级为Aa (穆迪信用等级) i Y =1 债券信用等级为Baa (穆迪信用等级) 2X =债券的资本化率,作为杠杆的测度(100?=总资本的市值 长期债券的市值) =3X 利润率(100?=总资产净值 税后收入) =4X 利润率的标准差,测度利润率的变异性 =5X 总资产净值,测度规模 上述模型中2β和4β事先期望为负值,而3β和5β期望为正值(为什么)。 对于LPM ,Cappeleri 经过异方差和一阶自相关校正,得到以下结果: i Y ?=0.6860-0.017922i X +0.0486i X 3+0.0572i X 4+0.378×10-7×5i Se=(0.1775)(0.0024) (0.0486) (0.0178) (0.039×10- 8) R 2=0.6933 对于Logit 模型,Cappeleri 在没有对异方差进行弥补的情形下用ML 得以下结果: i i i i i i X X X X p p In 56 43221092.09041.06248.03185.06622.1)1(-?+-+--=- 试解下列问题: (1)为什么要事先期望2β和4β为负值? (2)在LPM 中,当4β>0是否合理?

第四章 多重共线性

第四章 多重共线性 一、填空题 1. 在多元线性回归模型中,解释变量间呈现近似线性关系的现象为________问题,给计量经济建模带来不利影响,因此需检验和处理它。 2. 在回归分析中,当检验回归系数所得的t 值不显著时,我们往往将它归结为多重共线性。但也可能是其他原因的影响,如 或 。 3. 存在多重共线时,回归系数的标准差趋于 ,t 值趋于 。方差膨胀因子越大,OLS 估计量的 将越大。 4. 检验样本是否存在多重共线性的常见方法有:________ 、 和 。 5. 处理多重共线性的方法主要有两大类:__________和_________。 二、问答题 1. 简述多重共线性的含义。 2. 简述多重共线性的后果。 3. 方差膨胀因子(Variance Inflation Factor, VIF )及其含义? 4. 列举多重共线性的检验方法。 5. 多重共线性的补救办法? 6. 假设在模型i i i i u X X Y +++=22110βββ中,1X 与2X 之间的相关系数为零,于是有人建议你进行如下回归: i i i i i i u X Y u X Y 22201110++=++=γγαα (1) 是否存在11??βα=且22??βγ=?为什么? (2) 0?β会等于0?α 或0?γ或某两个的某个线性组合吗? (3) 是否有() ()11 ?var ?var αβ=且() ()22?var ?var γβ=? 7. 在决定一个回归模型的“最优”解释变量集时人们常用逐步回归的方法。在逐步回归中既可采取每次引进一个解释变量的程序(逐步向前回归),也可以先把所有可能的解释变量都放在一个多元回归中,然后逐一地将它们剔除(逐步向后回归)。加进或剔除一个变量,通常是根据F 检验看其对ESS 的贡献而作出决定的。根据你现在对多重共线性的认识,你赞成任何一种逐步回归的程序吗?为什么? 8.克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y 和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE 估计得出了下列回归方程:

计量经济学

第八章 多重共线性:其中的某一个解释变量可以表示为其它解释变量的线性函数。 完全多重共线性的存在对计量经济学方程的估计产生的影响? 当存在完全多重共线性时,运用普通最小二乘估计将无法得出回归参数的估计值,并且,大多数通最小二乘估计程序会意识错误信息。 完全多重共线性举例:可以观察一个解释变量是不是另一个解释变量的倍数,或者观察一个解释变量是不是另一个解释变量加上一个常数项。 简答题:多重共线性 产生的后果:(1)估计量是无偏的;(2)估计量的方差和标准差将会增大(3)多重共线性下的t统计量会变小(4)估计量对模型设定的变化变得及其敏感。当存在显著的多重共线性时,增加或者删除某个解释变量,或者某些观测值的增加或减少,通常会导致参数估计β有较大的改变。 (5)方程的整体拟合优度以及不存在多重共线性的变量的参数估计几乎不受影响。 多重共线性的诊断:(1)考察两个解释变量之间的简单相关系数,一般r>0.8,则认为存在多重共线性。 (2)有较高的方差膨胀因子,一般VIF>5,则认为存在严重的多重共线性 多重共线性的补救措施:(1)什么都不做。(方程中的多重共线性并非总是减少t统计量使其减少到不显著的程度,对β的影响也并非总是导致它的符号与预期的不同。 (2)去掉多余的变量 (3)增大样本容量 第十四章 分析题 内生变量:由系统本身确定的变量 外生变量:由系统外部因素所决定的变量前定变量:外生变量和置后的内生变量 结构式方程:是以外生变量和内生变量的方式,描述了隐含在每个内生变量背后的内在经济理论。 简约式方程:每个特定的内生变量都单独用用所有的前定变量和随机误差项表示的方程。 简答使用简约式方程的三个原因:(1)由于简约式方程没有内在的联动性,因而没有违背古典假设。(2)简约式参数被解释为效应乘数,意味着它们有着经济意义和应用价值。 (3)简约式方程在最常用的的联立方程估计方法中扮演着重要的角色, 二阶段最小二乘估计法:第一阶段:对与每个内生变量相对应的简约式方程进行回归,这里的内生变量在联立方程系统中作为解释变量。第二阶段:用简约式方程中 得到的 S Y?替代出现在结构式方程右边的Ys,然后用普通最小二乘估计修正后的结构式方程。 模型识别的阶条件:是判断联立系统中的特定方程是否可惜别的一种系统方法。(1)整个联立系统中前定变量的个数(2)所考察方程中需要估计的斜率参数的个数。 第十章 名词解释:异方差性的本质,后果,诊断,修正 非纯异方差性:有模型设定误差(比如遗漏误差)引起的。 异方差的后果:(1)纯异方差性并不会导致参数估计量有偏 (2)异方差性通常会导致普通最小二乘估计量不再具有最小方差性 (3)异方差性将导致SE(β?)的最小二乘估计量有偏,因而导致假设检验结果不可信。 第九章 名词解释序列相关:误差项的序列之间存在相关性 一阶序列相关: t t t μ ρε ε+ = -1 ε代表回归方程中的误差项。 简答序列相关性的后果:(1)纯序列相关不会导致对参数的有偏估计。 (2)序列相关是普通最小二乘估计量不再是线性无偏估计量 (3)序列相关性导致SE(β?)的普通最小二乘估计是有偏的,并使假设检验不可靠。 杜宾-沃森检验重点自己去翻书 序列相关性的修正:如果确定是纯序列相关,则应考虑用广义最小二乘法或者

计量经济学中多重共线性案例问题研究报告方案

计量经济学中多重共线性案例问题研究 摘要:本论文主要通过案例来研究计量经济学中的多重共线性的问题,对案例进行EVIEWS分析,并利用诊断共线性的经验方法及修正共线性的经验方法和通过EVIEWS分析对案例中的多重共线性进行诊断与修正,以能够完成减弱多重共线性的目标。 关键字:多重共线性诊断共线性的经验方法修正共线性的经验方法经典的线性回归模型的假定之一是各解释变量X之间不存在多重共线性。然而,在计量经济学中所说的多重共线性(mnlti-collinearity),不仅包含解释变量之间精确的线性关系,还包含解释变量之间近似的线性关系。下面来通过研究国内生产总值的增加会影响财政收入的增加还是减少的案例对多重共线性进行研究。 一、研究的目的和要求 国内生产总值GDP按照支出法的公式为:国内生产总值=消费+投资+政府购买支出+净出口,而财政收入的主要来源为各项税收收入如增值税等。只有经济持续的增长,才能提供稳定的税收来源。所以,影响财政收入的主要因素是税收收入。但是,税收收入还影响着国内生产总值。因此,为了中国未来经济的发展,需要定量的分析影响中国财政收入的因素。 二、模型设定及其估计 经过研究与分析,影响财政收入的主要因素,除了税收收入以外,还有与一些其他因素有关。为此,考虑的影响因素主要有财政支出CZZC/亿元用X2表示,国内生产总值GDP/亿元用X3表示,税收总额SSZE/亿元用X4表示。各影响变量与财政收入之间呈现正相关。因此设定了如下形式的计量经济模型来研究“国内生产总值的增加会减少财政收入吗”这个问题: Y t=β1+β2X2t+β3X3t+β4X4t+μt 式中,Yt为第t年国内财政收入(亿元);X2为财政支出(亿元);X3为国内生产总值(亿元);X4为税收总额(亿元)。各解释变量前的回归系数预期都大于0. 为估计模型参数,1985~2011年阶段财政收入的统计数据,如下表:

计量经济学Eviews多重共线性实验报告记录

计量经济学Eviews多重共线性实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期:2014 年05 月11日

广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日

说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 R值。 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据 年份 能源消费 国民 总收入 国内生 产总值 工业 增加值 建筑业 增加值 交通运输邮电 增加值 人均生活 电力消费 能源加工 转换效率 y X1 X2 X3 X4 X5 X6 X7 1985766829040.7 9016 3448.7 417.9 406.9 21.3 68.29 198680850 10274.4 10275.2 3967 525.7 475.6 23.2 68.32 198786632 12050.6 12058.6 4585.8 665.8 544.9 26.4 67.48 198892997 15036.8 15042.8 5777.2 810 661 31.2 66.54 198996934 17000.9 16992.3 6484 794 786 35.3 66.51 199098703 18718.3 18667.8 6858 859.4 1147.5 42.4 67.2 1991103783 21826.2 21781.5 8087.1 1015.1 1409.7 46.9 65.9 1992109170 26937.3 26923.5 10284.5 1415 1681.8 54.6 66.00 1993115993 35260 35333.9 14188 2266.5 2205.6 61.2 67.32 1994122737 48108.5 48197.9 19480.7 2964.7 2898.3 72.7 65.2 1995131176 59810.5 60793.7 24950.6 3728.8 3424.1 83.5 71.05 1996138948 70142.5 71176.6 29447.6 4387.4 4068.5 93.1 71.5 1997137798 77653.1 78973 32921.4 4621.6 4593 101.8 69.23 1998132214 83024.3 84402.3 34018.4 4985.8 5178.4 106.6 69.44 1999133831 88189 89677.1 35861.5 5172.1 5821.8 118.2 69.19 2000138553 98000.5 99214.6 40033.6 5522.3 7333.4 132.4 69.04 2001143199 108068.2 109655.2 43580.6 5931.7 8406.1 144.6 69.03 2002151797 119095.7 120332.7 47431.3 6465.5 9393.4 156.3 69.04 2003174990 135174 135822.8 54945.5 7490.8 10098.4 173.7 69.4 2004203227 159586.7 159878.3 65210 8694.3 12147.6 190.2 70.71 2005223319 183956.1 183084.8 76912.9 10133.8 10526.1 216.7 71.08 2006 246270 213131.7 211923.5 91310.9 11851.1 12481.1 249.4 71.24

3案例分析(多重共线性)

多重共线性的案例分析 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设 施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4.1所示: 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.2: 表4.2

由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”Quick/Group statistics/correlations ”得相关系数矩阵(如表4.3): 表4.3 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 三、消除多重共线性 采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归,结果如表4.4所示: 表4.4

实验六多元线性回归和多重共线性

实验六多元线性回归和多重共线性 姓名:何健华 学号:201330110203 班级:13金融数学2班 一 实验目的: 掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二 实验要求: 应用教材P140例子4.3.1案例做多元线性回归模型,并识别和修正多重共线性。 三 实验原理: 普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 四 预备知识: 最小二乘法估计的原理、t 检验、F 检验、R 2值。 五 实验步骤: 有关的研究分析表明,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出外,还可能与基础设施有关。因此考虑影响国内旅游收入Y (单位为亿元)的以下几个因素:国内旅游人数X1、城镇居民人均旅游支出X2(单位为元)、农村居民人均旅游支出X3(单位为元)、并以公路里程X4(单位为万公里)和铁路里程X5(单位为万公里)作为相关设施的代表,根据这些变量建立如下的计量经济模型: 01122334455y x x x x x ββββββμ=++++++ 为了估计上述模型,从《中国统计年鉴》收集到1994年到2003年的有关统计数据。 Year Y X1 X2 X3 X4 X5 1994 1023.5 52400 414.7 54.9 111.78 5.9 1995 1375.7 62900 464 61.5 115.7 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.6 1998 2391.2 69450 607 197 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.8 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200 180.98 7.3 1、 请用普通最小二乘方法估计模型参数; 2、 检验模型是否存在多重共线性,如果存在共线性,试采用适当的方法消除共线性。

相关主题