多元线性回归模型练习
一、单项选择题
1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得可决系数为0.8500,则调整后的可决系数为( D )
A. 0.8603
B. 0.8389
C. 0.8655
D.0.8327
2.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在0.05的
显著性水平上对1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t
大于等于( C )
A. )30(05.0t
B. )28(025.0t
C. )27(025.0t
D. )28,1(025.0F
3.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验
0:0(0,1,2,...)t H b i k ==时,所用的统计量 服从( C )
A.t(n-k+1)
B.t(n-k-2)
C.t(n-k-1)
D.t(n-k+2)
4. 调整的可决系数 与多元样本判定系数 之间有如下关系( D ) A.2211n R R n k -=-- B. 22
111n R R n k -=--- C. 2211(1)1n R R n k -=-
+-- D. 2211(1)1n R R n k -=---- 5.对模型Y i =β0+β1X 1i +β2X 2i +μi 进行总体显著性F 检验,检验的零假设是
( A )
A. β1=β2=0
B. β1=0
C. β2=0
D. β0=0或β1=0
6.设k 为回归模型中的参数个数,n 为样本容量。则对多元线性回归方程进行
显著性检验时,所用的F 统计量可表示为( B ) A. )1()
(--k RSS k n ESS B .
C .
)1()1()
(22---k R k n R D .)()1/(k n TSS k ESS -- 7.多元线性回归分析中(回归模型中的参数个数为k ),调整后的可决系数2
R 与可决系数2R 之间的关系( A )
A. B. 2R ≥2R k -1
n n R R - - - - = 1 ) 1 ( 1 2 2 ) 1 ( ) 1 ( 2 2 - - k R k R - n
C. 02>R
D. 1)
1(122----=n k n R R 8.已知五元线性回归模型估计的残差平方和为8002
=∑t e
,样本容量为46,则
随机误差项t u 的方差估计量2?σ为( D ) A. 33.33 B. 40 C. 38.09 D. 20
9.多元线性回归分析中的 ESS 反映了( C )
A.因变量观测值总变差的大小
B.因变量回归估计值总变差的大小
C.因变量观测值与估计值之间的总变差
D.Y 关于X 的边际变化
23.在古典假设成立的条件下用OLS 方法估计线性回归模型参数,则参数估计量具有( C )的统计性质。
A .有偏特性 B. 非线性特性 C .最小方差特性 D. 非一致性特性
10.关于可决系数2R ,以下说法中错误的是( D )
A.可决系数2R 的定义为被回归方程已经解释的变差与总变差之比
B. []20,1R ∈
C.可决系数2R 反映了样本回归线对样本观测值拟合优劣程度的一种描述
D.可决系数2R 的大小不受到回归模型中所包含的解释变量个数的影响
11、下列说法中正确的是:( D )
A 如果模型的2R 很高,我们可以认为此模型的质量较好
B 如果模型的2R 较低,我们可以认为此模型的质量较差
C 如果某一参数不能通过显著性检验,我们应该剔除该解释变量
D 如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量
二、多项选择题
1.调整后的判定系数2R 与判定系数2R 之间的关系叙述正确的有( CDE ) A.2R 与2R 均非负 B.2R 有可能大于2R
C.判断多元回归模型拟合优度时,使用2R
D.模型中包含的解释变量个数越多,2R 与2R 就相差越大
E.只要模型中包括截距项在的参数的个数大于1,则22R R <
2.对模型01122t t t t y b b x b x u =+++进行总体显著性检验,如果检验结果总体线性关系显著,则有( BCD )
A. 120b b ==
B. 120,0b b ≠=
C. 120,0b b =≠
D. 120,0b b ≠≠
E. 120b b =≠
3.回归变差(或回归平方和)是指( BCD )
A. 被解释变量的实际值与平均值的离差平方和
B. 被解释变量的回归值与平均值的离差平方和
C. 被解释变量的总变差与剩余变差之差
D. 解释变量变动所引起的被解释变量的变差
E. 随机因素影响所引起的被解释变量的变差
4. 剩余变差是指( ACDE )
A.随机因素影响所引起的被解释变量的变差
B.解释变量变动所引起的被解释变量的变差
C.被解释变量的变差中,回归方程不能做出解释的部分
D.被解释变量的总变差与回归平方和之差
E.被解释变量的实际值与回归值的离差平方和
三、计算题
1.根据某地1961—1999年共39年的总产出Y 、劳动投入L 和资本投入K 的年度数据,运用普通最小二乘法估计得出了下列回归方程:
(0.237) (0.083) (0.048)
,DW=0.858
式下括号中的数字为相应估计量的标准误差。
(1)解释回归系数的经济含义;
(2)系数的符号符合你的预期吗?为什么?
解答:(1)这是一个对数化以后表现为线性关系的模型,lnL 的系数为1.451意味着资本投入K 保持不变时劳动—产出弹性为1.451 ;lnK 的系数为0.384意味着劳动投入L 保持不变时资本—产出弹性为0.384.
(2)系数符号符合预期,作为弹性,都是正值。
2.假设要求你建立一个计量经济模型来说明在学校跑道上慢跑一英里或一英里以上的人数,以便决定是否修建第二条跑道以满足所有的锻炼者。你通过整个学年收集数据,得到两个可能的解释性方程:
方程A :3215.10.10.150.125?X X X Y +--= 75.02=R
方程B :4217.35.50.140.123?X X X Y -+-= 73.02=R
其中:Y ——某天慢跑者的人数
1
X ——该天降雨的英寸数 2X ——该天日照的小时数
3X ——该天的最高温度(按华氏温度)
4X ——第二天需交学期论文的班级数
请回答下列问题:(1)这两个方程你认为哪个更合理些,为什么?
(2)为什么用相同的数据去估计相同变量的系数得到不同的符号?
解答:(1)第2个方程更合理一些,,因为某天慢跑者的人数同该天日照的小时数应该是正相关的。
(2)出现不同符号的原因很可能是由于2X 与3X 高度相关而导致出现多重共线性的缘故。从生活经验来看也是如此,日照时间长,必然当天的最高气温也就高。而日照时间长度和第二天需交学期论文的班级数是没有相关性的。
3.设有模型
01122t t t t y b b x b x u =+++,试在下列条件下: ①121b b += ②12b b =。分别求出1b ,2b 的最小二乘估计量。
解答:当121b b +=时,模型变为20112()t t t t t y x b b x x u -=+-+,可作为一元回归模型来对待1221221221212()()()()
()(())t t t t t t t t t t t t n x x y x x x y x b n x x x x -----=---∑∑∑∑∑
当12b b =时,模型变为0112()t t t t y b b x x u =+++,同样可作为一元回归模型来对待12121221212()()()(())t t t t t t t t t t n x x y x x y b n x x x x +-+=
+-+∑∑∑∑∑
4.假定以校园食堂每天卖出的盒饭数量作为被解释变量,盒饭价格、气温、附近餐厅的盒饭价格、学校当日的学生数量(单位:人)作为解释变量,进行回归分析;假设不管是否有假期,食堂都营业。不幸的是,食堂的计算机被一次病毒侵犯,所有的存储丢失,无法恢复,你不能说出独立变量分别代表着哪一项!下面是回归结果(括号为标准差):
i i i i i X X X X Y 43219.561.07.124.286.10?-+++=
(2.6) (6.3) (0.61) (5.9) 63.02=R 35=n
要求:(1)试判定每项结果对应着哪一个变量?
(2)对你的判定结论做出说
解答:(1)1i x 是盒饭价格,2i x 是气温,3i x 是学校当日的学生数量,4i x 是附近餐厅的盒饭价格。
(2)在四个解释变量中,盒饭价格同校园食堂每天卖出的盒饭数量应该是负相关关系,其符号应该为负,应为4i x ;学校当日的学生数量每变化一个单位,盒饭相应的变化数量不会是28.4或者12.7,应该是小于1的,应为3i x ;至于其余两个变量,从一般经验来看,被解释变量对价格的反应会比对气温的反应更灵敏一些,所以1i x 是附近餐厅的盒饭价格,2i x 是气温。