搜档网
当前位置:搜档网 › 第七章_虚拟变量

第七章_虚拟变量

第七章_虚拟变量
第七章_虚拟变量

虚拟变量(dummy variable )

在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因素也应该包括在模型中。

由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量,用D 表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。

1.截距移动

设有模型,

y t = β0 + β1 x t + β2D + u t ,

其中y t ,x t 为定量变量;D 为定性变量。当D = 0 或1时,上述模型可表达为,

β0 + β1x t + u t , (D = 0) y t = (β0 + β2) + β1x t + u t , (D = 1)

20

40

60

20

40

60X

Y

图8.1 测量截距不同

D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。

例:中国成年人体重y (kg )与身高x (cm )的回归关系如下: –105 + x D = 1 (男)

y = - 100 + x - 5D =

– 100 + x D = 0 (女) 注意:

① 若定性变量含有m 个类别,应引入m -1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap )。

② 关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。

③ 定性变量中取值为0所对应的类别称作基础类别(base category )。

④ 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如:

1 (大学) D = 0 (中学) -1 (小学)。

β0

β0+β2

D = 1 D =0

例1:中国季节GDP 数据的拟合(虚拟变量应用,file: Dummy05)

1.2

1.6

2.0

2.4

2.8

96:1

96:397:197:398:198:399:199:300:100:3

GDP

1.0

1.5

2.0

2.5

3.0

0510152025

T

GDP

GDP 序列图 不用虚拟变量的情形

若不采用虚拟变量,得回归结果如下,

GDP = 1.5427 + 0.0405 T

(11.0) (3.5) R 2 = 0.3991, DW = 2.6, s.e. = 0.3 定义

1 (1季度) 1 (2季度) 1 (3季度) D 1 = D

2 = D

3 =

0 (2, 3,4季度) 0 (1, 3, 4季度) 0 (1, 2, 4季度)

第4季度为基础类别。

GDP = 2.0922 + 0.0315 T – 0.8013 D1 – 0.5137 D2– 0.5014 D3 (64.2) (15.9) (-24.9) (-16.1) (-15.8)

R 2

= 0.9863, DW = 1.96, s.e. = 0.05

附数据如下:

年 GDP t D1 D2 D3 1996:1 1.3156 1 1 0 0 1996:2 1.6600 2 0 1 0 1996:3 1.5919 3 0 0 1 1996:4 2.22096 4 0 0 0 1997:1 1.46856 5 1 0 0 1997:2 1.84948 6 0 1 0 1997:3 1.7972 7 0 0 1 1997:4 2.3620 8 0 0 0 1998:1 1.58994 9 1 0 0 1998:2 1.88316 10 0 1 0 1998:3 1.97044 11 0 0 1 1998:4 2.51176 12 0 0 0 1999:1 1.6784 13 1 0 0 1999:2 1.9405 14 0 1 0 1999:3 2.0611 15 0 0 1 1999:4 2.5254 16 0 0 0 2000:1 1.8173 17 1 0 0 2000:2 2.1318 18 0 1 0 2000:3 2.2633 19 0 0 1 2000:4 2.7280 20 0 0 0

数据来源:《中国统计年鉴》1998-2001

2.斜率变化

以上只考虑定性变量影响截距,未考虑影响斜率,即回归系数的变化。当需要考虑时,可建立如下模型:

y t = β0 + β1 x t + β2 D + β3 x t D + u t ,

其中x t 为定量变量;D 为定性变量。当D = 0 或1时,上述模型可表达为,

(β0 + β2 ) + (β1 + β3)x t + u t , (D = 1) y t = β0 + β1 x t + u t , (D = 0) 通过检验 β3是否为零,可判断模型斜率是否发生变化。

20

40

60

80

100

20

40

60

X Y

10

20

304050

6070

20

40

60

T

Y

图8.5 情形1(不同类别数据的截距和斜率不同) 图8.6 情形2(不同类别数据的截距和斜率不同)

例2:用虚拟变量区别不同历史时期(file:dummy2)

中国进出口贸易总额数据(1950-1984)见上表。试检验改革前后该时间序列的斜率是否发生变化。定义虚拟变量D 如下

0 (1950 - 1977) D =

1 (1978 - 1984)

中国进出口贸易总额数据(1950-1984) (单位:百亿元人民币)

年 trade time D time D 年

trade time D time D 1950 0.415 1 0 0 1968 1.085 19 0 0 1951 0.595 2 0 0 1969 1.069 20 0 0 1952 0.646 3 0 0 1970 1.129 21 0 0 1953 0.809 4 0 0 1971 1.209 22 0 0 1954 0.847 5 0 0 1972 1.469 23 0 0 1955 1.098 6 0 0 1973 2.205 24 0 0 1956 1.087 7 0 0 1974 2.923 25 0 0 1957 1.045 8 0 0 1975 2.904 26 0 0 1958 1.287 9 0 0 1976 2.641 27 0 0 1959 1.493 10 0 0 1977 2.725 28 0 0 1960 1.284 11 0 0 1978 3.550 29 1 29 1961 0.908 12 0 0 1979 4.546 30 1 30 1962 0.809 13 0 0 1980 5.638 31 1 31 1963 0.857 14 0 0 1981 7.353 32 1 32 1964 0.975 15 0 0 1982 7.713 33 1 33 1965 1.184 16 0 0 1983 8.601 34 1 34 1966 1.271 17 0 0 1984 12.010 35 1 35 1967 1.122 18 0 0

以时间time 为解释变量,进出口贸易总额用trade 表示,估计结果如下:

trade = 0.37 + 0.066 time - 33.96D + 1.20 time D

(1.86) (5.53) (-10.98) (12.42)

0.37 + 0.066 time (D = 0, 1950 - 1977)

=

- 33.59 + 1.27 time (D = 1, 1978 - 1984)

上式说明,改革前后无论截距和斜率都发生了变化。进出口贸易总额的年平均增长量扩大了18倍。

例3:香港季节GDP 数据(单位:千亿港元)的拟合(虚拟变量应用, file:dummy6)

1.0

1.5

2.02.5

3.03.5

4.0

GDP

1.0

1.5

2.02.5

3.03.5

4.0

GDP

1.6952+0.0377*T

1990~1997年香港季度GDP呈线性增长。1997年由于遭受东南亚金融危机的影响,经济发展处于停滞状态,1998~2002年底GDP总量几乎没有增长(见上图)。对这样一种先增长后停滞,且含有季节性周期变化的过程简单地用一条直线去拟合显然是不恰当的。为区别不同季节,和不同时期,定义季节虚拟变量D2、D3、D4和区别不同时期的虚拟变量DT 如下(数据见附录):

1 (第2季度)

D2 =

0 (其他季度)

1 (第3季度)

D3 =

0 (其他季度)

1 (第4季度)

D4 =

0 (其他季度)

1 (1998:1~2002:4)

DT =

0 (1990:1 ~1997:4)

得估计结果如下:

GDP t = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4+ 1.8338 DT - 0.0654 DT t

(50.8) (64.6) (3.7) (9.9) (11.0) (19.9) (-28.0)

R2= 0.99, DW = 0.9, s.e. = 0.05, F=1198.4, T=52, t0.05 (52-7) = 2.01 对于1990:1 ~1997:4

GDP t = 1.1573 + 0.0668 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4

对于1998:1~2002:4

GDP t = 2.9911 + 0.0014 t + 0.0775 D2 + 0.2098 D3 + 0.2349 D4

如果不采用虚拟变量拟合效果将很差。

GDP t = 1.6952 + 0.0377 t

(20.6) (13.9)

R 2 = 0.80, DW = 0.3, T =52, t 0.05 (52-2) = 2.01

案例5 天津市粮食市场小麦批发价与面粉零售价的关系研究(file: xiezhiyong ) 首先看天津市粮食市场小麦批发价格的变化情况(图1)。1995年初,天津市粮食市场的小麦批发价格首先放开。在经历5个月的上扬之后,进入平稳波动期。从1996年8月份开始小麦批发价格一路走低。至2002年12月份,小麦批发价格降至是1160元/吨。 其次看面粉零售价的变化情况。因为面粉零售价格直接关系到居民的日常生活,所以开始时没有与小麦批发价格一起放开。当小麦批发价格一路看涨时,1995年1月至1996年6月面粉零售价格一直处于2.14元/千克的水平上。1996年7月起,面粉零售价格也开始在市场上放开。受小麦批发价格上涨的影响,一个月内面粉零售价格从2.14元/千克涨到2.74元/千克。在这个价位上坚持了11个月之后,面粉零售价格开始下降。与小麦批发价格的下降相一致,在经历了5年零7个月的变化之后,面粉零售价格又恢复到接近开放前2.14元/千克的水平上(2.17元)。

散点图如图2。按时间分析这些观测点的变化情况(见图3,逆时针方向运动)。见图4,直接拟合这些数据效果将很差(R 2 = 0.027, r = 0.17)。

2.0

2.22.42.62.8

1000

12001400

1600

18002000

95

96

97

98

99

00

01

02

retail price

wholesale

2.0

2.2

2.4

2.6

2.8

100012001400160018002000

w h o l e s a l e

r e t a i l p r i c e

图1 图2

2.0

2.22.42.6

2.8

1000

1200

1400

1600

1800

2000

wholesale

retail price

2.0

2.2

2.4

2.62.8

100012001400160018002000

w h o l e s a l e

r e t a i l p r i c e

图3 图4

利用虚拟变量技术,在模型中加入虚拟变量。定义

D = 0,(1995: 1~1996:6,面粉零售价格放开之前), D = 1,(1996:7~2002:12,面粉零售价格放开之后)。 取对数关系建立模型。

Lnsale的系数没有显著性(对于面粉零售价格放开之前的散点来说回归直线是一条水平线)。剔出Lnsale变量,得估计结果

PRICE = 2.140 + 1.1215 Lnsale?D– 7.7458?D

(131.5) (23.9) (-23.0) R2 = 0.9054,

PRICE = 2.140, D=0

PRICE = – 5.6058 + 1.1215 Lnsale, D=1

一条回归直线的斜率为零,一条回归直线的斜率为1.12。可决系数从不加虚拟变量模型的0.046增加到0.905(输出结果见下)。

本例也可以建立倒数模型:

2.0

2.2

2.4

2.6

2.8

0.00040.00050.00060.00070.00080.00090.0010

1/SALE

PR IC E

PRICE = 2.140 + 1.5141?D – 1565.9 (1/sale ) ?D

(145.9) (32.1) (-27.0) R 2 = 0.9231,

PRICE = 2.140, D=0 PRICE = 3.6541 – 1565.9 (1/sale ), D=1

第七章 虚拟变量

第七章虚拟变量 第一节虚拟变量的引入 一、什么是虚拟变量 前面几章介绍的解释变量都是可以直接度量的,称为定量变量。如收入、支出、价格、资金等等。但在现实经济生活中,影响应变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些无法定量的解释变量的影响,如性别、民族、国籍、职业、文化程度、政府经济政策变动等因素,他们只表示某种特征的存在与不存在,所以称为属性变量或定性变量。 属性变量:不能精确计量的说明某种属性或状态的定性变量。 在计量经济模型中,应当包含属性变量对应变量的影响作用。那怎么才能把定性变量包括在模型中呢?属性变量通常是非数值变量,直接纳入回归方程中进行回归,显然是很困难的。为此,人们采取了一种构造人工变量的方法,将这些定性变量进行量化,使其能与定量变量一样在回归模型中得以应用。 由于定性变量通常是表明某种特征或属性是否存在,如性别变量中以男性为分析基础的话,那就只有男性、非男性;政策变动变量中以政策不变为基准,则有政策不变,和政策变动;至于有两种以上的状态的话,比如学历分高中,本科,本科以上等等,我们又怎么办呢?把疑问留到后面去解决。既然定性变量只有存在或不存在两种状态,所以量化的一般方法是取值为0或1。称为虚拟变量。 虚拟变量:人工构造的取值为0或1的作为属性变量代表的变量。一般常用D表示。 D=0,表示某种属性或状态不存在D=1,表示某种属性或状态存在 比如前面说的性别变量,以男性为基准,则当样本为男性时,虚拟变量取0,当样本为女性时,则虚拟变量取1。 当虚拟变量作为解释变量引入计量经济模型时,对其回归系数的估计和统计检验方法都与定量解释变量相同。 二、虚拟变量的作用 1、作为属性因素的代表,如,性别、种族等 2、作为某些非精确计量的数量因素的代表,如:受教育程度、年龄段等; 3、作为某些偶然因素或政策因素的代表,如战争、911等。 4、时间序列分析中作为季节(月份)的代表(比如对某些明显有淡季、旺季之分的产品) 5、分段回归,研究斜率、截距的变动; 6、比较两个回归模型; 7、虚拟应变量概率模型,应变量本身是定性变量(比如你研究某产品的购买率,应变量本 身就是买或不买) 三、虚拟变量的设置规则 1、虚拟变量D取值为0,还是取值为1,要根据研究的目的决定。D取值为0的类型,是基础类型,是比较的基准。不如前面说的性别变量,如果你研究是以男性为研究基准,则样本为男性,D取值为0, 2、避免落入“虚拟变量陷阱”。 当一个定性变量含有m个相互排斥的类型时,应向模型引入m—1个虚拟变量。比如“性别”含男性和女性两个类别,所以当性别作为解释变量时,应向模型引入一个虚拟变量。取值方式是:D=1(男性)、D=0(女性)或D=0(男性)、D=1(女性) 而当“学历”含有四个类别时,即大学、中学、小学、无学历。当“学历”作为解释变量时,应向模型引入三个虚拟变量。一种取值方式是: 1 (大学)1(中学)1(小学) D1= 0 (非大学)D2 = 0(非中学)D3= 0(非小学) 所谓的“虚拟变量陷阱”就是当一个定性变量含有m个类别时,模型引入m个虚拟变量,造成了虚拟变量之间产生完全多重共线性,无法估计回归参数。 在m-1个虚拟变量中,虚拟变量可以同时取值为0,但不能全部取值为1。 3、当定性变量含有m个类别时,不能把虚拟变量的值设为D=0(第一类)D=1(二类)D=2(三类)等等。

虚拟变量回归模型

虚拟变量回归模型 以下是为大家整理的虚拟变量回归模型的相关范文,本文关键词为虚拟,变量,回归,模型,内蒙古,科技,大学,课程,计量经济学,您可以从右上方搜索框检索更多相关文章,如果您觉得有用,请继续关注我们并推荐给您的好友,您可以在综合文库中查看更多范文。 内蒙古科技大学

实验报告 课程名:计量经济学实验项目名称:单方程线性回归模型的扩展——虚拟变量回归模型 院(系):专业班级:姓名:学号: 1 内蒙古科技大学 实验地点:经管机房 实验日期:20XX年4月18日 实验目的:掌握虚拟变量回归模型的建立、参数估计和统计检验。实验内容: 1)生成趋势变量2)生成季节虚拟变量3)生成分段虚拟变量4)建立虚拟变量回归模型 5)虚拟变量回归模型的参数估计和统计检验实验方法、步骤和结果: 一、生成趋势变量 1、建立新的工作文件,导入数据并且重命名

2、点击quick,generateseries生成序列,t=@trend(1990:1)+1 2 并填写公式内蒙古科技大学 3、打开gDp,点击View,graph,line生成趋势图。 根据趋势图可以看出近似分段虚拟变量,需剔除季节的影响 3 内蒙古科技大学 二、生成季节虚拟变量 生成虚拟变量,点击quick----generateseries输入公式

D2=@seas(2)D3=@seas(3)D4=@seas(4) 三、生成分段虚拟变量 1、为了研究1997年金融危机对香港经济的影响,以1997年为分界点。设d5=0,将sample改为1990第一季度到1997年第四季度。 4 内蒙古科技大学 2、设d5=1,将sample改为1998年第一季度到20XX年第四季度。 四、建立虚拟变量回归模型 gDp^=?^1+?^2t+?^3d2t+?^4d3t+?^5d4t+?^6d5t+?^7d5t*t 五、虚拟变量回归模型的参数估计和统计检验点击quick,

Eviews虚拟变量实验报告

实验四虚拟变量 【实验目的】 掌握虚拟变量的基本原理,对虚拟变量的设定和模型的估计与检验,以及相关的Eviews操作方法。 【实验内容】 试根据1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料建立 【实验步骤】 1、相关图分析 根据表中数据建立人均收入X与彩电拥有量Y的相关图(SCAT X Y)。从相关图可以看出,前3个样本点(即低收入家庭)与后5个样本点(中、高收入)的拥有量存在较大差异,

因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下: ?? ?=低收入家庭 中、高收入家庭 1D 2、构造虚拟变量 构造虚拟变量 1D (DATA D1),并生成新变量序列: GENR XD=X*D1 3、估计虚拟变量模型 LS Y C X D1 XD 得到估计结果:

我国城镇居民彩电需求函数的估计结果为: XD D X Y 009.0873.31012.0611.571-++=∧ (16.25) (9.03) (8.32) (-6.59) 366,066.1..,9937.02===F e s R 再由t 检验值判断虚拟变量的引入方式,并写出各类家庭的需求函数。 虚拟变量的回归系数的t 检验都是显著的,且模型的拟合优度很高,说明我国城镇居民低收入家庭与中高收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异,所以以加法和乘法方式引入虚拟变量是合理的。 低收入家庭与中高收入家庭各自的需求函数为: 低收入家庭: X Y 012.0611.57+=∧ 中高收入家庭: X X Y 003.0484.89)009.0012.0()873.31611.57(+=-++=∧ 由此可见我国城镇居民家庭现阶段彩电消费需求的特点: 对于人均年收入在3300元以下的低收入家庭,需求量随着收入水平的提高而快速上升,人均年收入每增加1000元,百户拥有量将平均增加12台;对于人均年收入在4100元以上的中高收入家庭,虽然需求量随着收入水平的提高也在增加,但增速趋缓,人均年收入每增加1000元,百户拥有量只增加3台。

第八章虚拟变量参考答案

练习题8.1参考解答: (1)在其它条件不变的情况下,对数人均收入提高1%,则平均预期寿命可能提高约0.0939年。但从统计检验结果看,对数人均收入lnX 对期望寿命Y 的影响并不显著。方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。 (2)引入()ln 7i i D X -的原因是想从截距和斜率两个方面考证将人均收入超过1097美元的国家定义为富国的话,贫国和富国的预期寿命是否存在显著的区别。 如果人均收入大于1097美元,那么虚拟变量取值为1,否则为0。即: 1 1097 (l n ()7)0 1097 i i D X ?-=??人均收入大于美元人均收入低于 美元 (3) 对于贫穷国,其回归方程为: 2.409.39ln i X -+ 对于富国,其回归方程为: 2.40(9.39- 3.36)ln 3.36*721.12 6.03ln i i X X -++=+ 习题8.2参考答案 由于有四个季度,因此引入三个季度虚拟变量 1 1 1 1220 0 0 D D D ???===??????一季度二季度三季度其它其它其它 (1)按照加法模型引入三个虚拟变量,模型为:(加法模型的作用是改变了设定模型的截距 水平) i 0112233i i Y =D D D X ααααβμ+++++ 回归结果如下: 123i 22?=6910.449187.7317D 1169.32D 417.1182D 0.038008X t= (3.594792) (-0.28439 (1.835446) 065093256914 R =0.517642 R =0.416093 F=5.097454 DW=0.39625 i Y -+-+)(-.) (.) (2)由于考虑利润对销售额的变化率发生变异,即斜率的改变,因此按照乘法模型引入三 个虚拟变量,模型为: i 01i 1i 12i 23i 3i Y =X X D X D X D ββαααμ+++++ 回归结果如下: i i 1i 2i 322?=7014.7570.037068X -0.000933X D 0.00791X D 0.002385X D t= (3.934394) (3.273896 (-0.216776) 0.0040180.58529 R =0.519733 R =0.418624 F=5.140311 DW=0.429628 i Y ++--)() () (3)按照加法和乘法相结合的方式引入三个虚拟变量,模型为: i 01122331i 2i 13i 24i 3i Y =D D D X X D X D X D ααααββββμ++++++++ 回归结果为: i 123i i 1i 2i 322?Y =10457.394752.26D 3764.21D 4635.46D 0.0159X 0.029X D 0.03X D 0.0266X D t= (2.566) (-0.87 (-0.6860.8320.6280824089960749 R =0.546701 R =0.348383 F=2---++++-)) () () (.) (.)(.).756686 DW=0.464982

计量经济学第七章第5,6,7题答案

第7章练习5 解:根据Eview 软件得如下表: Dependent Variable: Y Method: ML - Binary Logit (Quadratic hill climbing) Date: 05/22/11 Time: 22:19 Sample: 1 16 Included observations: 16 Convergence achieved after 5 iterations Covariance matrix computed using second derivatives Variable Coefficient Std. Error z-Statistic Prob.?? C Q V McFadden R-squared ????Mean dependent var . dependent var ????. of regression Akaike info criterion ????Sum squared resid Schwarz criterion ????Log likelihood Hannan-Quinn criter. ????Restr. log likelihood LR statistic ????Avg. log likelihood Prob(LR statistic) Obs with Dep=0 7 ?????Total obs 16 Obs with Dep=1 9 于是,我们可得到Logit 模型为: V Q i 0177.0004.0107.11Y ?++-= () () () 685.40R 2 MCF = , LR(2)= 如果在Binary estination 这一栏中选择Probit 估计方法,可得到如下表:

计量经济学实验报告

计量经济学实验报告——对我国商品房价格的计量经济学研究

摘要:基于我国对住房的庞大的需求,近年来,房地产产业的迅猛发展,全国各地都出现了商品房销售价格持续走高的现象,而由此更是掀起了“购房热”和“炒房热”的浪潮。出于谨慎性原则和解决因房价居高不下而造成的居民“买房难”的困境,国家出台了诸多措施但都收效甚微。无法抑制的上涨的房价,究竟受什么因素在影响,而从哪些方面入手才可以实现对房价的调控呢?本文将从人均可支配收入、房屋造价、土地购置费、地区人均 GDP、政策因素等几个方面展开分析,初步推到出影响商品房销售价格的因素,并对如何实现对房价的调控进行尝试性的讨论。 关键词:房屋销售价格影响因素调控

1引言 自从 1998 年我国实行住房商品化后,随着我国市场化改革的快速推进,房地产业己经成为拉动经济增长的支柱产业。从住房制度改革以来短短几年时间,纵观国内,从沿海开放城市到中西部欠发达地区,中国大地上几乎所有城市商品楼如雨后春笋般拔地而起。 而商品房价格的持续走高也就成为了人们热议的话题。特别是,近年来,中国房价持续走高。尽管国家政策层已经启动了几轮调控,但房价丝毫没有要稳定下来的迹象,房价高涨,一房难求的情况仍在持续。房地产行业已经成为我国国民经济的支柱产业,不仅影响着国民经济的增长,也牵动着千家万户的心。然而,房价到底为何如此之高,其未来走向将会怎样?为了研究这个问题,我们需要建立计量经济学模型。 2理论分析 2.1商品房“房价”问题的思维路程 商品房之所以被称为商品房,原因就在于它同其他商品一样,具有商品的共性。众所周知,商品的价值是由凝结在商品中的无差别的人类劳动所决定的,难么商品房的价格是也是由其价值决定的,其价值既包括所占用土地的价值,包括土地上建筑物的价值。除此之外,与其他商品一样,还受到供求状况、竞争程度、消费者偏好、市场预期、房地产企业经营策略和政府相关政策的影响,其价格围绕价值规律上下波动。但是,与普通商品不同,商品房还具有建设周期长、价

实验报告7-虚拟变量

2013-2014学年第 一 学期 实 验 报 告 实验课程名称 虚拟变量模型 专 业 班 级 资产评估1101 学生 学号 31105073 学 生 姓 名 方申慧 实验指导教师 董美双 编号:

实验名称多重共线性检验与修正指导老师董美双成绩 专业资产评估班级 1101 姓名方申慧学号 31105073 一、实验目的 目的:通过实验,理解并掌握虚拟变量模型的意义、建模的方法、虚拟变量引入的原则和技巧等。 要求:熟练掌握虚拟变量引入的加法方式和乘法方式,并正确解读和分析回归结果。 首先做例题8-10,按步骤分析季节性因素的影响;然后利用上证指数的数据分析股市周效应(周1-周5任选),或者自己收集数据按上面的步骤做一遍,把结果输出到word文档中。 步骤: 例题8-10 Dependent Variable: Y Method: Least Squares Date: 11/28/13 Time: 09:12 Sample: 1982:1 1988:4 Included observations: 28 C 2431.198 93.35790 26.04170 0.0000 T 48.95067 4.528524 10.80941 0.0000 D1 1388.091 103.3655 13.42896 0.0000 D2 201.8415 102.8683 1.962136 0.0620 D3 85.00647 102.5688 0.828775 0.4157 R-squared 0.945831 Mean dependent var 3559.718 Adjusted R-squared 0.936411 S.D. dependent var 760.2102 S.E. of regression 191.7016 Akaike info criterion 13.51019 Sum squared resid 845238.2 Schwarz criterion 13.74808

计量实验报告

计量经济学第二次实验报告 (利用所给数据(bothtwins data Excel文件)研究教育的工资回报率问题) 一、实验内容: 1、实验目的: 利用所给数据(bothtwins data Excel文件)研究教育的工资回报率问题。 2、实验要求: 运用Eviews软件进行数据分析,利用已知数据建立回归模型,考虑诸如遗漏变量和测量误差的模型内生性问题。由于数据都是不同家庭的双胞胎数据,分析时请利用这一数据特征 二、实验报告: (1)、问题提出 随着社会的发展,教育的工资回报率问题被提上了日程。对于影响工资回报率的因素我们愈加关注。为了这一问题,我们利用所给数据(bothtwins data Excel文件)研究教育的工资回报率问题。同时考虑诸如遗漏变量和测量误差的模型内生性问题。 (2)、指标选择 根据分析问题的需要,依据指标数据可得性原则,我们选择经济含义明确并具有较好完整性和可比较性的数据(bothtwins data Excel文件)作为数据指标。Age:年龄;age2:年龄平方;Daded:父亲受教育年数;Momed:母亲受教育年数;Hrwage:工资时薪;lwage:时薪工资对数值;female:是否为女性; white:是否为白人;first:是否为家中长子;Educ:受教育年数(自报);Educ_t:双胞胎中另一个受教育年数(自报);Eductt:双胞胎中某个提供的另外一个的受教育年数(互报);Educt_t:此双胞胎的sibling提供的此双胞胎受教育年数(互报)。 (3)、数据来源 数据由老师提供。由于数据量过大,截取部分数据展示如下表1,具体数据参见附表1 表1 数据(bothtwins data Excel文件)(部分数据)

计量经济学实验报告(虚拟变量)

计量经济学实验报告 实验三:虚拟变量模型 姓名:上善若水 班级: 序号: 学号: 中国人均消费影响因素 一、理论基础及数据 1. 研究目的 本文在现代消费理论的基础,分析建立计量模型,通过对 1979—— 2008 年全国城镇居民的人均消费支出做时间序列分析和对2004— 2008年各地区(31 个省市)城镇居民的人均消费支出做面板数据分析,比较分析了人均可支配收入、消费者物价指数和银行一年期存款利率等变量对居民消费的不同影响。

2. 模型理论 西方消费经济学者们认为,收入是影响消费者消费的主要因素,消费是需求的函数。消费经济学有关收入与消费的关系,即消费函数理论有:( 1)凯恩斯的绝对收入理论。他认为消费主要取决于消费者的净收入,边际消费倾向小于平均消费倾向。他假定,人们的现期消费,取决于他们现期收入的绝对量。(2)杜森贝利的相对收入消费理论。他认为消费者会受自己过去的消费习惯以及周围消费水准来决定消费,从而消费是相对的决定的。当期消费主要决定于当期收入和过去的消费支出水平。(3)弗朗科?莫迪利安的生命周期的消费理论。这种理论把人生分为三个阶段:少年、壮年和老年;在少年与老年阶段,消费大于收入;在壮年阶段,收入大于消费,壮年阶段多余的收入用于偿还少年时期的债务或储蓄起来用来防老。( 4)弗里德曼的永久收入消费理论。他认为消费者的消费支出主要不是由他的现期收入来决定,而是由他的永久收入来决定的。这些理论都强调了收入对消费的影响。除此之外,还有其他一些因素也会对消费行为产生影响。(1)利率。传统的看法认为,提高利率会刺激储蓄,从而减少消费。当然现代经济学家也有不同意见,他们认为利率对储蓄的影响要视其对储蓄的替代效应和收入效应而定,具体问题具体分析。( 2)价格指数。价格的变动可以使得实际收入发生变化,从而改变消费。 基于上述这些经济理论,我找到中国 1979-2008 年全国城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数和 2004— 2008年各地区城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数、以及银行一年期存款利率的官方数据。想借此来分析中国消费的影响因素以及它们具体是如何对消费产生影响的。针对这一模型,有以下两个假定。一,自改革开放以来,我国人均消费倾向呈现缓慢的递减趋势,即保持粘性。这一假定符合我国居民的储蓄——消费心理,也与其他一些发展中国家的情况大体一致。二,由储蓄和消费的替代关系,可以假定刺激储蓄的因素,会制约消费。我们知道提高利率会刺激储蓄,因而我把利率也引入模型的分析中。 以下对我所找的数据作一一说明 : 1、城镇居民人均消费水平。借此来代表城镇居民的消费支出情况,这是将要建立计量经济学模型的被解释变量。由下图可以看到消费是逐年增加的,与此同时,人均可支配收入也是逐年增加,隐含着两者可能有很高的线性相关性这层意思。

计量经济学实验7虚拟变量模型

实验七虚拟变量 【实验目的】 掌握虚拟变量的设置方法。 【实验内容】 一、试根据表7-1的1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料建立我国城镇居民彩电需求函数; 资料来源:据《中国统计年鉴1999》整理计算得到 二、试建立我国税收预测模型(数据见实验一); 三、试根据表7-2的资料用混合样本数据建立我国城镇居民消费函数。

最低收入户 2397.6 2476.75 0 2523.1 2617.8 1 低收入户 2979.27 3303.17 0 3137.34 3492.27 1 中等偏下户 3503.24 4107.26 0 3694.46 4363.78 1 中等收入户 4179.64 5118.99 0 4432.48 5512.12 1 中等偏上户 4980.88 6370.59 0 5347.09 6904.96 1 高收入户 6003.21 7877.69 0 6443.33 8631.94 1 最高收入户 7593.95 10962.16 8262.42 12083.79 1 资料来源:据《中国统计年鉴》1999-2000整理计算得到 【实验步骤】 一、我国城镇居民彩电需求函数 ⒈相关图分析; 键入命令:SCAT X Y ,则人均收入与彩电拥有量的相关图如7-1所示。 从相关图可以看出,前3个样本点(即低收入家庭)与后5个样本点(中、高收入)的拥有量存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下: ?? ?=低收入家庭 中、高收入家庭 1D 图7-1 我国城镇居民人均收入与彩电拥有量相关图 ⒉构造虚拟变量; 方式1:使用DATA 命令直接输入;

第七章_虚拟变量

虚拟变量(dummy variable ) 在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因素也应该包括在模型中。 由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量,用D 表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。 1.截距移动 设有模型, y t = β0 + β1 x t + β2D + u t , 其中y t ,x t 为定量变量;D 为定性变量。当D = 0 或1时,上述模型可表达为, β0 + β1x t + u t , (D = 0) y t = (β0 + β2) + β1x t + u t , (D = 1) 20 40 60 20 40 60X Y 图8.1 测量截距不同 D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。 例:中国成年人体重y (kg )与身高x (cm )的回归关系如下: –105 + x D = 1 (男) y = - 100 + x - 5D = – 100 + x D = 0 (女) 注意: ① 若定性变量含有m 个类别,应引入m -1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap )。 ② 关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。 ③ 定性变量中取值为0所对应的类别称作基础类别(base category )。 ④ 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如: 1 (大学) D = 0 (中学) -1 (小学)。 β0 β0+β2 D = 1 D =0

回归分析报告实验课实验8

实验报告八实验课程:回归分析实验课 专业:统计学 年级: : 学号: 指导教师: 完成时间: 得分:

教师评语: 学生收获与思考:

实验八 含定性变量的回归模型(4学时) 一、实验目的 1.掌握含定性变量的回归模型的建模步骤 3.运用SAS计算含定性变量的各种回归模型的各参数估计及相关检验统计量 二、实验理论与方法 在实际问题的研究中,经常会遇到一些非数量型的变量。如品质变量;性别;战争与和平。我们把这些品质变量也称为定性变量,在建立回归模型的时候我们需要考虑到这些定性变量。定性变量的回归模型分为自变量含定性变量的回归模型和因变量是定性变量的回归模型。 自变量含有定性变量的时候,我们一般引进虚拟变量,将这些定性变量数量化。例如研究粮食产量问题,y为粮食产量,x为施肥量,另外考虑气候问题,分为正常年份和干旱年份两种情况,这个问题数量化方法就是引入一个0-1型变量D,令D i=1 表示正常年份,D i=0表示干旱年份, 粮食产量的回归模型为:y i =β +β 1 x i +β 2 D i +ε i。 因变量是定性变量时,一般用logistic回归模型(分组数据的logistic回归模型,未分组数据的logistic回归模型,多类别的logistic回归模型),probit回归模型等。 三. 实验容 1.用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集xt103,建立y对公司规模和公司类型的回归,并对所得到的模型进行解释。 2.研制一种新型玻璃,对其做耐冲实验。用一个小球从不同的高度h对玻璃做自由落体撞击,玻璃破碎记为y=1,玻璃未破碎记y=0.数据见表22.是对表中数据建立玻璃耐冲性对高度h的logistic回归,并解释回归方程的含义。 3.某学校对本科毕业生的去向做了一个调查,分析影响毕业去向的相关因素,结果见表23.其中毕业去向“1”=工作,“2”=读研,“3”=出国留学。性别“1”=男生,“0”=女生。用多类别的Logisitic回归分析影响毕业去向的因素。 四.实验仪器 计算机和SAS软件 五.实验步骤和结果分析 1.用DATA步建立一个永久SAS数据集,数据集名为xt103,数据见表21;对数据集xt103,建立y对公司规模和公司类型的回归,并对所得到的模型进行解释。

第五讲 虚拟变量模型

第七讲 经典单方程计量经济学模型:专门问题 虚拟变量模型 学习目标: 教学基本内容 虚拟变量 许多经济变量是可以定量度量,例如:商品需求量、价格、收入、产量等; 但有一些影响经济变量的因素是无法定量度量。 例如:职业、性别对收入的影响, 战争、自然灾害对 GDP 勺影响,季节对某些产品(如冷饮)销售的影响等。 定性变量:把职业、性别这样无法定量度量的变量称为定性变量。 定量变量:把价格、 收入、 销售额这样可以可以定量度量的变量称为定量变 量。 为了能够在模型中能够反映这些因素的影响, 型的功能,需要将它们“量化”。 这种“量化” 来完成的。 根据这些因素的属性类型, 构造只取 称为虚拟变量( dummy variables ) ,记为 D 。 例如:反映性别的虚拟变量 D 1;男 0;女 1; 本科学历 反映文化程度的虚拟变量 D 0;1非;本本科科学学历历 一般地,基础类型和肯定类型取值为 1;比较类型和否定类型取值为 0。 二、 虚拟变量的设置原则 设置原则: 每一定性变量(qualitative variable )所需的虚拟变量个数要比该定性变量的状 态类别数(categories 少1。即如果有m 种状态,只在模型中引入m-1个虚拟变量。 例如,冷饮的销售量会受到季节变化的影响。季节定性变量有春、夏、秋、 冬 4 种状态,只需要设置 3 个虚拟变量: 1. 2. 3. 4. 了解什么是虚拟变量以及什么是虚拟变量模型; 理解虚拟变量的设置原则; 掌握虚拟变量模型的两种基本引入方式(加法方式和乘法方式) 能够自行设计虚拟变量模型,并能够解释其中蕴含的经济意义; 提高模型的精度, 拓展回归模 通常是通过引入“虚拟变量” 0”或“1”的人工变量, 通常 虚拟变量只作为解释变量。

用加法乘法方式引入虚拟变量 阿尔蒙多项式法估计有限分布滞后模型

《计量经济学》上机指导手册三 目录 §3.1 实验介绍 (2) 3.1.1 上机实验名称 (2) 3.1.2 实验目的 (2) 3.1.3 实验要求 (2) 3.1.4 数据资料 (2) §3.2 用加法和乘法加入虚拟变量 (3) 3.2.1 用加法方式引入虚拟变量 (3) 3.2.2 用乘法方式引入虚拟变量 (5) §3.3 阿尔蒙多项式法估计有限分布滞后模型 (7) 3.3.1 参数估计(方法一) (7) 3.3.2 参数估计(方法二) (8) 3.3.3 还原模型 (9) §3.4 Granger因果检验............................................................................. 错误!未定义书签。 3.4.1 序列平稳性检验及调整........................................................... 错误!未定义书签。 3.4.2 Granger因果检验...................................................................... 错误!未定义书签。

§3.1 实验介绍 3.1.1 上机实验名称 用加法和乘法引入虚拟变量 阿尔蒙多项式估计有限分布滞后模型 Granger因果检验 3.1.2 实验目的 通过对用加法和乘法引入虚拟变量、阿尔蒙多项式估计有限分布滞后模型、Granger因果检验的练习,掌握经典单方程模型中一些专门问题的理解及软件操作。 3.1.3 实验要求 根据实验数据,完成实验报告。对于已经完成的工作,请自我测评。将完成要求的标题标成蓝色,未完成的标成红色。例如: 3.1.4 数据资料 (1)《14-15-1 EViews上机数据 3.xls》中《Dummy Variable》 (2)《14-15-1 EViews上机数据 3.xls》中《Almon》 (3)《14-15-1 EViews上机数据 3.xls》中《Granger Test》

第七章 虚拟变量和随机解释变量 (2)

第七章 虚拟变量和随机解释变量 本章将讨论两种不同的模型:虚拟变量模型和随机解释变量模型,以及模型设定的其它问题。 第一节 虚拟变量模型 在我们以前考虑的模型中,解释变量都是定量变量(如成本、价格、收入、产出等),但在经济研究中,因变量经常受到一些定性变量的影响(如性别、种族、季节、不同历史时期等),我们把这类定性变量称为虚拟变量。习惯上用D表示虚拟变量,虚拟变量的取值通常为0和1。0表示变量具备某种属性,1表示变量不具备某种属性。 一、包含一个虚拟变量的模型 如果我们要研究的问题中解释变量只分为两类。则需引入一个模拟变量。 例9.1建立模型研究中国妇女在工作中是否受到歧视。 令Y=年薪,X=工作年限 ? ? ?=,女性,男性 101D 可以建立如下模型: i i i i u D B X B B Y +++=210 )1.9( 与一般的回归模型一样,假定0)(=i u E 男性就业者的平均年薪: i i i i X B B D X Y E 10)0,(+== )2.9( 女性就业者的平均年薪: 210)1,(B X B B D X Y E i i i i ++== )3.9( 如果B 2=0则说明不存在性别歧视,如果02

如果随着工龄增加,男性与女性的年薪差距也发生变化,则模型(9.1)就变为 i i i i i u X D B X B B Y +++=210 )4.9( 图9.2描绘了男性年薪增加较快的情况。 我们称虚拟变量只影响斜率而不影响截距的模型为乘法模型如(9.4) 如果男性与女性的初始年薪和年薪增加速度都有差异,我们可以将加法模型和乘法模型 结合起来,得到如下模型 i i i i i i u D B X D B X B B Y ++++=3210 )5.9( 模型(9.5)可以用来表示截距和斜率都发生变化的模型。其图形如图9.3所示。 我们还可以用加法模型与乘法模型相结合的方式建立模型来拟合经济发展出现转折的 情况。例如,进口商品消费支出Y主要取决于国民生产总值X(作为收入的替代变量)的多少。我们改革开放前后,由于国家政策的变化,及改革开放后外资的大量引入等因素的影响,1978年前后,Y 对X 的回归关系明显不同。以t *=1978年为转折点,1978年的国民生产总值X *t 为临界值。设虚拟变量

计量经济学实验项目与主要内容

《计量经济学》实验项目与主要内容 目录 实验1—— 【实验目的】 了解Eviews软件的基本操作对象,掌握基本操作方法。 【实验内容】 1A-1 Eviews软件的安装与启动 1A-2 工作文件的建立 1A-3数据的输入、编辑与生成 1A-4观察数据的基本特征 1A-5一元回归模型的估计、检验及预测 【实验步骤】 1B-1 观看“”,模仿其中的操作。(点击超链接即可) 1B-2 根据下文示范步骤,完成操作 1B-3 独立完成指定两个实验课题

1B-1 Eviews软件的入门基本操作 观看“”,模仿其中的操作。(点击超链接即可)。 1B-2 根据下文示范步骤,完成操作 例:四川省城市居民1978-1998年家庭人均生活性消费支出Y与人均可支配收入X 的 建立文件: Eviews的操作在工作文件中进行,故首先要有工作文件,然后进行数据输入、分析等等操作。主要有如下几种方法: 【1】操作命令法:create 数据类型样本区间 【2】新建文件:File/New/Workfile,出现对话框“工作文件范围”,选取或填上数据类型、起止时间。OK后,得到一个无名字的工作文件,其中有: 时间范围、当前工作文件样本范围、filter 、默认方程、系数向量C、序列RESID。【3】读已存在文件:File/Open/Workfile。 (1)操作命令法:create a 1978 1998(回车,即完成,见下图所示) (2)菜单操作法:file\new\workfile(单击)\再弹出的对话框中点选“数据类

型”、输入“样本区间”\点击“OK” 输入样本数据 主要有如下几种方法: 【1】从键盘输入:Quick/Empty Group (Edit Series),打开组窗口,产生一个untitled“Group”;按列在表中输入序列名(在OBS)及其数据,每输入一个数 据完,敲一次enter。 【2】从Excel复制数据:先取定Excel中的数据区域,选“复制”;其次,打开Eview,同,建工作文件,使样本区域包含与被复制数据同样多的观察值个数;第三,击 Quick/Empty Group (Edit series);第四,按向上滚动指针,击数据区OBS右边 的单元格,点Edit/Paste,再退出,选No,于是,在工作文件中有被复制的数据 序列的图标。 【3】从Excel复制部分数据到已存在的序列中:取定要复制的数据,复制之;打开包含已存在序列的Group窗口,使之处于Edit模式(开关键是Edit+);将光标指 到目标单元格,点Edit/Paste, (1) 命令操作法:data x y(回车,即完成,见下图所示) 在弹出的对话框中输入各个样本数据有三种方法 ①直接输入: ②若样本数据以表格形式给出,可直接复制——粘贴; ③若样本数据以表格(excel)或文本文件(txt.)格式给出,可直接导入。 ★若样本数据以表格(excel)格式给出, 文件名为sichuan, 保存在“实验”文件夹中,数据导入操作如下: (关闭文件sichuan),点击file\import\read text-lotus\excel

计量经济学实验报告 虚拟变量

实验三:虚拟变量模型一、研究的目的与要求 根据下表2009年我国城镇居民人均收入与住房方面消费性支出的统计资料建立我国城镇居民住房方面消费性支出函数。 二、模型设立 1、问题描述:2009年我国城镇居民人均收入对住房方面消费性支出的影响。 2、数据: 我国城镇居民家庭抽样调查资料 平均每人全部年 项目住房 D 收入 (元) 困难户60.83 4935.81 0 最低收入户84.73 5950.68 0 低收入户123.92 8956.81 0 中等偏下户178.48 12345.17 0 中等收入户261.37 16858.36 0 中等偏上户526.36 23050.76 1 高收入户659.61 31171.69 1 最高收入户1482.11 51349.57 1 三、相关图分析; 1. 键入命令:SCAT X Y,则人均收入与住房方面消费性支出的相关散点图如下图所示。 从相关图可以看出,前5个样本点(即中低收入家庭)与后3个样本点(中、

高收入)的消费性支出存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下: 2. 构造虚拟变量。 使用SMPL和GENR命令直接定义。 DATA D1 GENR XD=X*D1 3. 估计虚拟变量模型: 再由t检验值判断虚拟变量的引入方式,并写出各类家庭的消费性支出函数。虚拟变量模型的估计结果如下: Dependent Variable: Y Method: Least Squares Date: 01/03/12 Time: 15:25 Sample: 2001 2008 Included observations: 8 Variable Coefficient Std. Error t-Statistic Prob.?? X 0.016400 0.005743 2.855676 0.0461 D1 -327.1185 118.4766 -2.777039 0.0498 XD 0.018709 0.006356 2.943588 0.0422 C -19.00288 61.67034 -0.308136 0.7734 R-squared 0.992173 ????Mean dependent var 422.1763 Adjusted R-squared 0.986303 ????S.D. dependent var 479.4838 S.E. of regression 56.11683 ????Akaike info criterion 11.19960 Sum squared resid 12596.40 ????Schwarz criterion 11.23932 Log likelihood -40.79841 ????F-statistic 169.0152 Durbin-Watson stat 3.162055 ????Prob(F-statistic) 0.000115 我国城镇居民住房方面消费性支出函数的估计结果为: t (-0.308136) ( 2.855676) (-2.777039) (2.943588) 2 R=0.9921732 R=0.986303 F=169.0152 S.E=56.11683 虚拟变量的回归系数的t检验都是显着的,且模型的拟合优度很高,说明我

第八章 虚拟变量回归 思考题

第八章 虚拟变量回归 思考题 8.1 什么是虚拟变量 ? 它在模型中有什么作用 ? 8.2 虚拟变量为何只选 0 、 1, 选 2 、 3 、 4 行吗 ? 为什么 ? 8.3 对 (8.10) 式的模型 , 如果选择一个虚拟变量 1,01D ?? =??-? 大专及大专以上,高中,高中以下 这样的设置方式隐含了什么假定 ? 这一假定合理吗 ? 8.4 引入虚拟解释变量的两种基本方式是什么 ? 它们各适用于什么情况 ? 8.5 四种加法方式引入虚拟变量会产生什么效应? 8.6 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些 ? 8.7 设服装消费函数为 12233t i i i i Y D D X u αααβ=++++ 其中,i X =收入水平 ;Y = 年服装消费支出 ; 1,30D ?=? ?大专及大学以上 ,其他 ;1,20D ?=??女性,其他 试写出不同人群组的服装消费函数模型。 8.8 利用月度数据资料 ,为了检验下面的假设,应引入多少个虚拟解释变量 ? 1) 一年里的 12 个月全部表现出季节模式 ; 2) 只有 2 月、 6 月、 8 月、 10 月和 12 月表现出季节模式。 练习题 8.1 1971 年 ,Sen 和 Sztvastava 在研究贫富国之间期望寿命的差异时 , 利用 101 个国家的数据 , 建立了如下回归模型 []? 2.409.39ln 3.36(ln 7)i i i i Y X D X =-+-- (4.37)(0.857)(2.42) R2=0.752 其中 ,X 是以美元计的人均收入 ;Y 是以年计的期望寿命 ; Sen 和 Srimstava 认为人均收入的临界值为 1097 美元 (ln1097=7), 若人均收入超过 1097 美元 , 则被认定为富国 ; 若人均收入低于1097美元 , 被认定为贫穷国。括号内的数值为对应参数估计值的t 值。 1) 解释这些计算结果。 2) 回归方程中引入(ln 7)i i D X =-的原因是什么?如何解释这个回归解释变量? 3) 如何对贫穷国进行回归 ? 又如何对富国进行回归 ? 4)这个回归结果中可得到的一般结论是什么 ?

相关主题