搜档网
当前位置:搜档网 › 第三章 多元线性回归模型案例及作业汇总

第三章 多元线性回归模型案例及作业汇总

第三章 多元线性回归模型案例及作业汇总
第三章 多元线性回归模型案例及作业汇总

1. 表1列出了中国2000年按行业分的全部制造业国有企业及规模以上制造业非国有企业的工业总产值Y ,资产合计K 及职工人数L 。

序号 工业总产值Y/亿元

资产合计K/亿元

职工人数L/万人

序号 工业总产值Y/亿元

资产合计K/亿元

职工人数L/万人

1 3722.700 3078.220 113.0000 17 812.7000 1118.810 43.00000

2 1442.520 1684.430 67.00000 18 1899.700 2052.160 61.00000

3 1752.370 2742.770 84.00000 19 3692.850 6113.110 240.0000

4 1451.290 1973.820 27.00000 20 4732.900 9228.250 222.0000

5 5149.300 5917.010 327.0000 21 2180.230 2866.650 80.00000

6 2291.160 1758.770 120.0000 22 2539.760 2545.630 96.00000

7 1345.170 939.1000 58.00000 23 3046.950 4787.900 222.0000

8 656.7700 694.9400 31.00000 24 2192.630 3255.290 163.0000

9 370.1800 363.4800 16.00000 25 5364.830 8129.680 244.0000 10 1590.360 2511.990 66.00000 26 4834.680 5260.200 145.0000 11 616.7100 973.7300 58.00000 27 7549.580 7518.790 138.0000 12 617.9400 516.0100 28.00000 28 867.9100 984.5200 46.00000 13 4429.190 3785.910 61.00000 29 4611.390 18626.94 218.0000 14 5749.020 8688.030 254.0000 30 170.3000 610.9100 19.00000 15 1781.370 2798.900 83.00000 31

325.5300 1523.190 45.00000

16

1243.070 1808.440 33.00000

设定模型为:Y AK L e α

βμ

=

(1) 利用上述资料,进行回归分析;

(2) 回答:中国2000年的制造业总体呈现规模报酬不变状态吗? 将模型进行双对数变换如下:

ln ln ln ln Y A K L αβμ=+++

1)进行回归分析:

得到如下回归结果:

于是,样本回归方程为:

?

Y K L

=++

ln 1.1540.609ln0.361ln

(1.59) (3.45) (1.79)

20.8099,0.7963,59.66

===

R R F

从回归结果可以看出,模型的拟合度较好,在显著性水平0.1的条件下,各项系数均通过了t检验。从F检验可以看出,方程对Y的解释程度较少。

R=表明,工业总产值对数值的79.6%的变化可以由资产合计对数与职工

0.7963

的对数值的变化来解释,但仍有20.4%的变化是由其他因素的变化影响的。

从上述回归结果看,??0.971α

β+=≈,即资产与劳动的产出弹性之和近似为1,表明中国制造业在2000年基本呈现规模报酬不变的状态。

2. 表

3.3列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。

年份 Y/千

X/

元 P 1/(元/千克)

P 2/(元/千克)

P 3/(元/千克)

年份 Y/千克 X/元 P 1/(元/

千克) P 2/(元/

千克)

P 3/(元/千克)

1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258

6.64 14.10 22.16 1990 4.04 768 3.86

7.32 10.61 2002 5.29 2478

7.04

16.82

23.26

1991 4.03 843

3.98

6.78

10.48

(1) 求出该地区关于家庭鸡肉消费需求的如下模型:

01213243ln ln ln ln ln Y X P P P u βββββ=+++++

(2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。

先做回归分析,过程如下:

输出结果如下:

所以,回归方程为:

123ln 0.73150.3463ln 0.5021ln 0.1469ln 0.0872ln Y X P P P =-+-++

(-2.463) (4.182) (-4.569) (1.483) (0.873)

由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,

而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显著。

验证猪肉价格和鸡肉价格是否有影响,可以通过赤池准则(AIC )和施瓦茨准则

(SC)。若AIC值或SC值减少了,就应该去掉该解释变量。

去掉猪肉价格P2与牛肉价格P3重新进行回归分析,结果如下:

Variable Coefficient Std. Error t-Statistic Prob.

C -1.125797 0.088420 -12.73237 0.0000

LOG(X) 0.451547 0.024554 18.38966 0.0000

LOG(P1) -0.372735 0.063104 -5.906668 0.0000

R-squared 0.980287 Mean dependent var 1.361301

Adjusted R-squared 0.978316 S.D. dependent var 0.187659

S.E. of regression 0.027634 Akaike info criterion -4.218445

Sum squared resid 0.015273 Schwarz criterion -4.070337

Log likelihood 51.51212 F-statistic 497.2843

Durbin-Watson stat 1.877706 Prob(F-statistic) 0.000000

通过比较可以看出,AIC值和SC值都变小了,所以应该去掉猪肉价格P2与牛肉价格P3这两个解释变量。所以该地区猪肉与牛肉价格确实对家庭的鸡肉消费不产生显著影响。

3、某硫酸厂生产的硫酸的透明度指标一直达不到优质要求,经分析透明度低与

硫酸中金属杂质的含量太高有关。影响透明度的主要金属杂质是铁、钙、铅、镁等。通过正交试验的方法发现铁是影响硫酸透明度的最主要原因。

测量了47组样本值,数据见表3.4。

表3.4 硫酸透明度y与铁杂质含量x数据

序数X Y 序数X Y

1 31 190 25 60 50

2 32 190 26 60 41

3 3

4 180 27 61 52

4 3

5 140 28 63 34

5 3

6 150 29 64 40

6 3

7 120 30 65 25

7 39 110 31 69 30

8 40 81 32 74 20

9 42 100 33 74 40

10 42 80 34 76 25

11 43 110 35 79 30

12 43 80 36 85 25

13 48 68 37 87 16

14 49 80 38 89 16

15 50 50 39 99 20

16 52 70 40 76 20

17 52 50 41 100 20

18 53 60 42 100 20

19 54 44 43 110 15

20 54 54 44 110 15

21 56 48 45 122 27

22 56 50 46 154 20

23 58 56 47 210 20

24 58 52

硫酸透明度y与铁杂质含量的散点图如下

所以应该建立非线性回归模型。

1.通过线性化的方式估计非线性模型。

(1)建立倒数模型,在Equation Specification(方程设定)框中输入

得到输出结果为

所以倒数表达式为:

=-

y x

1/0.069 2.37(1/)

(18.57) (-11.95)

20.76,143, 1.095

===

R F DW

(2)建立指数函数

方程设定为:

得到输出结果为:

所以指数表达式为:

=+

y x

ln 1.99104.5(1/)

(22) (21.6)

20.91,468.38, 1.71

R F DW

===

把表达式还原为指数形式:

ln ln(7.33)104.5(1/)

y x

=+即

1

104.5()

7.33x y e

=

可决系数也由0.76提高到0.91,可见拟合为指数函数比倒数函数更好。

2.直接估计非线性回归模型

直接估计的方程设定如下图所示:

得到输出结果为:

对应的非线性估计结果是:

1

100.1()

=

y e

8.2965x

R=

(11) (29.4) 20.96

可见可决系数由0.91提高到0.96,则直接估计结果比线性化之后估计更好。

相关主题