搜档网
当前位置:搜档网 › 古扎拉蒂计量经济学第四版讲义Ch9 Model Specification

古扎拉蒂计量经济学第四版讲义Ch9 Model Specification

古扎拉蒂计量经济学第四版讲义Ch9 Model Specification
古扎拉蒂计量经济学第四版讲义Ch9 Model Specification

第九章模型设定

Model Specification and Diagnostic Testing

1. Introduction

假如模型没有被正确设定,我们会遇到model specification error或model specification bias 问题。本章主要回答这些问题:

1、选择模型的标准是什么?

2、什么样的模型设定误差会经常遇到?

3、模型设定误差的后果是什么?

4、有那些诊断工具来发现模型设定误差?

5、如果诊断有设定误差,如何校正,有何益处?

6、怎样评估相互竞争模型的表现(model evaluation)?

Model Selection Criteria

这是笼统的模型选择标准:

1、利用该模型进行预测在逻辑上是可能的;

2、模型的参数具有稳定性,否则,预测就很困难。弗里德曼说:模型有效性的唯一检验标准就是比较模型的预测是否与经验一致。

3、模型要与经济理论一致。

4、解释变量必须与误差项不相关。

5、模型的残差必须是白噪声;否则就存在模型设定误差。

6、最后选择的模型应该涵盖其它可能的竞争模型;也就是说,其他模型不应该比所选模型的表现更好。

Types of specification errors

大概有这几种设定误差:

设定误差之一:所选模型忽略了重要的解释变量(该解释变量被包含在模型误差中)

设定误差之二:所选模型包含了不必要或不相关的解释变量

设定误差之三:所选模型具有错误的方程形式(比如y采用了不该采用的对数转换)

设定误差之四:被解释变量and/or解释变量测量偏差(所用数据相对于真实值有偏差)导致的误差(commit the errors of measurement bias)

设定误差之五:随机误差项进入模型的形式不对引起的误差(比如是multiplicatively还是additively)

The assumption of the CLRM that the econometric model is correctly specified has two meanings. One, there are no equation specification errors, and two, there are no model specification errors.

上面概括的五种设定误差称为equation specification errors。

Model model specification errors就是Model mis-specification errors,指的是同一个问题用不

同模型导致的误差,如货币主义和凯恩斯主义对GDP 改变的不同解释不同模型。

2. Consequences of model specification errors (the former two types)

这里介绍的是前两类设定误差的结果:1)underfitting a model ;2)overfitting a model 。这里以三变量回归为例。

Underfitting a model (Omitting a relevant variable)

Suppose the true model is

12233i i i i y x x βββε=+++ 13.3.1 估计量为b1和b2

But for some reason we fit the following model:

122i i i y x v αα=++ 13.3.1 估计量为a1和a2

省略x3的后果如下:

1、假如x2和x3是相关的,即230r ≠,那么a1和a2都是有偏的和不一致的,即()11E a β≠和()22E a β≠,在大样本的情况下,这种偏差也不消失。

2、即使x2和x3不相关,a1还是有偏的,虽然a2现在无偏了。

3、误差项方差2

σ被不正确地估计。

4、传统计算的a2的方差是真实估计量b2的方差的有偏估计量。

5、结果,通常的估计参数的置信区间和假设检验变得不可靠。

6、另一个结果,基于不正确模型的预测和预测区间也不可靠。

一个建议:假如模型是基于相应的经济理论而构建,建议不要擅自删除该理论所要求的变量。

对后果1和2的说明: ()22332E a b ββ=+ 13.3.3

其中32b 是x3对x2回归的斜率系数。

该公式显示,除非332b β中一个等于0或都等于0,否则a2就是有偏的;如果332b β>0,就是a2 overestimate 2β,这是positive bias 。

对后果3的说明:

The estimate of 2σ is 2

/RSS df σ=. 由于真实模型和估计模型的RSS 和df 不同,所以两个模型的方差估计量也不同。RSS 和df 同方向变化,就看哪个变换更快了。

对后果4的说明:

()()2222var i a x x σ=?∑ 13.3.4

()()()()2

2

2222

2232var 1i i b VIF x x r x x σσ==???∑∑

13.3.5 我们知道()2var b 是无偏的,由于()2var a 不同于()2var b ,所以()2var a 是有偏的。 由于0<2

23r <1,所以()2var a <()2var b 。 这里就遇到一个两难:虽然a2是有偏的,但是其方差却小于无偏估计量b2的方差,所以这里有一个tradeoff 。

Overfitting a model (Inclusion of an irrelevant variable)

Suppose the true model is

122i i i y x ββε=++ 13.3.6 估计量为b1和b2

But for some reason we fit the following model:

12233i i i i y x a x v αα=+++ 13.3.7 估计量为a1和a2

这种设定误差的后果是:

1、不正确模型参数的OLS 估计量都是无偏和一致的。

()()()112233,,0E a E a E a βββ====

证明见附录13A.2,略了,因为不是普遍的矩阵形式,所以整理下来没有意义。

2、误差方差2

σ被正确估计。

3、通常的置信区间和假设检验仍旧有效。

4、但是,系数a 不再有效,即错误模型系数a 的方差大于真实模型b 的方差。

对后果4的说明: ()()2222var i b x x σ=

?∑ 13.3.8 ()()()2222223var 1i a x x r σ=

??∑ 13.3.9

所以 ()()()

22223var 1var 1a b r =? 13.3.10

既然2

2301r ≤≤,所以()()22var var a b ≥。 系数a1同理。

3. Tests of specification errors (the former three types)

Detecting the presence of unnecessary variables

诊断模型中是否包含了不必要的变量并不困难。比如可以对某个变量进行偏t 统计量的显著性检验,或者对某一组变量进行F 统计量检验。

上述的思路实际就是:先有经济理论,再据理论设定模型,最后检验模型中的变量是否真正相关,也就是说最后检验这个理论。这称为purist approach 。

Purist approach and data mining

完全根据变量的统计显著性来决定某变量是否加入或剔出该模型的方法称作数据挖掘,是与纯粹主义方法相对立的。

Tests for omitted variables and incorrect functional form

Examination of residuals

前面已述残差可以对异方差和自相关进行visual diagnostic ,同样残差也可以用来诊断模型设定误差,比如忽略了重要变量,比如采用了不正确的方程形式,特别是在横截面数据的情况下。

以成本-产出方程y 和x 的线性模型、二次方模型和三次方模型为例,而且假定三次方模型是真实模型,可以发现从左到右残差越来越小也依赖于平坦。

这里绘制的残差图:y 轴残差;x 轴是解释变量x 。

The Dubin-Watson d statistic

首先也以成本-产出方程y 和x 的线性模型、二次方模型和三次方模型为例,而且假定三次方模型是真实模型,得到的DW 值依次为0.716, 1,038, 2.70,判断的结果是线性模型存在一价正自相关,二次方模型不决定,但是根据modified d test ,也存在正相关,三次方模型无自相关。作者认为在线性和二次方模型中观察到的正相关不是对自相关的测量而是对模型设定误差的测量。

给出利用DW 检验诊断模型设定误差的流程:

To use the Durbin-Watson test for detecting model specification errors, we proceed as follows:

1. From the assumed model, obtain the OLS residuals.

2. If it is believed that the assumed model is mis-specified because it excludes a relevant

explanatory variable, say, Z from the model, order the residuals obtained in step 1 according to increasing values of x. Note that the Z variable could be one of the x variables include in the assumed model or it could be some function of that variable such as x 2 or x 3.

3. Compute the d statistic from the residuals thus ordered by the usual d formula, namely,

()212

2

1n t t t n t t e e d e ?==?=∑∑ 12.6.5

4. From the Durbin-Watson tables, if the estimated d value is significant, then one can accept the hypothesis of model mis-specification. If that turns out to be the case, the remedial measures will naturally suggest themselves.

Ramsey’s RESET test

Ramsey has proposed a general test of specification error called RESET (regression specification error test).

Here we will illustrate only the simplest version of the test.

仍然以上面的成本-产出方程为例,首先假定其为线性模型

12i i i y x ααε=++ 13.4.6

首先绘制由此线性模型获得的残差图:y 轴残差;x 轴是y 的拟合值 y 。

The idea behind RESET:

Although i e ∑ and i i e y ∑ are necessarily zero, the residuals in this figure show a pattern in

which their mean changes systematically with

i y . This would suggest that if we introduce i y in some form as regressors in 13.4.6, it should increase R 2. And if the increase in R 2 is statistically significant (on the basis of the F test), it would suggest that the linear function 13.4.6 was mis-specified.

The steps of RESET test:

1. From the chosen model, e.g., 13.4.6, obtained the estimated i y .

2. Rerun 1

3.

4.6 introducing i y in some form as an additional regressor(s).

比如根据上述残差图,似乎残差和y 拟合值之间存在曲线关系,因此我们也许可以把 i y 的二次方和三次方引入方程作为解释变量

Thus, we run

23

1234i i i i i y x y y u ββββ=++++ 13.4.7

3. Let the R 2 obtained from 13.

4.7 be 2new R and that obtained from 13.4.6 be 2

old R . Then we can use the F test ()()()222

/1/new old new R R number of new regressors F R n number of parameters in the new model ?=?? 8.5.1

to find out if the increase in R 2 from 13.4.7 is statistically significant.

4. If the computed F value is significant, say, at the 5 percent level, one can accept the hypothesis that the model 13.4.6 is mis-specified .

RESET test 的优点就是容易实施,不需要设定替代的模型;但是优点也是其缺点,虽然知道模型设定错误,但是不能同时选择更好的替代模型。

Lagrange Multiplier (LM) test for adding variables

This is an alternative to Ramsey’s RESET test.

我们把成本-产出方程的线性模型作为三次方模型的restricted version 。The restricted regression assumes that the coefficients of the squared and cubed output terms are equal to zero.

LM test 流程如下:

1. Estimate the restricted regression, i.e., linear model, by OLS and obtain the residuals, i e .

2. If in fact the unrestricted regression, i.e., cubic model, is the true regression, the residuals obtained from step 1 should be related to the squared and cubed terms, that is, 2i x and 3

i x .

3. This suggests that we regress the i e obtained in step 1 on all the regressors (including those in the restricted regression), which in the present case means 231234i i i i i e x x x v αααα=++++ 1

4.4.11

where v is an error term with the usual properties.

4. For large-sample size, Engle has shown that n (the sample size) times the R 2 estimated from the (auxiliary) regression 13.4.11 follows the chi-square distribution with df equal to the number of restrictions imposed by the restricted regression, two in the present example since the term 2i x and 3i x are dropped from the model. Symbolically, we write

22number of restrictions asy

nR χ~ 13.4.12 5. If the chi-square value obtained from 13.4.12 exceeds the critical chi-square value at the chosen level of significance, we reject the restricted regression . Otherwise, we do not reject it.

5. Incorrect specification of the stochastic error term

一个常遇到的问题是模型误差项的设定,由于误差项不能直接观察到,所以不容易决定误差项进入模型的形式。

以下面一个简单的例子展开说明。

i i i y x βε= 13.2.8

i i i y x αε=+ 13.2.9

都假定没有截距项,假定ln i ε满足OLS 的所有假设。

假设模型13.2.8是真实的,但是估计的是13.2.9,会导致什么结果呢?

从附录13.A.4(略)可知,

如果()2ln 0,i N εσ~,那么

()

222/2,1i lognormal e e e σ

σσε ?

~ 13.6.1 作为结果: ()

2/2E e σαβ= 13.6.2 可见, α

是有偏的估计量,其期望不等于β。

7. Model Selection Criteria

In this section we discuss several criteria that have been used to choose among competing models and/or to compare models for forecasting purposes .

Here we distinguish between in-sample forecasting and out-of-sample forecasting. In-sample forecasting tells us how the chosen model fits the data in a given sample. Out-of-sample forecasting is concerned with determining how a fitted model forecasts future values of the regressand, given the values of the regressors.

Such criteria as (1) R 2, (2) adjusted R 2, (3) AIC, (4) SIC, (5) Mallow’s C p criterion and (6) forecast chi-square aim at minimizing the residual sum of squares RRS (or equivalently increasing the R 2 value). However, except for the first criterion, criteria (2), (3), (4), and (5) impose a penalty for including an increasing large number of regressors; thus, there is a tradeoff between goodness of fit of the model and its complexity (as judged by the number of regressors).

The R 2 Criterion

决定系数标准的缺陷:

1、决定系数测量的仅仅是in-sample goodness of fit in the given sample ,并不能保证模型forecast well out-of-sample observations 。

2、只有在被解释变量相同时才可以比较决定系数。

3、更重要的是,解释变量的增加肯定会相应增加决定系数值,因此,there is every temptation to play the game of “maximizing the R 2” by simply adding more variables to the model 。当然增加解释变量会增加决定系数,但是也可能增加the variance of forecast error 。所以为克服决定系数的这个毛病,下面的标准对增加解释变量也增加决定系数的毛病施加了penalty 。

Adjusted R 2

As a penalty for adding regressors to increase the R 2 value, Henry Theil developed the adjusted R 2.

()()2

/1/1RSS n K R TSS n ?=?? 13.9.2 可见,调整的决定系数小于决定系数,随着解释变量的增加,调整的决定系数会减小,这就是penalize for adding more regressors 。

所以与决定系数不同,只有在所增加解释变量的t 统计量的绝对值大于1的情况下,调整的决定系数才会增加,所以基于比较的目的,调整的决定系数好于决定系数标准;同样,比较调整的决定系数也要基于相同的被解释变量。

Akaike Information Criterion (AIC)

The idea of imposing a penalty for adding regressors to the model has been carried further in the AIC criterion, which is defined as

2/K n RSS AIC e n

= 13.9.3 注意这里K 是解释变量的个数(包括截距项),n 是观察值的个数。

2ln ln K RSS AIC n n =+

13.9.4 注意:一些教科书和软件直接定义AIC 为自然对数形式,这时13.9.4式的AIC 符号前就不要加ln 了。

这里()2/K n 称为惩罚因子(penalty factor )。As you see from this formula, AIC impose a harsher penalty than 2

R for adding more regressors.

In comparing two or more models, the model with the lowest value of AIC is preferred.

AIC 标准的用处和好处:

1. It is useful for not only in-sample but also out-of-sample forecasting performance of a regression model.

2. Also, it is useful for both nested and non-nested models.

3. It has been also used to determine the lag length in an AR(p) model.

Schwarz Information Criterion (SIC) Similar in spirit to the AIC, the SIC is defined as

/K n RSS SIC n n

= 13.9.5 or in log-form

ln ln ln K RSS SIC n n n =+

13.9.6 这里()/ln K n n 是惩罚因子(penalty factor )

,SIC imposes a harsher penalty than AIC, as is obvious from comparing 13.9.6 to 13.9.4。

Like AIC, the lower the value of SIC, the better the model.

Again, like AIC, SIC can be used to compare in-sample or out-of-sample forecasting performance of a model.

AIC 和SIC 的不同:AIC 适合于小样本;而SIC 具有大样本特性。

Mallows’s C p Criterion

假定有模型,包含K 解释变量(包括截距项),那么 ()2/K RSS n K σ=?,并且 ()

22E σσ=。 又假定只选择含p 个解释变量(p K ≤)的模型回归并获得p RSS (the residual sum of squares )。

C.P. Mallows has developed the following criterion for model selection, known as the C P criterion: ()22p p RSS C n p σ=

?? 13.9.7

Now if the model with p regressors is adequate, then ()

()2p E RSS n p σ=?. In consequence, it is true approximately that

()()()222p n p E C n p p σσ?≈??≈ 13.9.8

由此可知,我们将选择具有低的p C 值(大约等于p )的模型。

通常可以绘制:Mallow’s C p plot -y 轴p C ,x 轴p ;45度的p C -p 线。

我们将选择离p C -p 线最近的p C 值所对应的模型。

8. Influence Diagnostics

Types of outliers

OLS 方法在最小化RSS 时对于样本中的每一个观察值赋予了相同的权重,但是每一个观察值对于回归结果不一定有相同的影响,这是由于出现了三种类型的特殊数据点:1)outliers ;

2)leverage points ;3)influence points 。

In the regression context, an outlier may be defined as an observation with a “large residual”. When we say that a residual is large, it is in comparison with the other residuals and very often such a large residual catches our attention immediately because of its rather large vertical distance from the estimated regression line. Note that in a data set there may be more than one outlier.

A data point is said to exert (high) leverage if it is disproportionately distant from the bulk of the values of a regressor(s).

Why does a leverage point matter? It matters because it is capable of pulling the regression line toward itself, thus distorting the slope of the regression line. If this actually happens, then we call such a leverage point an influential point . The removal of such a data point from the sample can dramatically affect the regression line.

Detect and remedy outliers

如何处理异常值点,简单地去除之而专注于其他的点吗?Praper and Smith 说:自动去除异常值点不是明智的作法,有时候异常值点提供了其他点没有的额外信息,这些信息相当有价值值得进一步研究而不是简单地去除。只有仅仅引起errors of recording the observations or setting up the apparatus [in a physical experiment]的异常值可以直接去除,否则都要小心检查。

(陈诗一)

计量经济学-李子奈-计算题整理集合

计算分析题(共3小题,每题15分,共计45分) 1、下表给出了一含有3个实解释变量的模型的回归结果: 方差来源 平方和(SS ) 自由度(d.f.) 来自回归65965 — 来自残差— — 总离差(TSS) 66056 43 (1)求样本容量n 、RSS 、ESS 的自由度、RSS 的自由度 (2)求可决系数)37.0(-和调整的可决系数2 R (3)在5%的显著性水平下检验1X 、2X 和3X 总体上对Y 的影响的显著性 (已知0.05(3,40) 2.84F =) (4)根据以上信息能否确定1X 、2X 和3X 各自对Y 的贡献?为什么? 1、 (1)样本容量n=43+1=44 (1分) RSS=TSS-ESS=66056-65965=91 (1分) ESS 的自由度为: 3 (1分) RSS 的自由度为: d.f.=44-3-1=40 (1分) (2)R 2=ESS/TSS=65965/66056=0.9986 (1分) 2R =1-(1- R 2)(n-1)/(n-k-1)=1-0.0014?43/40=0.9985 (2分) (3)H 0:1230βββ=== (1分) F=/65965/39665.2/(1)91/40 ESS k RSS n k ==-- (2分) F >0.05(3,40) 2.84F = 拒绝原假设 (2分) 所以,1X 、2X 和3X 总体上对Y 的影响显著 (1分) (4)不能。 (1分) 因为仅通过上述信息,可初步判断X 1,X 2,X 3联合起来 对Y 有线性影响,三者的变化解释了Y 变化的约99.9%。但由于 无法知道回归X 1,X 2,X 3前参数的具体估计值,因此还无法 判断它们各自对Y 的影响有多大。 2、以某地区22年的年度数据估计了如下工业就业模型 i i i i i X X X Y μββββ++++=3322110ln ln ln 回归方程如下: i i i i X X X Y 321ln 62.0ln 25.0ln 51.089.3?+-+-= (-0.56)(2.3) (-1.7) (5.8) 2 0.996R = 147.3=DW 式中,Y 为总就业量;X 1为总收入;X 2为平均月工资率;X 3为地方政府的

古扎拉蒂计量经济学英文第四版课后习题数据

古扎拉蒂《计量经济学》(英文第四版)课后习题数据Yen-Dollar Yen/Dollar Exchange Rate, January 1971 to December 1998 Ex = Yen/$ Time: 1 = January 1971 336 = December 1998 TIME E X 1 358.02 2 357.55 3 357.52 4 357.5 5 357.41 6 357.41 7 357.4 8 355.78 9 338.02 10 331.11 11 328.75 12 320.07 13 312.72 14 305.19 15 302.54 16 303.56 17 304.38 18 302.41 19 301.03 20 301.16 21 301.12 22 301.01 23 300.99 24 301.24 25 301.79 26 278.42 27 261.9 28 265.49

30 264.5 31 264.55 32 265.22 33 265.47 34 266.33 35 278.26 36 280.18 37 298.13 38 291.09 39 282.16 40 277.77 41 278.97 42 282.97 43 290.98 44 302.28 45 299.08 46 299.36 47 300.08 48 300.41 49 299.68 50 291.66 51 287.95 52 292.2 53 291.43 54 293.47 55 296.37 56 297.98 57 299.91 58 302.34 59 302.55 60 305.67 61 304.64 62 301.59 63 300.52 64 299.11 65 299 66 299.19 67 294.64 68 290.63 69 287.36 70 291.19 71 295.17 72 294.7

古扎拉蒂-经济计量学习题标准答案

部分作业答案:(各题只要回答到如下程度就是满分哦) 第1章 概论 一、填空 1。 近似,散点; 2. 平均值,平均值 第2章 线性回归的基础理论 一、填空 1. 因变量Y ,解释变量X 二、单项选择题 1-2 AB 三、名词解释 总体:实验所有可能结果的集合称为总体或样本空间. 样本:也叫样本点,是指总体的某个元素或某种结果。 随机实验:至少有两个可能的结果,但不确定哪一个结果会出现的某个观察或测度过程. 估计量:是指总体参数的估计方法或计算公式. 估计值:估计量的某一具体取值称为估计值. 变量线性:是指因变量的条件均值是解释变量的线性函数。 参数线性:是指因变量的条件均值是参数B 的线性函数,而变量之间不一定是线性的。 四、简述 1。 答:14世纪英国逻辑学家奥卡姆提出简单有效原理,即“如无必要,勿增实体”,亦即“切勿浪费较多东西去做用较少的东西同样可以做好的事情”.因此,模型应尽量简化,只要不遗漏重要变量即可,即便某些变量对Y 有影响,但它们的综合影响如果是有限的,非随机的,都可以不予考虑,即归入u 中。 2. 答:对双变量回归模型而言,如果总体回归线接近于直线,可用函数表示为E (Y ︱X i )=B 1+B 2X i ,其中,B 1为截距,B 2为斜率,该函数就称为非随机总体回归函数。它表示在给定X 的条件下,Y 分布的均值. 对双变量回归模型而言,如果总体回归线接近于直线,回归方程可表示为Y i =B 1+B 2X i +u i ,其中,B 1+B 2X i 表示在给定X 的条件下Y 分布的均值,u i 为随机误差项。它表示真实的Y 值是如何在均值附近波动的。 对双变量回归模型而言,若样本回归线接近于直线,则非随机样本回归函数可表示为?i Y =b 1+b 2X i ,其中,?i Y =总体条件均值E (Y ︱X i )的估计量,b 1=真实截距B 1的估计量,b 2=真实斜率B 2的估计量. 对双变量回归模型而言,若样本回归线接近于直线,则随机样本回归函数可表示为Y i =b 1+b 2X i +e i ,其中,b 1+b 2X i 表示总体条件均值E (Y ︱X i )的估计量,e i 表示误差项u i 的样本估计量,称为残差。 五、论述题 什么是普通最小二乘法?(按教材内容回答,不必按讲义,因它太细了) 答:回归分析的目的是根据SRF (样本回归函数)估计PRF (总体回归函数),普通最小二乘法是获得SRF 最主要的方法。 随机PRF(Y i =B 1+B 2X i +u i )不能直接观察,但能通过随机SRF (Y i =b 1+b 2X i +e i )估计.由 SRF 得e i =Y i -b 1-b 2X i ,而?i Y =b 1+b 2X i ,因此,e i =Y i —?i Y =实际的Y i —估计的Y i .残差的绝对值越

计量经济学讲义第六讲(共十讲)

第六讲 多重共线 一、 FWL 定理及其应用 考虑模型: 112233i i i i i y a b x b x b x ε=++++ (1) 假如我们只关注 1 ?b ,则通过如下步骤可以获得之。 第1步:把 1x 对其他解释变量进行回归(请注意,截距所对应的解释变量为1) ,即有: 101223????i i i i x x x v βββ=+++ (2) 第2步:把 y 也对(2)中的解释变量进行回归,即有: 01223????i i i i y x x w ???=+++ (3) 第3步:把 ?w 对?v 进行回归(不含截距,当然你可以包含截距,但你会发现,截距 的估计结果是零,这是因为?w 与?v 其均值都为零) ,即有模型: ??i i i v e w η=+ (4) 则有:2????i i i w v v η=∑∑,可以验证,1??b η=,且残差?i e 等于初始的残差?i ε。此即著名的FWL 定理(Frisch-Waugh-Lovell theorem )。关于FWL 定理的一个简单证明见附录1。思考题: 利用关于“偏导数”的直觉,你能够理解 1 ??b η=吗? 考察2????i i i w v v η=∑∑,把01223????i i i i y x x w ? ??=---代入,现在分子是: 2012230123????()?????????i i i i i i i i i i i v x i i y x x y v x v v v w v ??????------∑∑∑==∑∑∑

应该注意到,在进行第一步回归时,OLS 法保证了 203???i i i i i v x x v v ===∑∑∑ 因此,22??????i i i i i i w v y v v v η== ∑∑∑∑ 显然,如果把 y 对?v 直接进行无截距回归: *?i i i y v η? =+ (5) 我们也可以得到: *122???????i i i i i i y v w v b v v η η====∑∑∑∑。 因此,如果只关注如何获得1 ?b ,我们可以把FWL 定理中第二步与第三步合并为把y 对 ? v 直接进行无截距回归。 思考题: ?i ?与?i e 相等吗?提示: ???????i i i e v i i i w y v η ?η--== 注意到, 2?i v ∑是(2)中的残差平方和,对(2),有: 22211 11 ()()??i i i x x x x v TSS ESS RSS -=-+↓↓↓∑∑∑

古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解

引言 0.1 复习笔记 一、计量经济学 1.定义 计量经济学,是对经济学的作用存在某种期待的结果,它把数理统计学应用于经济数据,以使数理经济学构造出来的模型得到经验上的支持,并获得数值结果。 计量经济学可定义为实际经济现象的数量分析。这种分析基于理论与观测的并行发展,而理论与观测又通过适当的推断方法得以联系。 计量经济学可定义为这样的社会科学:它把经济理论、数学和统计推断作为工具,应用于经济现象的分析。 2.研究对象和研究方法 计量经济学研究经济定律的经验判定。计量经济学家的艺术,就在于找出一组足够具体且足够现实的假定,使他尽可能最好地利用他所获得的数据。 计量经济学的研究方法是,利用统计推断的理论和技术作为桥头堡,以达到经济理论和实际测算相衔接的目的。 二、计量经济学是一门单独的学科 计量经济学值得作为一门独立的学科来研究,理由如下: 1.经济理论所作的陈述或假说大多数是定性的。计量经济学家的工作就是要提供这一数值估计。换言之,计量经济学对大多数的经济理论赋予经验内容。 2.数理经济学的主要问题,是要用数学形式(方程式)来表述经济理论,而不管该理论是否可以量化或是否能够得到实证支持。计量经济学家常常使用数理经济学家所提供的数学方程式,但要把这些方程式改造成适合于经验检验的形式。这种从数学方程到计量经济方程的转换需要有许多的创造性和实际技巧。 3.经济统计学的问题,主要是收集、加工并通过图表的形式来展现经济数据。但是,经济统计学家不考虑怎样利用所收集来的数据去检验经济理论。 三、计量经济学方法论 大致说来,传统的计量经济学方法论按如下路线进行: 1.理论或假说的陈述; 2.理论的数学模型设定; 3.统计或计量经济模型设定; 4.获取数据; 5.计量经济模型的参数估计; 6.假设检验; 7.预报或预测; 8.利用模型进行控制或制定政策。 四、计量经济学的类型 计量经济学可划分为两大类:理论计量经济学(theoretical econometrics)和应用计量经济学(applied econometrics)。在每一大类中均可按经典方法(classical)或贝叶斯方法(Bayesian)进行研究。 理论计量经济学是要找出适当的方法,去测度由计量经济模型设定的经济关系。为此,计量经济学家非常依赖于数理统计。 在应用计量经济学中,利用理论计量经济学工具去研究经济学或管理学中的某些特殊领域。 0.2 课后习题详解 本章没有课后习题。本章是全书的一个引言,对计量经济学这门学科作一个简要介绍。对于本章内容,学员简单了解即可。

计量经济学李子奈(第3版)例题+习题数据

计量经济学(第3版)例题和习题数据表表2.1.1 某社区家庭每月收入与消费支出统计表

表2.3.1 参数估计的计算表

表2.6.1 中国各地区城镇居民家庭人均全年可支配收入与人均全年消费性支出(元) 资料来源:《中国统计年鉴》(2007)。

表2.6.3 中国居民总量消费支出与收入资料 单位:亿元年份GDP CONS CPI TAX GDPC X Y 19783605.6 1759.1 46.21519.28 7802.5 6678.83806.7 19794092.6 2011.5 47.07537.828694.2 7551.64273.2 19804592.9 2331.2 50.62571.70 9073.7 7944.24605.5 19815008.8 2627.9 51.90629.899651.8 8438.05063.9 19825590.0 2902.9 52.95700.02 10557.3 9235.25482.4 19836216.2 3231.1 54.00775.5911510.8 10074.65983.2 19847362.7 3742.0 55.47947.35 13272.8 11565.06745.7 19859076.7 4687.4 60.652040.79 14966.8 11601.77729.2 198610508.5 5302.1 64.572090.37 16273.7 13036.58210.9 198712277.4 6126.1 69.302140.36 17716.3 14627.78840.0 198815388.6 7868.1 82.302390.47 18698.7 15794.09560.5 198917311.3 8812.6 97.002727.40 17847.4 15035.59085.5 199019347.8 9450.9 100.002821.86 19347.8 16525.99450.9 199122577.4 10730.6 103.422990.17 21830.9 18939.610375.8 199227565.2 13000.1 110.033296.91 25053.0 22056.511815.3 199336938.1 16412.1 126.204255.30 29269.1 25897.313004.7 199450217.4 21844.2 156.655126.88 32056.2 28783.413944.2 199563216.9 28369.7 183.416038.04 34467.5 31175.415467.9 199674163.6 33955.9 198.666909.82 37331.9 33853.717092.5 199781658.5 36921.5 204.218234.04 39988.5 35956.218080.6 199886531.6 39229.3 202.599262.80 42713.1 38140.919364.1 199991125.0 41920.4 199.7210682.58 45625.8 40277.020989.3 200098749.0 45854.6 200.5512581.51 49238.0 42964.622863.9 2001108972.4 49213.2 201.9415301.38 53962.5 46385.424370.1 2002120350.3 52571.3 200.3217636.45 60078.0 51274.026243.2 2003136398.8 56834.4 202.7320017.31 67282.2 57408.128035.0 2004160280.4 63833.5 210.6324165.68 76096.3 64623.130306.2 2005188692.1 71217.5 214.4228778.54 88002.1 74580.433214.4 2006221170.5 80120.5 217.6534809.72 101616.3 85623.136811.2资料来源:根据《中国统计年鉴》(2001,2007)整理。

计量经济学复习10

1 根据1961年到1985年期间美国个人消费支出和个人可支配收入数据,得到如下的回归模型: ()() () 8755 .0.9979 .06933.22936.702392.20925.088544.04664.49?232==-=++-=W D R t X X Y t t t 其中:=Y 个人消费支出(1982年10亿美元),=2X 个人可支配收入(PDI )(1982年10亿美元),=3X 道.琼斯工业平均指数。0.946, 1.543L U d d == (1)在回归方程的残差中存在一阶自相关吗?你是如何知道的。 (2)利用杜宾两阶段回归,将上述回归模型进行转换,重新进行回归,结果如下: ()() 28 .2.981 .066.272.3009.089.097.17?2*3*2*===++-=W D R t X X Y t t t 自相关问题解决了吗?你是如何知道的? (3)比较初始回归和变换后的回归,PDI 的t 值急剧下降,这一变化说明了什么? (4)初始方程的2 0.9979R =大于变换后的方程2 0.981R =,因此,初始方程的解释能力比变换后的方程的解释能力强,这种说法是否正确,为什么? 1)存在。因为0.946, 1.543L U d d ==,0.87550.946<,所以存在正相关。 2)自相关问题已经解决。因为0.946, 1.543L U d d ==,1.543 2.284 1.543<<-, 所以不存在自相关。 3)这一变化说明,初始回归方程中,由于存在自相关,使得PDI 的方差被高估了。 4)这种说法不正确。因为被解释变量不同。 2.下面是一个回归模型的检验结果。 White Heteroskedasticity Test: F-statistic 19.41659 Probability 0.000022 Obs*R-squared 16.01986 Probability 0.006788 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/31/06 Time: 10:54 Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob.

古扎拉蒂-经济计量学习题答案

部分作业答案:(各题只要回答到如下程度就是满分哦) 第1章 概论 一、填空 1. 近似,散点; 2. 平均值,平均值 第2章 线性回归的基础理论 一、填空 1. 因变量Y ,解释变量X 二、单项选择题 1-2 AB 三、名词解释 总体:实验所有可能结果的集合称为总体或样本空间。 样本:也叫样本点,是指总体的某个元素或某种结果。 随机实验:至少有两个可能的结果,但不确定哪一个结果会出现的某个观察或测度过程。 估计量:是指总体参数的估计方法或计算公式。 估计值:估计量的某一具体取值称为估计值。 变量线性:是指因变量的条件均值是解释变量的线性函数。 参数线性:是指因变量的条件均值是参数B 的线性函数,而变量之间不一定是线性的。 四、简述 1. 答:14世纪英国逻辑学家奥卡姆提出简单有效原理,即“如无必要,勿增实体”,亦即“切勿浪费较多东西去做用较少的东西同样可以做好的事情”。因此,模型应尽量简化,只要不遗漏重要变量即可,即便某些变量对Y 有影响,但它们的综合影响如果是有限的,非随机的,都可以不予考虑,即归入u 中。 2. 答:对双变量回归模型而言,如果总体回归线接近于直线,可用函数表示为E(Y ︱X i )=B 1+B 2X i ,其中,B 1为截距,B 2为斜率,该函数就称为非随机总体回归函数。它表示在给定X 的条件下,Y 分布的均值。 对双变量回归模型而言,如果总体回归线接近于直线,回归方程可表示为Y i =B 1+B 2X i +u i ,其中,B 1+B 2X i 表示在给定X 的条件下Y 分布的均值,u i 为随机误差项。它表示真实的Y 值是如何在均值附近波动的。 对双变量回归模型而言,若样本回归线接近于直线,则非随机样本回归函数可表示为 ?i Y =b 1+b 2X i ,其中,?i Y =总体条件均值E(Y ︱X i )的估计量,b 1=真实截距B 1的估计量,b 2=真实斜率B 2的估计量。 对双变量回归模型而言,若样本回归线接近于直线,则随机样本回归函数可表示为Y i =b 1+b 2X i +e i ,其中,b 1+b 2X i 表示总体条件均值E(Y ︱X i )的估计量,e i 表示误差项u i 的样本估计量,称为残差。 五、论述题 什么是普通最小二乘法?(按教材内容回答,不必按讲义,因它太细了) 答:回归分析的目的是根据SRF (样本回归函数)估计PRF (总体回归函数),普通最小二乘法是获得SRF 最主要的方法。 随机PRF (Y i =B 1+B 2X i +u i )不能直接观察,但能通过随机SRF (Y i =b 1+b 2X i +e i )估计。 由SRF 得e i =Y i -b 1-b 2X i ,而?i Y =b 1+b 2X i ,因此,e i =Y i -?i Y =实际的Y i -估计的Y i 。残差的绝对

计量经济学讲义共十讲

计量经济学讲义共十讲文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

第一讲 普通最小二乘法的代数 一、 问题 假定y 与x 具有近似的线性关系:01y x ββε=++,其中ε是随机误差项。我们对01ββ、这两个参数的值一无所知。我们的任务是利用样本数据去猜测01ββ、的取值。现在,我们手中就有一个样本容量为N 的样本,其观测值是:1122(,),(,),...,(,)N N y x y x y x 。问题是,如何利用该样本来猜测01ββ、的取值 为了回答上述问题,我们可以首先画出这些观察值的散点图(横轴x ,纵轴y )。既然y 与x 具有近似的线性关 系,那么我们就在图中拟合一条直线:01 ???y x ββ=+。该直线是对y 与x 的真实关系的近似,而0 1 ??,β β分别是对01 ,ββ的猜测(估计)。问题是,如何确定0?β与1 ?β,以使我们的猜测看起来是合理的呢 笔记: 1、为什么要假定y 与x 的关系是0 1y x ββε=++呢一种合理的解释 是,某一经济学理论认为x 与y 具有线性的因果关系。该理论在讨论x 与y 的关系时认为影响y 的其他因素是不重要的,这些因素对y 的影响即为模型中的误差项。 2、0 1y x ββε=++被称为总体回归模型。由该模型有: 01E()E()y x x x ββε=++。既然ε代表其他不重要因素对y 的影 响,因此标准假定是:E()0x ε=。故进而有:

01E()y x x ββ=+,这被称为总体回归方程(函数),而 01 ???y x ββ=+相应地被称为样本回归方程。由样本回归方程确定的?y 与y 是有差异的,?y y -被称为残差?ε。进而有:0 1 ???y x ββε=++,这被称为样本回归模型。 二、 两种思考方法 法一: 12(,,...,)N y y y '与12???(,,...,)N y y y '是N 维空间的两点,0 ?β与1 ?β的选择应该是这两点的距离最短。这可以归结为求解一个数学问题: 由于?i i y y -是残差?i ε的定义,因此上述获得0?β与1 ?β的方法即是0 ?β 与1 ?β的值应该使残差平方和最小。 法二: 给定i x ,看起来i y 与?i y 越近越好(最近距离是0)。然而,当你选择拟合直线使得i y 与?i y 是相当近的时候,j y 与?j y 的距离也许变远了,因此存在一个权衡。一种简单的权衡方式是,给定12,,..,N x x x ,拟合直线的选择应该使1y 与 2?y 、2y 与2?y 、...、N y 与?N y 的距离的平均值是最小的。距离是一个绝对值,数学处理较为麻烦,因此,我们把第二种思考方法转化求解数学问题: 由于N 为常数,因此法一与法二对于求解0?β与1 ?β的值是无差异的。 三、 求解

经济计量学精要(第4版)(美)古扎拉蒂

??经济计量学精要(第4版)/(美)古扎拉蒂 大佬点个赞支持一下呗ヽ(′▽`)ノヽ(′▽`)ノヽ(′▽`)ノ 经济计量学精要(第4版)/(美)古扎拉蒂 ? 综述 1.1 什么是经济计量学 1.2 为什么要学习经济计量学 1.3 经济计量学方法论 经济计量分析步骤: (1)建立一个理论假说 (2)收集数据 (3)设定数学模型 线性回归模型为例 线性回归模型中,等式左边的变量称为应变量,等式右边的变量称为自变量或解释变量。线性回归分析的主要目标就是解释一个变量(应变量)与其他一个或多个变量(解释变量)之间的行为关系。 简单数学模型 ? (4)设立统计或经济计量模型 误差项u

? u代表随机误差项,简称误差项。u包括了X以外其他所有影响Y,但并未在模型中具体体现的因素以及纯随机影响。 (5)估计经济计量模型参数 线性回归模型常用最小二乘法估计模型中的参数 ^读做"帽",表示某的估计值 (6)核查模型的适用性:模型设定检验 (7)检验源自模型的假设:假设检验 (8)利用模型进行预测 数据类型 时间序列数据:按时间跨度收集得到的 截面数据:一个或多个变量在某一时间点上的数据集合 合并数据:既包括时间序列数据又包括截面数据 面板数据:也称纵向数据、围观面板数据,即同一个横截面单位的跨期调查数据 模型因果关系 统计关系无论有多强,有多紧密,也决不能建立起因果关系,如果两变量存在因果关系,则一定建立在某个统计学之外的经济理论基础之上。 第一部分线性回归模型 2.1回归的含义 回归分析的主要目的:根据样本回归函数SRF估计总体回归函数PRF 2.2总体回归函数(PRF):假想一例 总体回归线给出了对应于自变量的每个取值相应的应变量的均值。(总体回归线表明了Y的均值与每个X的变动关系)PRL ? E(Y|xi)表示与给定x值相对应的Y的均值。下标i代表第i个子总体。 B1、B2称为参数,也称为回归系数。B1称为截距,B2称为斜率。斜率系数度量了X每变动一单位,Y( 条件)均值的变化率。 2.3总体回归函数的统计或随机设定 随机或统计回归总体函数PRF ? ui随机误差项,其值无法先验确定,通常用概率分布描述随机变量。 2.4 随机误差项的性质 误差项代表了未纳入模型变量的影响; 即使模型中包括了决定数学分数的所有变量,其内在随机性也不可避免;人类行为并不是完全可预测的或完全理性的。 因而,u反映了人类行为的这种内在随机性。 u还代表了度量误差,如数据的四舍五入; “奥卡姆剃刀原则”:描述应当尽量简单,只要不遗漏重要的信息。即使知道其他变量可能会对Y有影响,但这些变量的综合影响是有限的、非确定性的,可以把这些次要因素归人随机项u。 2.5 样本回归函数 样本回归函数SRF

计量经济学第八讲v

第八讲 平稳时间序列 在严格意义上,随机过程{}t X 的平稳性是指这个 过程的联合和条件概率分布随着时间t 的改变而保持不变。在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳: 2();();(,)t t t t j j E X Var X Cov X X μδδ+=== 显然20δδ=。 在本讲义中,平稳皆指协方差平稳。当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。 (一)平稳随机过程的例子 1、白噪声过程{}t ε: 20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠=== 笔记: 假定t ε还服从正态分布,则{}t ε被称为高斯白噪声。在正态分布下,独立与不相关是两个等价的概念,从而高斯白噪声{}t ε也属于严格白噪声。对于严格白噪声过程,有: , (12) ()()t t t t E E εεεε--=,。因此,就预测t ε来说,,1t i i ε-≥没有任何信息价值。当一个变量的当期及其过去值对预测变量未来值没有任何帮助时,我们常常称该变量是不可预测的。

2、AR(1)过程: 011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程 为了验证上述过程满足平稳性条件,我们首先通过迭代得到:1 1 1 1 00 1 0t t i i t i i i t t y a a a y a ε---===++∑∑。接下来注意到, 1 1 1)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了 很久,即t 趋于无穷大,则0 1 )1(t a E y a μ-==;其次也有 1 1 ()() t i t i i t Var y Var a ε--==∑,当t 趋于无穷大时, 2 12 2 1()11()i t Var a a Var y εδ-= - = ;最后,当t 趋于无穷大时,有: 1211111111222 (12411112) 1......(...) [()()] [()()]s s t t s t s t t s t s t s t t s s s s s a a a a a E y y E a a a a a μμδδεεεεεεε+-----------++- -+++++++++++= == 关于AR(p)过程的平稳性,见附录。下图是对一个 平稳AR(1)过程的模拟。 1,(0,1) 10.8t N ID t t t y y εε-+=+ 笔记:

计量经济学讲义-3--第一章 线性回归基础

4 最小二乘原理 计量经济学最关心的理论模型是类似于y x αβ=+ 表示变量之间的关系。 1. 散点图 为了弄清楚变量之间的关系,我们从画出他们的散点图开始比较好。从画的图中我们可以大体上判断以下变量之间是呈直线关系,还是二次曲线关系。这对准确建立模型很有帮助。 模型y x αβ=+代表只要我们知道x ,我们就可以完全知道y 。但是现实中不是这样。这时除了系统因素x 之外,还有其他别的因素影响y 。此时我们用确率模型 ,1,2,,t t t Y X u t n αβ=++= 来表示。其中,y 是被说明变量,或从属变量;x 是说明变量,或独立变量;u 是误差项,也可以叫做搅乱项。 2. 函数的设定与参数的意义 不同的模型定义,它所定义的参数的意义不同。为简单起见,在本节中,我们先省去误差项。我们讨论一下参数的意义。 在y x αβ=+中,dy dx β= ,β意味着x 发生一单位的变化时,y 相应地变化几个单 位,也就是我们所熟悉的限界消费性向。 但是对于y x βα=来说,我们先两边取自然对数,log log log y x αβ=+,这时, log log d y d x β=,其中,log ,log dy dx d y d x y x ==,结果log log d y x dy d x y dx β==。β代 表x 变化1%时,y 变化β%单位。也就是弹力性。 3. 最小二乘法 3-1. 基本符号 样本平均 1 111,n n t t t t X X Y Y n n === = ∑ ∑ 偏离样本平均的平方和 () 2 2222 1 1 1 n n n x t t t t t t S x X X X nX ==== = -= -∑∑∑ ; () 2 2222 1 11n n n y t t t t t t S y Y Y Y nY ==== = -= -∑ ∑∑ ()()1 1 1 n n n xy t t t t t t t t t S x y X X Y Y X Y nX Y ==== = --=-∑∑∑ 其中,,t t t t x X X y Y Y =-=-,小写代表偏离样本平均的程度,即偏差。 偏差有以下重要性质: ()1 1 0n n t t t t x X X === -=∑∑; ()1 1 0n n t t t t y Y Y === -=∑ ∑

计量经济学讲义

计量经济学讲义 第四讲 趋势和DF 检验(修订版) 此翻译稿制作学习之用,如有错误之处,文责自负。 趋势平稳序列(TS )(图1和2) 一个趋势平稳序列绕着一个确定的趋势(序列的均值),其波动幅度不显示增大或者减小的趋势。 线性确定性趋势: t t t y εβα++= ),0(~2 σεiid t t=1,2,… 平方确定性趋势: t t t t y εγβα+++=2 ),0(~2 σεiid t t=1,2,… 通常: t t t f y ε+=)( ),0(~2 σεiid t t=1,2,… 均值是是随时间变化的(川),但是方差是常数。t ε可以为任意平稳序列,也就是说,不一定要是白噪声过程。 通过拟合一个确定的多项式时间趋势,趋势可以来消除:拟合趋势后残差将给出一个去趋势的序列。 一个带线性确定性趋势AR (1)过程可以写作: t 1-t 1t )1)-t (y (t y εβαφβα+--=-- ),0(~2 σεiid t t=1,2,… 此处确定性趋势被t y 减去。然而在实践中,α、β是未知的而且必须估计出来。于是模型可以被重述为: t 1-t 1111t y t )1()1(y εφβφβφαφ++-++-= 其中包含一个截距和一个趋势,也就是 t 1-t 1* *t y t y εφβα+++= 此处 βφαφα11*)1(+-= 且 βφβ)1(1* -= 若1||1<φ,那么此AR 过程就是围绕一个确定性趋势的平稳过程. 差分平稳序列(DF )(也叫单整序列)和随机性趋势 如果一个非平稳序列可以由一个平稳序列通过d 次差分得到,那么我们说这个序列就是d 阶单整的,写做I (d ).这一过程也因此叫做差分平稳过程(DSP ). 因此,平稳序列就是零阶单整的,I (0)。白噪声序列是I (0)。 所以如果序列t d t y w ?=是平稳的,那么t y 就是I (d )。?是差分算子,即 等等2-t 1-t t 2-t 1-t 1-t t 1-t t t t 21-t t t y 2y y )y y ()y y ()y y (y y ,y y y +-=---=-?=??=?-=? 如果序列 1-t t t t y y y w -=?= 是平稳的话,t y 是I (1); 如果序列2-t 1-t t t 2 t y 2y y y w +-=?= 是平稳的,t y 是I (2),

古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

第15章定性响应回归模型 15.1 复习笔记 考点一:定性响应模型的性质★★ 定性响应模型是指模型中的回归子是一个二值或二分变量的模型,通常被称为概率模型。回归子也可以是多分响应变量或多类型响应变量。将二值响应变量建立成概率模型的方法包括线性概率模型(LPM)、logit模型、probit模型和tobit模型。 考点二:线性概率模型(LPM)★★★★ 1.LPM的定义 以下述回归模型为例说明:Y i=β1+β2X i+u i。其中X表示家庭收入;Y=1,则表示该家庭拥有住房;Y=0,则该家庭不拥有住房。该模型被称为线性概率模型,因为Y i在给定X i下的条件期望E(Y i|X i)可解释为在给定X i下事件(家庭拥有住房)发生的条件概率,即Pr(Y i=1|X i)。 2.LPM的特征 令P i表示“Y i=1”(即事件发生)的概率,而1-P i表示“Y i=0”(即事件不发生)的概率,则变量Y i服从贝努利概率分布。

根据期望的定义,有:E(Y i)=0(1-P i)+1P i=P i。此外有:E(Y i|X i)=β1+β2X i =P i,即模型的条件期望事实上可以解释为Y i的条件概率。 该模型的约束条件为:0≤E(Y i|X i)≤1。 3.LPM的问题 (1)干扰项u i的非正态性 若把方程写成:u i=Y i-β1-β2X i,u i的概率分布见表15-1。 表15-1 u i的概率分布 可见u i服从贝努利分布而不是正态分布。虽然干扰项不满足正态性假定,但OLS的点估计值仍具有无偏性。此外在大样本下,OLS估计量一般都趋于正态分布,因此LPM的统计推断仍可用正态性假定下的OLS程序。 (2)干扰项的异方差性 即使LPM中的干扰项满足零均值和无序列相关性假定,但也不能说它具有同方差性。对于贝努利分布,理论上的均值和方差分别为P和P(1-P),可见方差是均值的函数,而均值的取值依赖于X的值,因此LPM中的干扰项具有异方差性。 由于u i的方差依赖于E(Y i|X i),解决异方差性问题的方法之一就是进行数据变换,将模型的两边同时除以: == 即:

计量经济学 李子奈 第七版 复习题

计量经济学 复习题 一、单选题 1、怀特检验法可用于检验( )。 A.异方差性 B.多重共线性 C.序列相关 D.模型设定误差 2、计量经济学分析问题的工作程序是( )。 A.设定模型,检验模型,估计模型,改进模型 B.设定模型,估计参数,检验模型,应用模型 C.估计模型,应用模型,检验模型,改进模型 D.搜集资料,设定模型,估计参数,应用模型 3、对下列模型进行经济意义检验,哪一个模型是没有实际意义的( )。 A.i C (消费)i I 8.0500+=(收入) B.di Q (商品需求)i I 8.010+=(收入)i P 9.0+(价格) C.si Q (商品供给)i P 75.020+=(价格) D.i Y (产出量)6.065.0i K =(资本)4 .0i L (劳动) 4、戈德菲尔德—匡特检验法可用于检验模型的( )。 A.异方差性 B.多重共线性 C.序列相关 D.设定误差 5、在满足基本假定的情况下,对单方程计量经济学模型而言,下列有关解 释变量和被解释变量的说法中正确的有( )。 A.被解释变量和解释变量均为随机变量 B.被解释变量和解释变量均为非随机变量 C.被解释变量为随机变量,解释变量为非随机变量 D.被解释变量为非随机变量,解释变量为随机变量 6、根据样本资料估计得到人均消费支出Y 对人均收入X 的回归方程为 X Y ln 75.000.2ln += ,这表明人均收入每增加1%,人均消费支出将增加 ( )。 A.2% B.0.75 C.0.75% D.7.5% 7、设k 为回归模型中的解释变量个数,n 为样本容量,则对总体回归模型 进行显著性检验(F 检验)时构造的F 统计量为( )。 A.)1/()/(--=k n RSS k ESS F B. )k n /(RSS )1k /(ESS 1F ---=

计量经济学讲义第二讲(共十讲)

第二讲 普通最小二乘估计量 一、基本概念:估计量与估计值 对总体参数的一种估计法则就是估计量。例如,为了估计总体均值为u ,我们可以抽取一个容量为N 的样本,令Y i 为第i 次观测值,则u 的一个很自然的 估计量就是?i Y u Y N ==∑。A 、B 两同学都利用了这种 估计方法,但手中所掌握的样本分别是12(,,...,)A A A N y y y 与12(,,...,)B B B N y y y 。A 、B 两同学分别计算出估计值 ?A i A y u N =∑ 与?B i B y u N =∑ 。因此,在上例中,估计量?u 是随机的,而??,A B u u 是该随机变量可能的取值。估计量 所服从的分布称为抽样分布。 如果真实模型是:01y x ββε=++,其中01,ββ是待估计的参数,而相应的OLS 估计量就是: 1 01 2 ()???;() i i i x x y y x x x βββ-==--∑∑ 我们现在的任务就是,基于一些重要的假定,来考察上述OLS 估计量所具有的一些性质。 二、高斯-马尔科夫假定

●假定一:真实模型是:01y x ββε=++。有三种 情况属于对该假定的违背:(1)遗漏了相关的解释变量或者增加了无关的解释变量;(2)y 与x 间的关系是非线性的;(3)01,ββ并不是常数。 ●假定二:在重复抽样中,12(,,...,)N x x x 被预先固定 下来,即12(,,...,)N x x x 是非随机的(进一步的阐释见附录),显然,如果解释变量含有随机的测量误差,那么该假定被违背。还存其他的违背该假定的情况。 笔记: 12(,,...,)N x x x 是随机的情况更一般化,此时,高斯-马尔科夫假定二被更改为:对任意,i j ,i x 与j ε不相关,此即所谓的解释变量具有严格外生性。显然,当12(,,...,)N x x x 非随机时,i x 与j ε必定不相关,这是因为j ε是随机的。 ●假定三:误差项期望值为0,即 ()0,1,2i E i N ε==。 笔记: 1、当12(,,...,)N x x x 随机时,标准假定是: 12(,,...,)0,1,2,...,i N E x x x i N ε== 根据迭代期望定律有:12[(,,...,)]()i N i E E x x x E εε=,因 此,如果12(,,...,)0i N E x x x ε=成立,必定有:()0i E ε=。

计量经济学讲义

计量经济学讲义

计量经济学讲义 第四讲 趋势和DF 检验(修订版) 此翻译稿制作学习之用,如有错误之处,文责自负。 趋势平稳序列(TS )(图1和2) 一个趋势平稳序列绕着一个确定的趋势(序列的均值),其波动幅度不显示增大或者减小的趋势。 线性确定性趋势: t t t y εβα++= ) ,0(~2σεiid t t=1,2,… 平方确定性趋势: t t t t y εγβα+++=2 ) ,0(~2σεiid t t=1,2,… 通常: t t t f y ε+=)( ) ,0(~2σεiid t t=1,2,… 均值是是随时间变化的(川),但是方差是常数。t ε可以为任意平稳序列,也就是说,不一 定要是白噪声过程。 通过拟合一个确定的多项式时间趋势,趋势可以来消除:拟合趋势后残差将给出一个去趋势的序列。 一个带线性确定性趋势AR (1)过程可以写作: t 1-t 1t )1)-t (y (t y εβαφβα+--=-- ) ,0(~2σεiid t 版权所

t=1,2,… 此处确定性趋势被t y 减去。然而在实践中,α、 β 是未知的而且必须估计出来。于是模型可以被 重述为: t 1-t 1111t y t )1()1(y εφβφβφαφ++-++-= 其中包含一个截距和一个趋势,也就是 t 1 -t 1 * * t y t y εφβα+++= 此处 β φαφα11* )1(+-= 且 β φβ)1(1*-= 若1 ||1 <φ ,那么此AR 过程就是围绕一个确定性 趋势的平稳过程. 差分平稳序列(DF )(也叫单整序列)和随机性趋势 如果一个非平稳序列可以由一个平稳序列通过d 次差分得到,那么我们说这个序列就是d 阶单整的,写做I (d ).这一过程也因此叫做差分平稳过程(DSP ). 因此,平稳序列就是零阶单整的,I (0)。白噪声序列是I (0)。 所以如果序列t d t y w ?=是平稳的,那么t y 就是I (d )。? 是差分算子,即 等等 2-t 1-t t 2-t 1-t 1-t t 1-t t t t 21-t t t y 2y y )y y ()y y ()y y (y y ,y y y +-=---=-?=??=?-=?

相关主题