搜档网
当前位置:搜档网 › 古扎拉蒂计量经济学第四版讲义Ch7 Heteroscedasticity

古扎拉蒂计量经济学第四版讲义Ch7 Heteroscedasticity

古扎拉蒂计量经济学第四版讲义Ch7 Heteroscedasticity
古扎拉蒂计量经济学第四版讲义Ch7 Heteroscedasticity

第七章 异方差 Heteroscedasticity

1、异方差的实质

异方差和自相关是一对,分别检测误差项的方差和协方差,涉及的方法都是GLS 或EGLS 。

同方差的假定如下表示:

()221,2,,i E i n εσ== 11.1.1

异方差则表示为

()22i i E εσ=

11.1.2

2、存在异方差的OLS 估计

首先举一个两变量回归模型的例子:异方差下2β的OLS 估计量与同方差假定下的公式(3.1.6)相同,但是它的方差现在由下式给出:

()()()2

222

2var i

i i x x b x x σ ? = ?

∑∑

11.2.2

这显然与同方差下的公式3.3.1不同。

()()

2

22

var i

b x x σ=

?∑ (3.3.1) (11.2.3)

Proof for 11.2.2.:

从一元回归中已知,

()

()

2

1

i i n

i

i x x k x x =?=

?∑

()2122i i i i i i i b k y k x k ββεβε==++=+∑∑∑

()()()

()()

2

2

2222222221122121211222222

1122var 22i i n n n n n n n n b E b E k E k k k k k k k E k k k βεεεεεεεεεεε??=?==++++++=+++∑

这是因为无序列相关的假定,误差项交互项乘积的期望等于0。

由于i k 已知,而且()22

i

i E

εσ

=,

()()()()()

()()2222

222112222222222

11222

22222

2var n n n n i i i i i i i i b k E k E k E k k k k x x x x x x x x εεεσσσσσσ=+++=+++=

??

==

??

∑∑∑∑∑

可以证明在异方差情况下,2b 估计量仍然是线性的和无偏的;同理,不管误差项是否同方差还是异方差,2b 估计量都是一致的估计量;进一步,2b 是asymptotically normally distributed 。这里关于一元回归在异方差出现下OLS 估计量2b 的特性可以完全推广到多元回归的情况。

但是,在异方差下,2b 虽然是线性、无偏和一致的,却不是有效的和最优的,不具有无偏估计量族中的最小方差。

3、广义最小二乘

Generalized Least Squares (GLS)

1)广义最小二乘(GLS ) 还是首先回到简单回归模型

12i i i y x ββε=++ or ()10201i i i i

i y x x x ββε=++=

Now assume that the heteroscedasticity variance

2i σ are known .

012i i i i

i i i i y x x

εββσσσσ

=++

11.3.3 For ease of exposition we write as

102i i i i y x x ββε??????=++ 11.3.4

where the starred, or transformed, variables are the original variables divided by (the known) i σ.

What’s the purpose of transforming the original model?

()()2

222221

var 1

1

i i i i i i

i i

E E known

εεεσσσσσ? ==← == 11.3.5

Therefore, the variance of the transformed disturbance term is now homoscedastic.

Since we are still retaining the other assumptions of the CLRM, the finding suggest that if we apply OLS to the transformed model 11.3.3 it will produce estimators that are BLUE.

This procedure of transforming the original variables in such a way that the transformed variables satisfy the assumptions of the classical model and then applying OLS to them is known as the method of generalized least squares (GLS). In short, GLS is OLS on the transformed variables that satisfy the standard least-squares assumptions. The estimators thus obtained are known as GLS estimators , and it is these estimators that are BLUE.

GLS 的估计程序如下:

First, we write down the SRF of 11.3.3

012i

i i

i

i i i i y x x e b b σσσσ?? =++

or

102i i i i y b x b x e ?????

?=++

11.3.6

Now, to obtain the GLS estimators, we minimize

()2

2102i i i i e y b x b x ??????=?+∑∑ 11.3.7

The actual mechanics of minimizing 11.3.7 follow the standard calculus techniques. The GLS estimator of 2b ?

is

()()()()()()()

2

22i

i i

i

i i

i i

i

i i

i i

w w x y w x w y b

w w x w x ??=

?∑∑∑∑∑∑∑ 11.3.8 and its variance is given by

()()()()

2

2

2var i

i

i i

i i

w

b w w x w x ?=

?∑∑∑∑ 11.3.9

where 2

1/i i w σ=.

2)加权最小二乘(WLS ) Weighted Least Squares (WLS)

以简单回归为例。

The unweighted least squares method minimizes

22

1

2()

i

i

i

e y b b x =??∑∑ 1

The weighted least squares minimizes

2212()i i

i

i

i w e w y b

b x ??=??∑∑

2

where 12,b b ??

are the weighted least-squares estimators 。 In the case of heteroscedasticity, 2

1

i i w σ=

, which are inversely proportional to the variance of

i ε or i y .

Differencing 2 with respect to 12,b b ?

?

, we obtain

()

()

2

121

2122

2()12()i i i i i i i

i i i i w e w y b b x b

w e

w y b b x x b ??

?

??

?

?=?????=????∑∑∑∑

Setting the preceding expressions equal to zero, we obtain the following two normal equations

1

2

21

2i i

i

i i

i i i

i i

i i

w y b w b w x

w x y b w x b w x

????=+=+∑∑∑∑∑∑

Solving these equations simultaneously, we obtain

12b y b x ?

?

??

=?

()()()()()()()

2

22i

i i

i

i i

i i

i

i i

i i

w w x y w x w y b

w w x w x ??=

?∑∑∑∑∑∑∑ where /i i i y w y w =∑∑ and /i i i x w x w ?

=∑∑.

3)OLS, GLS and WLS

总的说来,WLS 只是GLS 的一个特例,但是,在异方差的背景下,GLS 和WLS 术语可以互换;以后我们会讨论GLS 估计的其它特例。

如果确实存在异方差和序列相关性,则通过GLS 这些违背被有效地消除了;如果不存在异方差和序列相关,则GLS 等价于OLS 。

4)矩阵描述GLS 和EGLS

To take into account heteroscedasticity variances (the elements on the main diagonal of 'εε) and autocorrelations in the error terms (the elements off the main diagonal of 'εε), assume that

()2'E σ=εεV

where V is a known n*n matrix. Therefore, if the model is

=+y X βε

where ()0E =ε and ()2

var cov σ?=εV . In case 2

σ is unknown , which is typically the

case, V then represents the assumed structure of variances and covariances among the random errors

i ε.

Under the stated condition of the variance-covariance of the error terms, it can be shown that

()1

gls 11''???=b X V X X V y

gls b is known as the generalized least-squares (GLS) estimator of β.

It can also be shown that

()()

1

gls

2

1

var cov 'σ???=b

X V X

It can be proved that gls

b is the best linear unbiased estimator (BLUE) of β.

The real problem in practice is that we do not know 2

σ as well as the true variances and covariances (i.e., the structure of the V matrix). As a solution, we can use the method of estimated (or feasible) generalized least squares (EGLS).

For EGLS, we first estimate our model by OLS disregarding the problems of heteroscedasticity and/or autocorrelation. We obtaine the residuals from this estimated model and form the

(estimated) variance-covariance matrix of the error term, V

. It can be shown that EGLS estimators are consisten t estimators of GLS. Symbolically,

()

1

11egls

''???=b

X V

X X V

y () (

)

1

1

egls

2

var cov 'σ

???=b

X V X

where V

is an estimate of V .

4、异方差下使用OLS 估计的结果

假如我们不使用GLS 方法,而是继续使用OLS 方法,我们分别考虑异方差和不考虑异方差两种情况来分析置信区间和假设检验可能出现的不同情况。

以一元回归为例,如果使用OLS 方法,在考虑异方差和不考虑异方差两种情况下,2b 估计量的公式是相同的;所不同的是()2var b ,前者是11.2.2,后者对应11.2.3。

1)考虑了异方差的OLS 估计

在考虑异方差的情况下,并假定2

i σ已知,通常不能使用t 和F 统计量来构建置信区间和进行假设检验;这时因为()

()22var var b b ?

≤(广义最小二乘系数方差比考虑了异方差的OLS

系数估计量的方差小),以后者构建的置信区间将偏大,使得t 和F 统计量检验的结果可能不准确;后者导致的t 统计量偏小,所以会得到系数不显著的结论,而很可能在正确的GLS 检验下系数是显著的。

2)不考虑异方差的OLS 估计

在出现异方差却仍然使用不考虑异方差的OLS 估计下,情况就比较严重,这是因为:

1、 2

σ

, the conventional estimator of 2

σ(=()2

/2i

e n ?∑), is no longer an unbiased estimator

of that when heteroscedasticity is present ( 2

2E σσ≠).

2、系数方差11.2.3是系数方差11.2.2.的有偏估计量,而且我们不知道这种偏差是正还是负。

3、既然()2se b 都不能被无偏地估计,所以我们更不能依靠传统计算的置信区间以及t 和F 统计量。

5、异方差诊断(Detection ) 1)不正式的方法 Nature of the problem

很多时候所研究问题的本质就揭示了异方差是否可能存在。 一般经验告诉我们,对于采用截面数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的其它因素的差异较大,所以往往存在异方差性。

Graphical method

绘制所估计残差平方和的模式:

绘制一:y 轴为残差平方和(2

e )

,x 轴为y 的拟合值( y ) 绘制二:y 轴为残差平方和(2

e ),x 轴为解释变量之一(x )

在一元回归中,绘制残差平方和和y 的拟合值的图与绘制残差平方和与解释变量的图是等价

的,但是在多元回归中则不是这样。

2)正式方法 Park Test

The Park test (1966) is a special case of the general test proposed by A.C. Harvey (1976). Park formalizes the graphical method by suggesting that 2

i σ is some function of the explanatory variable i x . The function form he suggested was

22i

v i i x e βσσ= 11.5.1

or

22ln ln ln i i i x v σσβ=++

where i v is the stochastic disturbance term. Since

2i σ is generally not known, Park suggests using 2i e as a proxy and running the following

regression:

22ln ln ln ln i i i i i e x v x v σβαβ=++=++ 11.5.2

假如β统计显著,意味着数据中存在异方差;假如β统计不显著,就接受同方差的假定。 所以,Park test 是一个两阶段方法:在第一阶段,不考虑异方差进行OLS 回归

12i i i y x ββε=++;第二阶段利用第一阶段获得的残差回归11.5.2模型。

Park 给出的方程形式只是一个建议,我们也可以用2

i e 代替2

ln i e 作为被解释变量,这样系数的显著性有可能发生改变。

Glejser Test

Glejser test (1969) is similar in spirit to the Park test. After obtaining the residuals from the OLS

regression, Glejser suggests regressing the absolute value of i e on the x variable that is thought to be closely associated with

2i σ

. In his experiments, Glejser use the following functional forms:

121i i i i i i i i i i

e x v e v v v e v ββββ=++=+++=+

where i v is the error term.

Glejser 已经发现,在大样本的情况下,前四个模型在检测异方差时效果理想。因此我们可以把Glejser test 用作大样本的异方差检测,在小样本的情况下可以作为检测异方差的一个定性指标。

Spearman’s Rank Correlation Test

斯皮尔曼秩序相关系数检验法

We defined the Spearman’s rank correlation coefficient as

()22

161i s d r n n

=??

∑ 11.5.6 Assume 12i i i y x ββε=++,

Step 1: Fit the regression to the data on y and x and obtain the residuals i e .

Step 2: Rank both i e and i x (or

i y ) according to an ascending or descending order. 两个变量所排序列的序号之差就是i d ,n 是观察值的个数,这样就可以计算11.5.6了。 Step 3: Assuming that the population rank correlation coefficient s ρ is zero and n>8, the significance of the sample s r can be tested by the t test as follows

t =

11.5.7

with df=n-2.

假如t 值超过临界t 值,接受异方差的假设;否则,拒绝异方差。

Goldfeld-Quandt Test

这是一个流行的方法,但是必须假定2

i σ与解释变量之一是正相关的。 仍旧以一元回归为例12i i i y x ββε=++, 假定2

2

2

i i x σσ= 11.5.10 这里2σ是常数。

Goldfeld 和Quandt 检测异方差的步骤如下:

Step 1: Order or rank the observations according to the values of i x , beginning with the lowest x value.

Step 2: Drop middle c (central) observations, where c is specified a priori, and divide the remaining (n-c) observations into two groups each of (n-c)/2 observations.

Step 3: Fit the separate OLS regression to the first (n-c)/2 observations and the last (n-c)/2 observations, and obtain the respective residual sums of squares RSS1 and RSS2, RSS1 representing the RSS from the regression corresponding to the smaller xi values (the small variance group) and RSS2 that from the larger xi values (the larger variance group). These RSS each have

()2

n c K ?? df

where K is the number of parameters to be estimated, including the intercept. Step 4: Compute the ratio

21/df

/df

RSS RSS λ=

11.5.11

If

i ε are assumed to be normally distributed, which we usually do, and if the assumption of

homoscedasticity is valid, then it can be shown that λ of 11.5.11 follows the F distribution with

numerator and denominator df each of (n-c-2K)/2.

If the computed λ (=F) is greater than the critical F at the chosen level of significance, we can reject the hypothesis of homoscedasticity, that is, we can say that heteroscedasticity is very likely. (In fact, the null hypothesis here is that the variances of the two groups are the same, i.e., homoscedasticity)

Breusch-Pagan-Godfrey Test

上述Goldfeld-Quandt test 能否成功检验不仅依赖于c 值而且也依赖于如何在多个解释变量中选择正确的解释变量进行排序。如果使用Breusch-Pagan-Godfrey (BPG) Test 可以克服这个局限。

以K 变量回归模型为例,

12233,i i i K i K i y x x x ββββε=+++++ 11.5.12

Assume that the error variance is described as

()2122i i m im f Z Z σααα=+++ 11.5.13

that is,

2i σ is some function of the nonstochastic variable Z’s; some or all of the x’s can serve as

Z’s.

Specially, assume that

2122i i m im Z Z σααα=+++ 11.5.14

that is, 2i σ is a linear function of the Z’s.

if

230m ααα==== , 21i σα=, which is constant. Therefore, to test whether 2i σ is

homoscedasticity, one can test the hypothesis that 230m ααα==== . This is the basic idea

behind the Breusch-Pagan-Godfrey test.

BPG 检验步骤如下:

Step 1: Estimate 11.5.12 by OLS and obtain the residuals 12,,,n e e e .

Step 2: Obtain 22

/i

e

n σ

=∑, which is the ML estimator of 2σ.

Step 3: Construct variables i p defined

as 22/i i p e σ

= Step 4: Regress i p thus constructed on the Z’s as

122i i m im i p Z Z v ααα=++++ 11.5.15

where i v is the residual term of this regression.

Step 5: Obtain the ESS (explained sum of squares) from 11.5.15 and define

1

2

ESS Θ=

11.5.16

Assuming

i ε are normally distributed, one can show that if there is homoscedasticity and if the

sample size n increases indefinitely, then

2

1m asy

χ?Θ~ 11.5.17 Therefore, if the computed Θ exceeds the critical

2χ value at the chosen level of significance,

one can reject the hypothesis of homoscedasticity; otherwise one does not reject it.

White’s General Heteroscedasticity Test 以三变量模型为例,

12233i i i i y x x βββε=+++ 11.5.21

White’s general heteroscedaticity test 步骤如下: Step 1: Estimate 11.5.21 and obtain the residuals i e . Step 2: Then run the following auxiliary regression

222122334253623i i i i i i i i e x x x x x x v αααααα=++++++ 11.5.22

Higher powers of regressors can also be introduced. Note that there is a constant term in this equation even though the original regression may or may not contain it. Obtain the R 2 from this auxiliary regression.

If all the partial slope coefficients in this regression are simultaneously equal to zero, then the error variance is the homoscedasticity constant equal to

1α.

Step 3: Under the null hypothesis that there is no heteroscedasticity , it can be shown that sample size n times the R 2 obtained from the auxiliary regressions asymptotically follows the chi-squre distribution with df equal to the number of regressors (excluding the constant term) in the auxiliary regression. That is,

22

df asy

nR x ~ 11.5.23

Step 4: If the chi-square value obtained in 11.5.23 exceeds the critical chi-square value at the chosen level of significance, the conclusion is that there is heteroscedasticity. If it does not exceed the critical chi-square value, there is no heteroscedasticity, which is to say that in the auxiliary regression, 234560ααααα=====.

Koenker-Bassett Test

The advantage of Koenker-Basssett (KB) test is its simplicity. For the K-variable model,

112233,i i i i K i K i y x x x x ββββε=+++++ 11.5.26

We estimate this model, obtain i e from this model, and then estimate

()

2

212i

i i

e y v αα=++ 11.5.27

where

i y are the estimated values from the model 11.5.26. The null hypothesis is that

2α=0.

The null hypothesis can be tested by the usual t test or the F test.

If this is not rejected, then one could conclude that there is no heteroscedasticity.

6、异方差校正

补救有两种方法,分别基于2

i σ已知和未知。 1)异方差已知:WLS

As stated previously, if 2

i σ is known, the most straightforward method of correcting heteroscedasticity is by means of weighted least squares (WLS), for the estimators thus obtained are BLUE.

2)异方差未知

White’s Heteroscedasticity-Consistent Variance and Standard Errors

If the sample is large, one can obtain White’s heteroscedasticity corrected standard errors of OLS estimators and conduct statistical inference based on these standard errors.

Nowadays, several computer packages present White’s heteroscedasticity-corrected variances and standard errors along with the usual OLS variances and standard errors. White’s heteroscedasticity-corrected variances and standard errors are also known as White’s heteroscedasticity-consistent covariance matrix estimators , or White’s robust standard errors

White’s procedure

First consider the two-variable model

12i i i y x ββε=++, ()()22var i i i E εεσ==

1

As shown in 11.2.2,

()()()2

2222

var i

i i x x b x x σ ? = ?

∑∑

11.2.2 2 Since

2i σ are not directly observable, White suggest using 2i e in place of 2i σ and estimate the

()2var b as follows:

()()()2222

2var i

i i x x e b x x ? = ?

∑∑

3

White has shown that (3) is a consistent estimatorof (2), that is, as the sample size increase

indefinitely, (3) converges to (2).

If the package does not include White’s robust standard errors procedure, we can do it as shown in (3) by first running the usual OLS regression, obtaining the residuals from this regression and then using formula (3).

Then generalize White’s procedure to the K-variable regression model

12233,i i i K i K i y x x x ββββε=+++++

4

The variance of any partial regression coefficient is obtained as follows:

() ()

22

22var ij i j ij

w e b w =

∑∑ 5

where i e are the residuals obtained from the (original) regression (4) and j w

are the residuals obtained from the (auxiliary) regression of the regressor j x on the remaining regressors in (4).

Transform data to reflect heteroscedasticity pattern

We now consider several assumptions about the patterns of heteroscedasticity; the two-variable model 12i i i y x ββε=++ is exemplified again.

Assumption 1: The error variance is proportional to 2

i x :

()222i i E x εσ=

11.6.5

In this case, one may transform the original model by dividing it by xi:

12121

i i i i i i i

y v x x x x εββββ=++=++ 11.6.6 where i v is the transformed disturbance term. Now it is easy to verify that

()()2

22221

11.6.5i i i i i E v E E x x εεσ ===←

Hence the variance of i v is now homoscedastic, and one may proceed to apply OLS to the transformed equation 11.6.6.

Assumption 2: The error variance is proportional to i x . The square root transformation :

()22i i E x εσ=

11.6.7

In this case, the original model can be transformed as follows:

1

i v βββ=+=+ 11.6.8

where i x >0.

Given assumption 2, one can readily verify that ()2

2

i

E v σ

=, a homoscedasticity situation.

Therefore, one may proceed to apply OLS to 11.6.8.

Assumption 3: The error variance is proportional to the squares of the mean value of y.

()()2

22i i E E y εσ=

11.6.9

Now

()12i i E y x ββ=+

Therefore, if we transform the original equation as follows,

()()()()()()

1

21

21

i i i i i i i i i

i i y x E y E y E y E y x v E y E y εββββ=++=++ 11.6.10

It can be seen that ()2

2

i

E v σ

=; that is, the disturbances i v are homoscedastic. Hence, it is

regression 11.6.10 that will satisfy the homoscedasticity assumption of the CLRM.

The transformation 11.6.10 is, however, inoperational because ()i E y are unknown. Of course,

we know

i y is an estimator of ()i E y . Therefore, we may proceed in two steps:

First, we run the usual OLS regression, disregarding the heteroscedasticity, and obtain

i y . Then, using i y , we transform our model as follows:

121i

i

i i i i y x v y y y ββ

=++

11.6.11

In step 2, we run the regression 11.6.11. Although i y are not exactly ()i E y , they are consistent estimator; that is, as the sample size increases indefinitely, they converge to true

()i E y .

Hence, the transformation of 11.6.11 will perform satisfactorily in practice if the sample size is reasonably large.

Assumption 4: A log transformation such as

12ln ln i i i y x ββε=++ 11.6.12

very often reduces heteroscedasticity when compared with the regression 12i i i y x ββε=++.

Advantages of using this transformation:

This result arises because log transformation compresses the scales in which the variables are measured.

An additional advantage of the log transformation is that the slope coefficient

2β measures the

elasticity of y with respect to x. It is one reason why the log models are quite popular in empirical econometrics.

(陈诗一)

计量经济学讲义第二讲(共十讲)

第二讲 普通最小二乘估计量 一、基本概念:估计量与估计值 对总体参数的一种估计法则就是估计量。例如,为了估计总体均值为u ,我们可以抽取一个容量为N 的样本,令Y i 为第i 次观测值,则u 的一个很自然的 估计量就是?i Y u Y N ==∑。A 、B 两同学都利用了这种 估计方法,但手中所掌握的样本分别是12(,,...,)A A A N y y y 与12(,,...,)B B B N y y y 。A 、B 两同学分别计算出估计值 ?A i A y u N =∑ 与?B i B y u N =∑ 。因此,在上例中,估计量?u 是随机的,而??,A B u u 是该随机变量可能的取值。估计量 所服从的分布称为抽样分布。 如果真实模型是:01y x ββε=++,其中01,ββ是待估计的参数,而相应的OLS 估计量就是: 1 01 2 ()???;() i i i x x y y x x x βββ-==--∑∑ 我们现在的任务就是,基于一些重要的假定,来考察上述OLS 估计量所具有的一些性质。 二、高斯-马尔科夫假定

●假定一:真实模型是:01y x ββε=++。有三种 情况属于对该假定的违背:(1)遗漏了相关的解释变量或者增加了无关的解释变量;(2)y 与x 间的关系是非线性的;(3)01,ββ并不是常数。 ●假定二:在重复抽样中,12(,,...,)N x x x 被预先固定 下来,即12(,,...,)N x x x 是非随机的(进一步的阐释见附录),显然,如果解释变量含有随机的测量误差,那么该假定被违背。还存其他的违背该假定的情况。 笔记: 12(,,...,)N x x x 是随机的情况更一般化,此时,高斯-马尔科夫假定二被更改为:对任意,i j ,i x 与j ε不相关,此即所谓的解释变量具有严格外生性。显然,当12(,,...,)N x x x 非随机时,i x 与j ε必定不相关,这是因为j ε是随机的。 ●假定三:误差项期望值为0,即 ()0,1,2i E i N ε==。 笔记: 1、当12(,,...,)N x x x 随机时,标准假定是: 12(,,...,)0,1,2,...,i N E x x x i N ε== 根据迭代期望定律有:12[(,,...,)]()i N i E E x x x E εε=,因 此,如果12(,,...,)0i N E x x x ε=成立,必定有:()0i E ε=。

古扎拉蒂计量经济学英文第四版课后习题数据

古扎拉蒂《计量经济学》(英文第四版)课后习题数据Yen-Dollar Yen/Dollar Exchange Rate, January 1971 to December 1998 Ex = Yen/$ Time: 1 = January 1971 336 = December 1998 TIME E X 1 358.02 2 357.55 3 357.52 4 357.5 5 357.41 6 357.41 7 357.4 8 355.78 9 338.02 10 331.11 11 328.75 12 320.07 13 312.72 14 305.19 15 302.54 16 303.56 17 304.38 18 302.41 19 301.03 20 301.16 21 301.12 22 301.01 23 300.99 24 301.24 25 301.79 26 278.42 27 261.9 28 265.49

30 264.5 31 264.55 32 265.22 33 265.47 34 266.33 35 278.26 36 280.18 37 298.13 38 291.09 39 282.16 40 277.77 41 278.97 42 282.97 43 290.98 44 302.28 45 299.08 46 299.36 47 300.08 48 300.41 49 299.68 50 291.66 51 287.95 52 292.2 53 291.43 54 293.47 55 296.37 56 297.98 57 299.91 58 302.34 59 302.55 60 305.67 61 304.64 62 301.59 63 300.52 64 299.11 65 299 66 299.19 67 294.64 68 290.63 69 287.36 70 291.19 71 295.17 72 294.7

计量经济学讲义共十讲

计量经济学讲义共十讲文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

第一讲 普通最小二乘法的代数 一、 问题 假定y 与x 具有近似的线性关系:01y x ββε=++,其中ε是随机误差项。我们对01ββ、这两个参数的值一无所知。我们的任务是利用样本数据去猜测01ββ、的取值。现在,我们手中就有一个样本容量为N 的样本,其观测值是:1122(,),(,),...,(,)N N y x y x y x 。问题是,如何利用该样本来猜测01ββ、的取值 为了回答上述问题,我们可以首先画出这些观察值的散点图(横轴x ,纵轴y )。既然y 与x 具有近似的线性关 系,那么我们就在图中拟合一条直线:01 ???y x ββ=+。该直线是对y 与x 的真实关系的近似,而0 1 ??,β β分别是对01 ,ββ的猜测(估计)。问题是,如何确定0?β与1 ?β,以使我们的猜测看起来是合理的呢 笔记: 1、为什么要假定y 与x 的关系是0 1y x ββε=++呢一种合理的解释 是,某一经济学理论认为x 与y 具有线性的因果关系。该理论在讨论x 与y 的关系时认为影响y 的其他因素是不重要的,这些因素对y 的影响即为模型中的误差项。 2、0 1y x ββε=++被称为总体回归模型。由该模型有: 01E()E()y x x x ββε=++。既然ε代表其他不重要因素对y 的影 响,因此标准假定是:E()0x ε=。故进而有:

01E()y x x ββ=+,这被称为总体回归方程(函数),而 01 ???y x ββ=+相应地被称为样本回归方程。由样本回归方程确定的?y 与y 是有差异的,?y y -被称为残差?ε。进而有:0 1 ???y x ββε=++,这被称为样本回归模型。 二、 两种思考方法 法一: 12(,,...,)N y y y '与12???(,,...,)N y y y '是N 维空间的两点,0 ?β与1 ?β的选择应该是这两点的距离最短。这可以归结为求解一个数学问题: 由于?i i y y -是残差?i ε的定义,因此上述获得0?β与1 ?β的方法即是0 ?β 与1 ?β的值应该使残差平方和最小。 法二: 给定i x ,看起来i y 与?i y 越近越好(最近距离是0)。然而,当你选择拟合直线使得i y 与?i y 是相当近的时候,j y 与?j y 的距离也许变远了,因此存在一个权衡。一种简单的权衡方式是,给定12,,..,N x x x ,拟合直线的选择应该使1y 与 2?y 、2y 与2?y 、...、N y 与?N y 的距离的平均值是最小的。距离是一个绝对值,数学处理较为麻烦,因此,我们把第二种思考方法转化求解数学问题: 由于N 为常数,因此法一与法二对于求解0?β与1 ?β的值是无差异的。 三、 求解

《计量经济学》考试复习资料-11页

《计量经济学》期末考试复习资料 第一章绪论 参考重点: 计量经济学的一般建模过程 第一章课后题(1.4.5) 1.什么是计量经济学?计量经济学方法与一般经济数学方法有什么区别? 答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。 计量经济学方法揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述;一般经济数学方法揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。 4.建立与应用计量经济学模型的主要步骤有哪些? 答:建立与应用计量经济学模型的主要步骤如下:(1)设定理论模型,包括选择模型所包含的变量,确定变量之间的数学关系和拟定模型中待估参数的数值范围;(2)收集样本数据,要考虑样本数据的完整性、准确性、可比性和—致性;(3)估计模型参数;(4)检验模型,包括经济意义检验、统计检验、计量经济学检验和模型预测检验。 5.模型的检验包括几个方面?其具体含义是什么? 答:模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否与根据人们的经验和经济理论所拟订的期望值相符合;在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质;在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性

检验等;模型的预测检验主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。 第二章 经典单方程计量经济学模型:一元线性回归模型 参考重点: 1.相关分析与回归分析的概念、联系以及区别? 2.总体随机项与样本随机项的区别与联系? 3.为什么需要进行拟合优度检验? 4.如何缩小置信区间?(P46) 由上式可以看出(1).增大样本容量。样本容量变大,可使样本参数估计量的标准差减小;同时,在同样置信水平下,n 越大,t 分布表中的临界值越小。(2)提高模型的拟合优度。因为样本参数估计量的标准差和残差平方和呈正比,模型的拟合优度越高,残差平方和 αβββββαα-=?+<

古扎拉蒂-经济计量学习题标准答案

部分作业答案:(各题只要回答到如下程度就是满分哦) 第1章 概论 一、填空 1。 近似,散点; 2. 平均值,平均值 第2章 线性回归的基础理论 一、填空 1. 因变量Y ,解释变量X 二、单项选择题 1-2 AB 三、名词解释 总体:实验所有可能结果的集合称为总体或样本空间. 样本:也叫样本点,是指总体的某个元素或某种结果。 随机实验:至少有两个可能的结果,但不确定哪一个结果会出现的某个观察或测度过程. 估计量:是指总体参数的估计方法或计算公式. 估计值:估计量的某一具体取值称为估计值. 变量线性:是指因变量的条件均值是解释变量的线性函数。 参数线性:是指因变量的条件均值是参数B 的线性函数,而变量之间不一定是线性的。 四、简述 1。 答:14世纪英国逻辑学家奥卡姆提出简单有效原理,即“如无必要,勿增实体”,亦即“切勿浪费较多东西去做用较少的东西同样可以做好的事情”.因此,模型应尽量简化,只要不遗漏重要变量即可,即便某些变量对Y 有影响,但它们的综合影响如果是有限的,非随机的,都可以不予考虑,即归入u 中。 2. 答:对双变量回归模型而言,如果总体回归线接近于直线,可用函数表示为E (Y ︱X i )=B 1+B 2X i ,其中,B 1为截距,B 2为斜率,该函数就称为非随机总体回归函数。它表示在给定X 的条件下,Y 分布的均值. 对双变量回归模型而言,如果总体回归线接近于直线,回归方程可表示为Y i =B 1+B 2X i +u i ,其中,B 1+B 2X i 表示在给定X 的条件下Y 分布的均值,u i 为随机误差项。它表示真实的Y 值是如何在均值附近波动的。 对双变量回归模型而言,若样本回归线接近于直线,则非随机样本回归函数可表示为?i Y =b 1+b 2X i ,其中,?i Y =总体条件均值E (Y ︱X i )的估计量,b 1=真实截距B 1的估计量,b 2=真实斜率B 2的估计量. 对双变量回归模型而言,若样本回归线接近于直线,则随机样本回归函数可表示为Y i =b 1+b 2X i +e i ,其中,b 1+b 2X i 表示总体条件均值E (Y ︱X i )的估计量,e i 表示误差项u i 的样本估计量,称为残差。 五、论述题 什么是普通最小二乘法?(按教材内容回答,不必按讲义,因它太细了) 答:回归分析的目的是根据SRF (样本回归函数)估计PRF (总体回归函数),普通最小二乘法是获得SRF 最主要的方法。 随机PRF(Y i =B 1+B 2X i +u i )不能直接观察,但能通过随机SRF (Y i =b 1+b 2X i +e i )估计.由 SRF 得e i =Y i -b 1-b 2X i ,而?i Y =b 1+b 2X i ,因此,e i =Y i —?i Y =实际的Y i —估计的Y i .残差的绝对值越

(新)计量经济学讲义第一讲(共十讲)

第一讲 普通最小二乘法的代数 一、 问题 假定y 与x 具有近似的线性关系:01y x ββε=++,其中ε是随机误差项。我们对01ββ、这两个参数的值一无所知。我们的任务是利用样本数据去猜测01ββ、的取值。现在,我们手中就有一个样本容量为N 的样本,其观测值是:1122(,),(,),...,(,)N N y x y x y x 。问题是,如何利用该样本来猜测01ββ、的取值? 为了回答上述问题,我们可以首先画出这些观察值的散点图(横轴x ,纵轴y )。既然y 与x 具有近似的线性关系,那么我们就在图中拟合一条直线: 1 ???y x ββ=+。该直线是对y 与x 的真实关系的近似,而01??,ββ分别是对01 ,ββ的猜测(估计)。问题是,如何确定0 ?β 与1 ?β,以使我们的猜测看起来是合理的呢? 笔记: 1、为什么要假定y 与x 的关系是0 1y x ββε=++呢?一种合 理的解释是,某一经济学理论认为x 与y 具有线性的因果关系。该理论在讨论x 与y 的关系时认为影响y 的其他因素是不重要的,这些因素对y 的影响即为模型中的误差项。 2、 01y x ββε=++被称为总体回归模型。由该模型有: 01E()E()y x x x ββε=++。既然ε代表其他不重要因素对y

的影响,因此标准假定是:E()0x ε=。故进而有: 01E()y x x ββ=+,这被称为总体回归方程(函数),而01 ???y x ββ=+相应地被称为样本回归方程。由样本回归方程确定的 ?y 与y 是有差异的,?y y -被称为残差?ε。进而有:01 ???y x ββε=++,这被称为样本回归模型。 二、 两种思考方法 法一: 12(,,...,)N y y y '与12???(,,...,)N y y y '是N 维空间的两点,0 ?β 与1 ?β的选择应该是这两点的距离最短。这可以归结为求解一个数学问题: 01012201????,,11 ???()()N N i i i i i i Min y y Min y x ββββββ==-=--∑∑ 由于?i i y y -是残差?i ε的定义,因此上述获得0 ?β与1?β的方法即是0 ?β 与1 ?β的值应该使残差平方和最小。 法二: 给定i x ,看起来i y 与?i y 越近越好(最近距离是0)。然而,当你选择拟合直线使得i y 与?i y 是相当近的时候,j y 与?j y 的距离也许变远了,因此存在一个权衡。一种简单的权衡方式是,给定12,,..,N x x x ,拟合直线的选择 应该使1y 与2?y 、2y 与2?y 、...、N y 与?N y 的距离的平均值是最小的。距离是一个绝对值,数学处理较为麻烦,

中级计量经济学讲义_第一章引言

《中级计量经济学》 蒋岳祥 第一章引言 1.1什么是计量经济学? 计量经济学是由挪威经济学家R.Fisher在三十年代首先创立的一门学科,是关于运用统计方法测量经济关系的艺术与科学,已经成为现代经济学的重要组成部分之一。 如果要给计量经济学(Econometrics)下一个较为确切的定义,我们可以这样界定:计量经济学是这样一门学科,它根据以往历史的经济资料与数据,从经济理论出发,运用数理统计的分析方法对经济关系建立经济计量模型,并依据所建立的模型对经济系统进行结构分析,经济预测和政策评价。所以计量经济学涉及数学学科中的统计学领域和经济学领域,统计学与经济理论是计量经济学的两块基石。 经济现象包罗万象,影响经济的因素有很多,如果我们企图将所有的因素作为研究的对象,我们可能什么结论也得不到,研究经济问题的一般方法是:我们总是选用最重要的因素变量而屏弃一些非本质的因素(变量),还需要了解哪些经济现象是有待解释的,哪些重要因素是有助于解释这些经济现象的,如何度量量化那些因素,并努力寻求它们之间存在的数量关系,并用统计推断来检验这些关系,故一般建立计量经济模型的过程与方法是:

计量经济模型建立,求解,解释过程图 2

1.2 计量经济模型(Econometric Modeling)实例 学过经济学中凯恩斯经济理论的人都知道,理论上说消费和收入存在着密切的联系,如果C 表示消费,Y 表示收入。则C 与Y 的关系,可用消费函数表示: C=f (Y ) (1) 这样的函数满足: 1)边际消费倾向(MPC )dY dC 位于0和1之间,即 0< dY dC <1; 2)平均消费倾向(APC ) Y C 是随着收入的增加而减少。 我们不妨将第二个条件作些化解,这个条件用数学语言表示是:dY Y C d ??? ??<0, 而 C Y Y dY dC dY Y C d dY Y C d 2 111- ? = ? ?? ?? ?= )(1)( 1APC MPC Y Y C dY dC Y -=-?= <0 即MPC <APC 。 在现实经济社会中,消费与收入之间的关系很难确切地用方程(1)表示收入,我们所能采集到的数据往往受到这样那样的影响,我们可用随机扰动ε来表示这些影响,所以,我们要对方程(1)要作适当调整,于是消费和收入之间的关系可以写成如下形式: ),(εY f C = (2) 其中ε是随机扰动。 满足凯恩斯条件的)(ε?Y f 很多,无法枚举穷尽,但我们可以大致将它们分为线性模型与非线性模型两类。 [例1]线性模型(Linear Model) 方程(2)的一个最简单的情况,是C 与Y 的线性关系,即 C=α+βY+ε (3) 其中0<β<1,α>0 如果我们现在从历史记录中或观察到N 个样本,即(Y t ,C t ),t=1.2,……N ,于是我们有如下一组方程:

古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解

引言 0.1 复习笔记 一、计量经济学 1.定义 计量经济学,是对经济学的作用存在某种期待的结果,它把数理统计学应用于经济数据,以使数理经济学构造出来的模型得到经验上的支持,并获得数值结果。 计量经济学可定义为实际经济现象的数量分析。这种分析基于理论与观测的并行发展,而理论与观测又通过适当的推断方法得以联系。 计量经济学可定义为这样的社会科学:它把经济理论、数学和统计推断作为工具,应用于经济现象的分析。 2.研究对象和研究方法 计量经济学研究经济定律的经验判定。计量经济学家的艺术,就在于找出一组足够具体且足够现实的假定,使他尽可能最好地利用他所获得的数据。 计量经济学的研究方法是,利用统计推断的理论和技术作为桥头堡,以达到经济理论和实际测算相衔接的目的。 二、计量经济学是一门单独的学科 计量经济学值得作为一门独立的学科来研究,理由如下: 1.经济理论所作的陈述或假说大多数是定性的。计量经济学家的工作就是要提供这一数值估计。换言之,计量经济学对大多数的经济理论赋予经验内容。 2.数理经济学的主要问题,是要用数学形式(方程式)来表述经济理论,而不管该理论是否可以量化或是否能够得到实证支持。计量经济学家常常使用数理经济学家所提供的数学方程式,但要把这些方程式改造成适合于经验检验的形式。这种从数学方程到计量经济方程的转换需要有许多的创造性和实际技巧。 3.经济统计学的问题,主要是收集、加工并通过图表的形式来展现经济数据。但是,经济统计学家不考虑怎样利用所收集来的数据去检验经济理论。 三、计量经济学方法论 大致说来,传统的计量经济学方法论按如下路线进行: 1.理论或假说的陈述; 2.理论的数学模型设定; 3.统计或计量经济模型设定; 4.获取数据; 5.计量经济模型的参数估计; 6.假设检验; 7.预报或预测; 8.利用模型进行控制或制定政策。 四、计量经济学的类型 计量经济学可划分为两大类:理论计量经济学(theoretical econometrics)和应用计量经济学(applied econometrics)。在每一大类中均可按经典方法(classical)或贝叶斯方法(Bayesian)进行研究。 理论计量经济学是要找出适当的方法,去测度由计量经济模型设定的经济关系。为此,计量经济学家非常依赖于数理统计。 在应用计量经济学中,利用理论计量经济学工具去研究经济学或管理学中的某些特殊领域。 0.2 课后习题详解 本章没有课后习题。本章是全书的一个引言,对计量经济学这门学科作一个简要介绍。对于本章内容,学员简单了解即可。

计量经济学讲义

计量经济学讲义 第四讲 趋势和DF 检验(修订版) 此翻译稿制作学习之用,如有错误之处,文责自负。 趋势平稳序列(TS )(图1和2) 一个趋势平稳序列绕着一个确定的趋势(序列的均值),其波动幅度不显示增大或者减小的趋势。 线性确定性趋势: t t t y εβα++= ),0(~2 σεiid t t=1,2,… 平方确定性趋势: t t t t y εγβα+++=2 ),0(~2 σεiid t t=1,2,… 通常: t t t f y ε+=)( ),0(~2 σεiid t t=1,2,… 均值是是随时间变化的(川),但是方差是常数。t ε可以为任意平稳序列,也就是说,不一定要是白噪声过程。 通过拟合一个确定的多项式时间趋势,趋势可以来消除:拟合趋势后残差将给出一个去趋势的序列。 一个带线性确定性趋势AR (1)过程可以写作: t 1-t 1t )1)-t (y (t y εβαφβα+--=-- ),0(~2 σεiid t t=1,2,… 此处确定性趋势被t y 减去。然而在实践中,α、β是未知的而且必须估计出来。于是模型可以被重述为: t 1-t 1111t y t )1()1(y εφβφβφαφ++-++-= 其中包含一个截距和一个趋势,也就是 t 1-t 1* *t y t y εφβα+++= 此处 βφαφα11*)1(+-= 且 βφβ)1(1* -= 若1||1<φ,那么此AR 过程就是围绕一个确定性趋势的平稳过程. 差分平稳序列(DF )(也叫单整序列)和随机性趋势 如果一个非平稳序列可以由一个平稳序列通过d 次差分得到,那么我们说这个序列就是d 阶单整的,写做I (d ).这一过程也因此叫做差分平稳过程(DSP ). 因此,平稳序列就是零阶单整的,I (0)。白噪声序列是I (0)。 所以如果序列t d t y w ?=是平稳的,那么t y 就是I (d )。?是差分算子,即 等等2-t 1-t t 2-t 1-t 1-t t 1-t t t t 21-t t t y 2y y )y y ()y y ()y y (y y ,y y y +-=---=-?=??=?-=? 如果序列 1-t t t t y y y w -=?= 是平稳的话,t y 是I (1); 如果序列2-t 1-t t t 2 t y 2y y y w +-=?= 是平稳的,t y 是I (2),

计量经济学讲义

计量经济学讲义

计量经济学讲义 第四讲 趋势和DF 检验(修订版) 此翻译稿制作学习之用,如有错误之处,文责自负。 趋势平稳序列(TS )(图1和2) 一个趋势平稳序列绕着一个确定的趋势(序列的均值),其波动幅度不显示增大或者减小的趋势。 线性确定性趋势: t t t y εβα++= ) ,0(~2σεiid t t=1,2,… 平方确定性趋势: t t t t y εγβα+++=2 ) ,0(~2σεiid t t=1,2,… 通常: t t t f y ε+=)( ) ,0(~2σεiid t t=1,2,… 均值是是随时间变化的(川),但是方差是常数。t ε可以为任意平稳序列,也就是说,不一 定要是白噪声过程。 通过拟合一个确定的多项式时间趋势,趋势可以来消除:拟合趋势后残差将给出一个去趋势的序列。 一个带线性确定性趋势AR (1)过程可以写作: t 1-t 1t )1)-t (y (t y εβαφβα+--=-- ) ,0(~2σεiid t 版权所

t=1,2,… 此处确定性趋势被t y 减去。然而在实践中,α、 β 是未知的而且必须估计出来。于是模型可以被 重述为: t 1-t 1111t y t )1()1(y εφβφβφαφ++-++-= 其中包含一个截距和一个趋势,也就是 t 1 -t 1 * * t y t y εφβα+++= 此处 β φαφα11* )1(+-= 且 β φβ)1(1*-= 若1 ||1 <φ ,那么此AR 过程就是围绕一个确定性 趋势的平稳过程. 差分平稳序列(DF )(也叫单整序列)和随机性趋势 如果一个非平稳序列可以由一个平稳序列通过d 次差分得到,那么我们说这个序列就是d 阶单整的,写做I (d ).这一过程也因此叫做差分平稳过程(DSP ). 因此,平稳序列就是零阶单整的,I (0)。白噪声序列是I (0)。 所以如果序列t d t y w ?=是平稳的,那么t y 就是I (d )。? 是差分算子,即 等等 2-t 1-t t 2-t 1-t 1-t t 1-t t t t 21-t t t y 2y y )y y ()y y ()y y (y y ,y y y +-=---=-?=??=?-=?

古扎拉蒂-经济计量学习题答案

部分作业答案:(各题只要回答到如下程度就是满分哦) 第1章 概论 一、填空 1. 近似,散点; 2. 平均值,平均值 第2章 线性回归的基础理论 一、填空 1. 因变量Y ,解释变量X 二、单项选择题 1-2 AB 三、名词解释 总体:实验所有可能结果的集合称为总体或样本空间。 样本:也叫样本点,是指总体的某个元素或某种结果。 随机实验:至少有两个可能的结果,但不确定哪一个结果会出现的某个观察或测度过程。 估计量:是指总体参数的估计方法或计算公式。 估计值:估计量的某一具体取值称为估计值。 变量线性:是指因变量的条件均值是解释变量的线性函数。 参数线性:是指因变量的条件均值是参数B 的线性函数,而变量之间不一定是线性的。 四、简述 1. 答:14世纪英国逻辑学家奥卡姆提出简单有效原理,即“如无必要,勿增实体”,亦即“切勿浪费较多东西去做用较少的东西同样可以做好的事情”。因此,模型应尽量简化,只要不遗漏重要变量即可,即便某些变量对Y 有影响,但它们的综合影响如果是有限的,非随机的,都可以不予考虑,即归入u 中。 2. 答:对双变量回归模型而言,如果总体回归线接近于直线,可用函数表示为E(Y ︱X i )=B 1+B 2X i ,其中,B 1为截距,B 2为斜率,该函数就称为非随机总体回归函数。它表示在给定X 的条件下,Y 分布的均值。 对双变量回归模型而言,如果总体回归线接近于直线,回归方程可表示为Y i =B 1+B 2X i +u i ,其中,B 1+B 2X i 表示在给定X 的条件下Y 分布的均值,u i 为随机误差项。它表示真实的Y 值是如何在均值附近波动的。 对双变量回归模型而言,若样本回归线接近于直线,则非随机样本回归函数可表示为 ?i Y =b 1+b 2X i ,其中,?i Y =总体条件均值E(Y ︱X i )的估计量,b 1=真实截距B 1的估计量,b 2=真实斜率B 2的估计量。 对双变量回归模型而言,若样本回归线接近于直线,则随机样本回归函数可表示为Y i =b 1+b 2X i +e i ,其中,b 1+b 2X i 表示总体条件均值E(Y ︱X i )的估计量,e i 表示误差项u i 的样本估计量,称为残差。 五、论述题 什么是普通最小二乘法?(按教材内容回答,不必按讲义,因它太细了) 答:回归分析的目的是根据SRF (样本回归函数)估计PRF (总体回归函数),普通最小二乘法是获得SRF 最主要的方法。 随机PRF (Y i =B 1+B 2X i +u i )不能直接观察,但能通过随机SRF (Y i =b 1+b 2X i +e i )估计。 由SRF 得e i =Y i -b 1-b 2X i ,而?i Y =b 1+b 2X i ,因此,e i =Y i -?i Y =实际的Y i -估计的Y i 。残差的绝对

经济计量学精要(第4版)(美)古扎拉蒂

??经济计量学精要(第4版)/(美)古扎拉蒂 大佬点个赞支持一下呗ヽ(′▽`)ノヽ(′▽`)ノヽ(′▽`)ノ 经济计量学精要(第4版)/(美)古扎拉蒂 ? 综述 1.1 什么是经济计量学 1.2 为什么要学习经济计量学 1.3 经济计量学方法论 经济计量分析步骤: (1)建立一个理论假说 (2)收集数据 (3)设定数学模型 线性回归模型为例 线性回归模型中,等式左边的变量称为应变量,等式右边的变量称为自变量或解释变量。线性回归分析的主要目标就是解释一个变量(应变量)与其他一个或多个变量(解释变量)之间的行为关系。 简单数学模型 ? (4)设立统计或经济计量模型 误差项u

? u代表随机误差项,简称误差项。u包括了X以外其他所有影响Y,但并未在模型中具体体现的因素以及纯随机影响。 (5)估计经济计量模型参数 线性回归模型常用最小二乘法估计模型中的参数 ^读做"帽",表示某的估计值 (6)核查模型的适用性:模型设定检验 (7)检验源自模型的假设:假设检验 (8)利用模型进行预测 数据类型 时间序列数据:按时间跨度收集得到的 截面数据:一个或多个变量在某一时间点上的数据集合 合并数据:既包括时间序列数据又包括截面数据 面板数据:也称纵向数据、围观面板数据,即同一个横截面单位的跨期调查数据 模型因果关系 统计关系无论有多强,有多紧密,也决不能建立起因果关系,如果两变量存在因果关系,则一定建立在某个统计学之外的经济理论基础之上。 第一部分线性回归模型 2.1回归的含义 回归分析的主要目的:根据样本回归函数SRF估计总体回归函数PRF 2.2总体回归函数(PRF):假想一例 总体回归线给出了对应于自变量的每个取值相应的应变量的均值。(总体回归线表明了Y的均值与每个X的变动关系)PRL ? E(Y|xi)表示与给定x值相对应的Y的均值。下标i代表第i个子总体。 B1、B2称为参数,也称为回归系数。B1称为截距,B2称为斜率。斜率系数度量了X每变动一单位,Y( 条件)均值的变化率。 2.3总体回归函数的统计或随机设定 随机或统计回归总体函数PRF ? ui随机误差项,其值无法先验确定,通常用概率分布描述随机变量。 2.4 随机误差项的性质 误差项代表了未纳入模型变量的影响; 即使模型中包括了决定数学分数的所有变量,其内在随机性也不可避免;人类行为并不是完全可预测的或完全理性的。 因而,u反映了人类行为的这种内在随机性。 u还代表了度量误差,如数据的四舍五入; “奥卡姆剃刀原则”:描述应当尽量简单,只要不遗漏重要的信息。即使知道其他变量可能会对Y有影响,但这些变量的综合影响是有限的、非确定性的,可以把这些次要因素归人随机项u。 2.5 样本回归函数 样本回归函数SRF

计量经济学第八讲v

第八讲 平稳时间序列 在严格意义上,随机过程{}t X 的平稳性是指这个 过程的联合和条件概率分布随着时间t 的改变而保持不变。在实践中,我们更关注弱意义上的平稳或者所谓的协方差平稳: 2();();(,)t t t t j j E X Var X Cov X X μδδ+=== 显然20δδ=。 在本讲义中,平稳皆指协方差平稳。当上述条件中的任意一个被违背时,则称{}t X 是非平稳的。 (一)平稳随机过程的例子 1、白噪声过程{}t ε: 20()0;();(,)0,t t t t j j E Var Cov εεδεε+≠=== 笔记: 假定t ε还服从正态分布,则{}t ε被称为高斯白噪声。在正态分布下,独立与不相关是两个等价的概念,从而高斯白噪声{}t ε也属于严格白噪声。对于严格白噪声过程,有: , (12) ()()t t t t E E εεεε--=,。因此,就预测t ε来说,,1t i i ε-≥没有任何信息价值。当一个变量的当期及其过去值对预测变量未来值没有任何帮助时,我们常常称该变量是不可预测的。

2、AR(1)过程: 011,11t t t y a a y a ε<-=++,{}t ε是白噪声过程 为了验证上述过程满足平稳性条件,我们首先通过迭代得到:1 1 1 1 00 1 0t t i i t i i i t t y a a a y a ε---===++∑∑。接下来注意到, 1 1 1)0(t i i t t E y a a a y -==+∑,进一步假设数据生成过程发生了 很久,即t 趋于无穷大,则0 1 )1(t a E y a μ-==;其次也有 1 1 ()() t i t i i t Var y Var a ε--==∑,当t 趋于无穷大时, 2 12 2 1()11()i t Var a a Var y εδ-= - = ;最后,当t 趋于无穷大时,有: 1211111111222 (12411112) 1......(...) [()()] [()()]s s t t s t s t t s t s t s t t s s s s s a a a a a E y y E a a a a a μμδδεεεεεεε+-----------++- -+++++++++++= == 关于AR(p)过程的平稳性,见附录。下图是对一个 平稳AR(1)过程的模拟。 1,(0,1) 10.8t N ID t t t y y εε-+=+ 笔记:

计量经济学讲义第九讲(共十讲)

第九讲 协整与误差修正模型 一、协整的定义 假设时间序列12,,...,t t kt x x x 都属于d 阶单整序列I(d),即各时间序列在差分d 次后 将变为平稳序列。如果一非零的常数向量12)(,,...,k a a a '使得: 1212(),0...t t kt k x x x I d b b d a a a -<≤+++ 则称12,,...,t t kt x x x 之间存在阶数为(d,b )的协整关系,i a 是协整参数。经济变量的单 整阶数往往不会超过2。在实践中经常出现的情况是,12,,...,t t kt x x x 都是一阶单整的, 因此,如果12,,...,t t kt x x x 协整,则: 1212(0)...t t kt k x x x I a a a +++ 二、关于协整的经济学含义 当很多变量都含有单位根时,除非有一种机制把这些变量联系在一起,否则这些变量会不受约束的各自漫游。问题是存在这种机制吗?经济学理论经常表明变量间存在某种长期均衡关系。如果情况确实如此,那么各变量对这种长期均衡关系的偏离不会持久。因此,经济学理论所表明的长期均衡关系往往暗示了一种把各变量联系在一起的内在机制。这种机制就是变量间的协整关系。 例一:期货价格是对未来现货价格的预期。在理性预期假设下,期货价格不会系统性地偏离未来现货价格,因此,期货价格与未来现货价格是协整的。 例二:购买力平价理论认为,本国物价p 与外国物价p *之比决定了名义汇率的均衡值。名义汇率不应该长期偏离其均衡值,因此,e 与p/p *是协整的。 例三:按照定义,名义利率=实际利率+预期通胀率。在长期均衡中,按照理性预期假设,预期通胀率将等于通胀率;按照费雪假设(Fisher hypothesis ),实际利率等于自然利率。假定自然利率为一常数,则名义利率与通胀率的长期均衡关系是名义利率=常数+通胀率。因此,名义利率与通胀率是协整的。 三、协整检验 (一)协整参数已知 例如,如果(1),(1)t t x I y I ,现在假设两变量协整,且协整参数为θ。为了检验上述假设,可以对 t t y x θ-进行单位根检验。如果拒绝t t y x θ-具有单位根的原假设, 则不拒绝y t 与x t 具有协整关系的原假设。 (二)协整参数未知:EG 两步法 经常的情况是协整参数未知,例如在上例中θ未知。按照Engle & Granger(1987)提出的EG 两步法,我们首先利用OLS 法估计模型 t t t y x αβε=++并得到残差?t ε ;接下来

古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

第15章定性响应回归模型 15.1 复习笔记 考点一:定性响应模型的性质★★ 定性响应模型是指模型中的回归子是一个二值或二分变量的模型,通常被称为概率模型。回归子也可以是多分响应变量或多类型响应变量。将二值响应变量建立成概率模型的方法包括线性概率模型(LPM)、logit模型、probit模型和tobit模型。 考点二:线性概率模型(LPM)★★★★ 1.LPM的定义 以下述回归模型为例说明:Y i=β1+β2X i+u i。其中X表示家庭收入;Y=1,则表示该家庭拥有住房;Y=0,则该家庭不拥有住房。该模型被称为线性概率模型,因为Y i在给定X i下的条件期望E(Y i|X i)可解释为在给定X i下事件(家庭拥有住房)发生的条件概率,即Pr(Y i=1|X i)。 2.LPM的特征 令P i表示“Y i=1”(即事件发生)的概率,而1-P i表示“Y i=0”(即事件不发生)的概率,则变量Y i服从贝努利概率分布。

根据期望的定义,有:E(Y i)=0(1-P i)+1P i=P i。此外有:E(Y i|X i)=β1+β2X i =P i,即模型的条件期望事实上可以解释为Y i的条件概率。 该模型的约束条件为:0≤E(Y i|X i)≤1。 3.LPM的问题 (1)干扰项u i的非正态性 若把方程写成:u i=Y i-β1-β2X i,u i的概率分布见表15-1。 表15-1 u i的概率分布 可见u i服从贝努利分布而不是正态分布。虽然干扰项不满足正态性假定,但OLS的点估计值仍具有无偏性。此外在大样本下,OLS估计量一般都趋于正态分布,因此LPM的统计推断仍可用正态性假定下的OLS程序。 (2)干扰项的异方差性 即使LPM中的干扰项满足零均值和无序列相关性假定,但也不能说它具有同方差性。对于贝努利分布,理论上的均值和方差分别为P和P(1-P),可见方差是均值的函数,而均值的取值依赖于X的值,因此LPM中的干扰项具有异方差性。 由于u i的方差依赖于E(Y i|X i),解决异方差性问题的方法之一就是进行数据变换,将模型的两边同时除以: == 即:

《计量经济学讲义》新

第一章绪论 §计量经济学 一、计量经济学的产生与发展 计量经济学是经济学的一个分支,是以揭示经济活动中的客观存在的数量关系为内容的分支学科。其创立者R.弗里希将其定义为经济理论、统计学、数学三者的结合,但它又完全不同于这三个学科的每一个分支。 计量经济学(Econometrics)1926年由挪威经济学家弗里希(R.Frish)仿造生物计量学(Biometrics)一词提出的。1930年12月弗里希、丁百根和费歇耳等经济学家在美国克利夫兰市成立经济计量学会。1933年出版《计量经济学杂志》在发刊词中弗里希将计量经济学定义为:经济理论、数学、统计学的结合。 计量经济学的学术渊源和社会历史根源: 17世纪英国经济学家威廉.配弟在《政治算术》一书中应用“数字、重量或尺度”来阐述经济现象 19世纪法国经济学家古尔诺《财富理论的数学原理研究》中认为:某些经济范畴、需求、价格、供给可以视为互为函数关系,从而有可能用一系列的函数方程表述市场中的关系,并且可以用数学语言系统地阐述某些经济规律(数理学派的奠基者) 其后瑞士经济学家瓦尔拉斯创立了一般均衡理论,利用联立方程研究一般均衡的决定条件(洛桑学派的先驱) 意大利经济学家帕累托发展了一般均衡理论。用立体几何研究经济变量之间的关系。 1890年(剑桥学派的创始人)马歇尔的《经济学原理》的问世,使数学成为经济学研究不可缺少的描述与分析推理的工具为计量经济学奠定了基础 计量经济学从二十世纪三十年代诞生起就显示了极强的生命力。一方面出于对经济的干预政策的需要,许多国家都广泛采用经济计量理论和方法,进行经济预测,加强市场研究,探讨经济政策的效果。另一方面随着科学技术的发展与进步,各门科学相互协作、相互渗透,计算机科学、数学、系统论、信息论、控制论等相继进入了经济研究领域。特别是计算机技术的高速发展为计量经济学广泛应用铺平了道路。

计量经济学-古扎拉蒂

为了便于期末复习,请各类题型都抄好原题,而不是只写出答案;并且名词解释和简答题要抄一小题,答一小题,而不是集中抄题,集中回答。 只要是讲过的附录内容,都属于考试范围。 第1章 一、填空 1. 拟合即( )的意思,拟合直线是指直线对( )的近似。 2. 回归一词的使用始于高尔顿对人体身高的研究。他发现一个规律:父母高,子女也高;父母矮,子女也矮。当父母身高既定时,子女的身高趋向于或“回归”到身高相同父母的全部子女的( )。简记为,回归即指回归到( )。 第2章 一、填空 1. 总体回归线代表( )与( )的变动关系。 二、单项选择题 1. 下列函数中,哪个是参数线性但非变量线性的函数? A. E(Y)=B 1+B 22i X B. E(Y ︱X i )=B 1+B 2X i C. Y i =B 1+B 2X i +u i D. ?i Y =b 1+b 2X i 2. 下列函数中,哪个是变量线性但非参数线性的函数? A. E(Y)=B 1+B 2 1i X B. E(Y)=B 1+22B X i C. E(Y ︱X i )=B 1+B 2X i D. ?i Y =b 1+b 2X i 三、名词解释 总体;样本;随机实验;估计量;估计值;变量线性;参数线性 四、简述 1. 奥卡姆剃刀原则如何应用到模型设定中? 2. 什么是非随机总体回归函数?什么是随机总体回归函数?什么是非随机样本回归函数?什么是随机样本回归函数? 五、论述题 什么是普通最小二乘法?(按教材内容回答,不必按讲义,因它太细了) 第3章 一、填空 1. 如果连续随机变量的概率密度函数(PDF )有如下形式: 2 2 1() )2x μσ--?, (-∞

相关主题