搜档网
当前位置:搜档网 › 面板数据分析 计量经济学

面板数据分析 计量经济学

面板数据分析 计量经济学
面板数据分析 计量经济学

面板数据分析方法步骤全解

步骤一:分析数据的平稳性(单位根检验)

按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。

因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。

单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。

由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。

其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量、Hadri Z统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程,Hadri Z统计量的检验原假设为不存在普通的单位根过程。

有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC (Levin-Lin-Chu)检验和不同根单位根检验Fisher-ADF检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳。

如果我们以T(trend)代表序列含趋势项,以I(intercept)代表序列含截距项,T&I 代表两项都含,N(none)代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检验中选择相应检验模式。

但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一检验。具体操作可以参照李子奈的说法:ADF检验是通过三个模型来完成,首先从含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都不含的模型。并且认为,只有三个模型的检验结果都不能拒绝原假设时,我们才认为时间序列是非平稳的,而只要其中有一个模型的检验结果拒绝了零假设,就可认为时间序列是平稳的。

此外,单位根检验一般是先从水平(level)序列开始检验起,如果存在单位根,则对该序列进行一阶差分后继续检验,若仍存在单位根,则进行二阶甚至高阶差分后检验,直至

序列平稳为止。我们记I(0)为零阶单整,I(1)为一阶单整,依次类推,I(N)为N阶单整。

步骤二:协整检验或模型修正

情况一:如果基于单位根检验的结果发现变量之间是同阶单整的,那么我们可以进行协整检验。协整检验是考察变量间长期均衡关系的方法。所谓的协整是指若两个或多个非平稳的变量序列,其某个线性组合后的序列呈平稳性。此时我们称这些变量序列间有协整关系存在。因此协整的要求或前提是同阶单整。

但也有如下的宽限说法:如果变量个数多于两个,即解释变量个数多于一个,被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。另当解释变量的单整阶数高于被解释变量的单整阶数时,则必须至少有两个解释变量的单整阶数高于被解释变量的单整阶数。如果只含有两个解释变量,则两个变量的单整阶数应该相同。

也就是说,单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验,必然有某些低阶单整的,即波动相对高阶序列的波动甚微弱(有可能波动幅度也不同)的序列,对协整结果的影响不大,因此包不包含的重要性不大。而相对处于最高阶序列,由于其波动较大,对回归残差的平稳性带来极大的影响,所以如果协整是包含有某些高阶单整序列的话(但如果所有变量都是阶数相同的高阶,此时也被称作同阶单整,这样的话另当别论),一定不能将其纳入协整检验。

协整检验方法的文献综述:(1)Kao(1999)、Kao and Chiang(2000)利用推广的DF和ADF 检验提出了检验面板协整的方法,这种方法零假设是没有协整关系,并且利用静态面板回归的残差来构建统计量。(2)Pedron(1999)在零假设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao的方法不同的是,Pedroni的检验方法允许异质面板的存在。(3)Larsson et al(2001)发展了基于Johansen(1995)向量自回归的似然检验的面板协整检验方法,这种检验的方法是检验变量存在共同的协整的秩。

我们主要采用的是Pedroni、Kao、Johansen的方法。

通过了协整检验,说明变量之间存在着长期稳定的均衡关系,其方程回归残差是平稳的。因此可以在此基础上直接对原方程进行回归,此时的回归结果是较精确的。

这时,我们或许还想进一步对面板数据做格兰杰因果检验(因果检验的前提是变量协整)。但如果变量之间不是协整(即非同阶单整)的话,是不能进行格兰杰因果检验的,不过此时可以先对数据进行处理。引用张晓峒的原话,“如果y和x不同阶,不能做格兰杰因果检验,但可通过差分序列或其他处理得到同阶单整序列,并且要看它们此时有无经济意义。”

下面简要介绍一下因果检验的含义:这里的因果关系是从统计角度而言的,即是通过概率或者分布函数的角度体现出来的:在所有其它事件的发生情况固定不变的条件下,如果一个事件X的发生与不发生对于另一个事件Y的发生的概率(如果通过事件定义了随机变量那么也可以说分布函数)有影响,并且这两个事件在时间上又有先后顺序(A前B后),那么我们便可以说X是Y的原因。考虑最简单的形式,Granger检验是运用F-统计量来检验X的滞后值是否显著影响Y(在统计的意义下,且已经综合考虑了Y的滞后值;如果影响不显著,那么称X不是Y的“Granger原因”(Granger cause);如果影响显著,那么称X是Y的“Granger 原因”。同样,这也可以用于检验Y是X的“原因”,检验Y的滞后值是否影响X(已经考虑了X的滞后对X自身的影响)。

Eviews好像没有在POOL窗口中提供Granger causality test,而只有unit root test和cointegration test。说明Eviews是无法对面板数据序列做格兰杰检验的,格兰杰检验只能针对序列组做。也就是说格兰杰因果检验在Eviews中是针对普通的序列对(pairwise)而言的。你如果想对面板数据中的某些合成序列做因果检验的话,不妨先导出相关序列到一个组中(POOL窗口中的Proc/Make Group),再来试试。

情况二:如果如果基于单位根检验的结果发现变量之间是非同阶单整的,即面板数据

中有些序列平稳而有些序列不平稳,此时不能进行协整检验与直接对原序列进行回归。但此时也不要着急,我们可以在保持变量经济意义的前提下,对我们前面提出的模型进行修正,以消除数据不平稳对回归造成的不利影响。如差分某些序列,将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。此时的研究转向新的模型,但要保证模型具有经济意义。因此一般不要对原序列进行二阶差分,因为对变动数据或增长率数据再进行差分,我们不好对其冠以经济解释。难道你称其为变动率的变动率?

步骤三:面板模型的选择与回归

面板数据模型的选择通常有三种形式:

一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。一种是固定效应模型(Fixed Effects Regression Model)。如果对于不同的截面或不同的时间序列,模型的截距不同,则可以采用在模型中添加虚拟变量的方法估计回归参数。一种是随机效应模型(Random Effects Regression Model)。如果固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应,并且这两个随机误差项都服从正态分布,则固定效应模型就变成了随机效应模型。

在面板数据模型形式的选择方法上,我们经常采用F检验决定选用混合模型还是固定效应模型,然后用Hausman检验确定应该建立随机效应模型还是固定效应模型。

检验完毕后,我们也就知道该选用哪种模型了,然后我们就开始回归:

在回归的时候,权数可以选择按截面加权(cross-section weights)的方式,对于横截面个数大于时序个数的情况更应如此,表示允许不同的截面存在异方差现象。估计方法采用PCSE (Panel Corrected Standard Errors,面板校正标准误)方法。Beck和Katz(1995)引入的PCSE 估计方法是面板数据模型估计方法的一个创新,可以有效的处理复杂的面板误差结构,如同步相关,异方差,序列相关等,在样本量不够大时尤为有用。

单位根检验、协整、格兰杰因果检验有什么关系?

单位根检验、协整检验和格兰杰因果关系检验三者之间的关系

实证检验步骤:先做单位根检验,看变量序列是否平稳序列,若平稳,可构造回归模型等经典计量经济学模型;若非平稳,进行差分,当进行到第i次差分时序列平稳,则服从i阶单整(注意趋势、截距不同情况选择,根据P值和原假设判定)。若所有检验序列均服从同阶单整,可构造VAR模型,做协整检验(注意滞后期的选择),判断模型内部变量间是否存在协整关系,即是否存在长期均衡关系。如果有,则可以构造VEC模型或者进行Granger 因果检验,检验变量之间“谁引起谁变化”,即因果关系。

一、讨论一

1、单位根检验是序列的平稳性检验,如果不检验序列的平稳性直接OLS容易导致伪回归。

2、当检验的数据是平稳的(即不存在单位根),要想进一步考察变量的因果联系,可以采用格兰杰因果检验,但要做格兰杰检验的前提是数据必须是平稳的,否则不能做。

3、当检验的数据是非平稳(即存在单位根),并且各个序列是同阶单整(协整检验的前提),想进一步确定变量之间是否存在协整关系,可以进行协整检验,协整检验主要有EG两步法和JJ检验

A、EG两步法是基于回归残差的检验,可以通过建立OLS模型检验其残差平稳性

B、JJ检验是基于回归系数的检验,前提是建立VAR模型(即模型符合ADL模式)

4、当变量之间存在协整关系时,可以建立ECM进一步考察短期关系,Eviews这里还提供了一个Wald-Granger检验,但此时的格兰杰已经不是因果关系检验,而是变量外生性检验,请注意识别

二、讨论二

1、格兰杰检验只能用于平稳序列!这是格兰杰检验的前提,而其因果关系并非我们通常理解的因与果的关系,而是说x的前期变化能有效地解释y的变化,所以称其为“格兰杰原因”。

2、非平稳序列很可能出现伪回归,协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归,即检验变量之间是否存在稳定的关系。所以,非平稳序列的因果关系检验就是协整检验。

3、平稳性检验有3个作用:1)检验平稳性,若平稳,做格兰杰检验,非平稳,作协正检验。2)协整检验中要用到每个序列的单整阶数。3)判断时间学列的数据生成过程。

三、讨论三

其实很多人存在误解。有如下几点,需要澄清:

第一,格兰杰因果检验是检验统计上的时间先后顺序,并不表示而这真正存在因果关系,是否呈因果关系需要根据理论、经验和模型来判定。

第二,格兰杰因果检验的变量应是平稳的,如果单位根检验发现两个变量是不稳定的,那么,不能直接进行格兰杰因果检验,所以,很多人对不平稳的变量进行格兰杰因果检验,这是错误的。

第三,协整结果仅表示变量间存在长期均衡关系,那么,到底是先做格兰杰还是先做协整呢?因为变量不平稳才需要协整,所以,首先因对变量进行差分,平稳后,可以用差分项进行格兰杰因果检验,来判定变量变化的先后时序,之后,进行协整,看变量是否存在长期均衡。第四,长期均衡并不意味着分析的结束,还应考虑短期波动,要做误差修正检验。

单位根检验、协整检验有用吗?——欢迎大家讨论单位根检验(单整检验)、同积过程检验(即,协整检验)有用吗??——欢迎大家讨论[原创]

首先,我得承认,我对这部分知识并不十分了解(只知道这个工具是干什么用的,但并不知道这个工具是怎么做成的)所以难免有可笑之处。

下面就是我想不通的地方:

(1)单位根检验的意义。

我看了半天,感觉它的目的就是为了验证某一个模型中所选择的自变量、因变量是否平稳,如果不平稳,就给它弄平稳了,从而避免“伪回归”的出现。可是,我们在做经典回归或者AR、ARMA等模型之前,不都是要对原始数据进行平稳化处理吗(标准化、归一化、差分)?并且在判断某一序列是否平稳时,肉眼观察不是更方便吗?画出图来,直观地看看是否围绕着均值上下波动,并且一般来说不超过N倍的标准差,不就行了吗,还需要什么单位根检验阿?

唯一觉得有点意义的是:通过检验某个貌似有趋势的序列,发现它是个带常数项的维纳过程,然后得出结论——无法预测。

(2)协整检验的意义。

说是可以得到两个变量(而且是存量)之间的长期均衡关系。但看了半天,感觉绕了一大圈,最后还是做了个普通的回归。有种被愚弄的感觉。原先,我还以为,有了协整这个工具之后,宏观经济学会少了很多争论,可是好像并没有:(

(3)检验了半天,仍然只是以线性关系作为假设前提。如果两个变量之间是非线性的关系,你检验了半天不是瞎忙活吗?

其实我也认为这个问题是合理的,但楼主的问题似乎与此无关,而且缺乏基本的统计常识。比如容肉眼观察是否平稳,这是很荒谬的,若是如此,人们为什么要用t-test 来检验两个均知是否相等,这似乎比这个问题更容易用肉眼看出来吧。所以楼主提的问题是无稽之谈啊。另外其后两个问题也是很幼稚的,没错协整是做了一个普通回归,但是这个普通回归在一般情况下是spurious的,只有在经过协整检验才能说明他是正确的,这是科学性的体现。

另外关于线性于非线性,在没有十分精确的理论知道的时候,计量的处理一般会假设线性关系,因此第三个问题本身不成其为一个问题。

在只有一两个变量时,均值检验确实不如“肉眼”观察的方便(准确性则差不多),只有多变量时才有意义。而对某一个序列的平稳性问题,就很类似。而且好像很多时间序列的书都有这么一句话“一般来说,经济变量经过1、2次差分就平稳了”“观察平稳之后,再作AR,ARMA...

模型”。。。当然我不否认,单位根检验的理论贡献,但对于像我这样一个功利色彩非常重的人来说,学习它的投入产出太不划算了:)

经过1、2次差分后的再作回归一般都不再是“伪回归了”吧?我想谁也不会闭者眼睛作回归吧

.而且我发现,经过协整检验之后的回归与经济理论的结果都是一致的,这让我很失望,因为早知如此,还不如学习经济理论知识,简单的多啊:)

什么是伪回归

从提出“伪回归”的历史看定义为:

单位根检验由于传统的经济计量学方法对非平稳的时间序列不再适用,利用传统方法对计量模型进行统计推断时,许多参数的统计量的分布不再是标准分布,所作的回归被称为“伪回归”比如利用最小二乘法对非平稳的各个变量进行回归就是伪回归

如各个非平稳变量都是同阶单整,就可以作协整分析

所谓伪回归是指理论上自变量是不能完全解释变量,或者不因该解释。可当在对进行线性回归的时候得出肯定的结论,虽然通过单位根检验。这个时候就说得出的回归是伪回归。

举例子就用上面的例子很好:GDP每年都增长和旁边的树每年都长高,如果你直接用数据回归,那肯定存在正相关,而其实这个是没有意义的回归。

关于虚假回归(伪回归)的困惑

经典计量经济学理论是建立在时间序列平稳的基础上的,所假设的变量间的相关系数服从的是正态分布。现代计量经济学研究发现,大部分经济变量是非平稳的。用蒙特卡洛模拟方法分析非平稳时间序列的相关系数的分布情况,研究结果表明:当时间序列非平稳是,相关系数实际上服从的是倒U和U自行分布,因此增加了拒绝解释变量系数为零假设的概率,并且该概率随着样本容量和时间序列单整阶数的增加而增加。这样就降低了检验的功效,增加了那伪的可能性。也就是说,在大样本和较高单整阶数的条件下,随意检验本来独立的两个变量的相关系数的显著性,结论都是肯定的,直接结果是导致不相关的两个非平稳变量在相关系数的分布呈现倒U和U自行的情况下,被检验出两者具有相关关系。即是说,用非平稳变量进行回归分析,尤其在大样本和较高单整阶数的情况下,结论全部都是变量之间有相关关系,讲实际上不相关的两个非平稳变量来回归分析,是一种虚假回归。所以,对非平稳变量间进行回归分析,首先应该考虑和检验变量的平稳性。

也就是说,对于非平稳时间序列直接建立回归,很容易产生虚假回归,拿简单的一元线性回

归来说,比如1978年-2008年的人均消费支出Yt与人均可支配收入Xt之间的回归,首先Yt 与Xt肯定都是非平稳的时间序列,但是在做这两者的回归的时候,也没提平稳性检验的事就直接建立了两者之间的回归模型。虽然我们知道他们之间的回归肯定不是虚假回归,是有实际意义的。但是很多情况下我们对于两组时间序列数据之间存在的回归是否属于虚假回归是不知道的,那该怎样区分呢??

至于为什么没有做平稳性分析就可以拿上面两个量来做回归,这是因为有伟大的“协整理论”存在,他的横空出世虽然先震傻了许多计量的人,但是很快人们就又可以嘘一口气,因为在我们现实生活中,很多时候许多非平稳的变量是具有协整关系的~因此我们可以继续做这个回归,不过在做这个回归之前,需要协整检验一下,给我们一个“心理安慰”后,我们就可以更放心的做回归了。(这个之前看过一个讲协整的让人醍醐灌顶的文章,去不知道到哪去了...)

至于伪回归分辨的问题,这个,个人觉得需要看你的理论假设前提了。如果有比较坚实的理论支持,应该就可以使用。比如前两天我看的一篇论文,谈“足球比赛对股市的影响”(我是没有看完,因为感觉挺扯淡的),他就提出了有力的假设前提,这两者是可以用来做回归,作分析的。。所以你懂得,这个得看分析看理论看经验了协整理论和面板数据分析

Spurious Regression:伪回归/虚假回归

计量经济学中提到过伪回归的问题,那么什么是伪回归呢?

举个例子,中国的GDP随时间是呈增长趋势;美国森林覆盖率w也是随时间呈增长趋势。那么对这两个变量做回归。比如假设模型为GDP=α+?w+ε,ε为随机误差项,服从N(0,σ^2)。

假设根据1990年-2010年20年间的数据,通过最小二乘估计得到参数的估计值,并计算R^2,可以发现R^2较大,表示出数据拟合较好,两个变量之间有很好的拟合程度,因为是两者有共同趋势,但是,这两个变量之间可以说是没有任何关系。

这就是时间序列中出现的伪回归问题,解决方法很简单,除了通过变量的具体含义判断,还可以在模型中加入时间参数t,这样就可以消除伪回归的问题。

伪回归发表评论(0) 编辑词条

单位根检验由于传统的经济计量学方法对非平稳的时间序列不再适用,利用传统方法对计量模型进行统计推断时,许多参数的统计量的分布不再是标准分布,所作的回归被称为“伪回归”。

残差序列是一个非平稳序列的回归被称为伪回归,这样的一种回归有可能拟合优度、显著性水平等指标都很好,但是由于残差序列是一个非平稳序列,说明了这种回归关系不能够真实的反映因变量和解释变量之间存在的均衡关系,而仅仅是一种数字上的巧合而已。伪回归的出现说明模型的设定出现了问题,有可能需要增加解释变量或者减少解释变量,抑或是把原方程进行差分,以使残差序列达到平稳。

什么是伪回归方程?

就是假的回归方程

回归方程是:

对变量之间统计关系进行定量描述的一种数学表达式。

指具有相关的随机变量和固定变量之间关系的方程。

伪回归和误差修正模型的实证分析

一、问题的提出在金融数据分析和计量经济学中,经常会使用时间序列数据,特别是在线性回归模型中,即使yt=xt日十拌:(t=1,2,A,T)解释变量和被解释变量有一定的相关关系,但是往往会出现令人意外的结果,比如说,t检验和F检验都通过,且参数具有明显的经济意义,从统计学的角度我们不拒绝y:和x:之间存在线性关系的假设,但模型在预测时,会出现较大的偏误,这时就很可能出现伪回归(suspiciousre罗s-sion)现象。葛兰杰和纽博尔德(Gmllger and New-bold)曾经提出一个良好的经验规则:当呼>DW(扩和DW分别为复相关系数及Duthin二研怡怡。n统计量)时,所估计的回归就有伪回归之嫌。有时y,和xt之间根本不存在任何的线性关系,但相关的检验量却十分地显著,这种现象就称之为伪回归现象。其实这种现象早为经济学家们所认识,但在怎样的条件下会产生伪回归现象,长期以来没有统一的认识,直到20世纪70年代中期,上述两位学者用蒙特卡罗模拟的方法表明,当y:和x:都服从单位根过程时,即使它们之间不存在任何的线性相关关系,以yt对x:作回归得到俘的最小......

Y是平稳的,X是不平稳的,那用Y对X回归是伪回归吗?

我是这么认为的:伪回归是指由于X,Y都随时间自动变化而造成的Y与X看似能回归的表面现象,既然Y是平稳的了,那就不存在这个问题了吧?

协整理论

经典的计量经济模型是在一定的假定的基础上的,例如随机误差项零均值和相同方差,随机误差项在不同样本点之间是独立的,不存在序列相关,随机误差项与解释变量之间不相关,随机误差项服从0均值、同方差的正态分布。

但在我们的实际的社会经济现象中,变量往往不满足上述的条件,特别是对于时间序列数据,如果它们往往是序列相关的。时间序列数据如果是平稳的,即,对于时间一个时间序列x,如果它的均值与时间t无关,其方差是有限的,即随着时间的推移,时间序列数据以一种相对不变的振幅围绕均值波动,对于这样的一个序列,我们可能用自回归移动平均模型ARMA(p,q)来表示和估计。

一个时间序列如果不是平稳的,由很难由变量之间的统计关系来推断计量经济模型的形式,由此得到的模型往往不能反映实际情况,用于预测决策等也会有较大的失真,通常被称为“伪回归”问题。20世纪70年代以来,变量的非平稳性问题和伪回归问题越来越引起人们的注意。当变量属于非平稳过程时,要由经济变量间的统计关系推断它们之间是否存在因果关系是相当困难的,恩格尔(Engle)和格兰杰(Granger)提出了协整理论和误差修正模型,协整理论的作用在于正确地解释了经济现象和预测现象,误差修正模型(ECM)将影响变化的因素有效地分解成长期静态关系和短期动态关系之和。其中格兰杰定理证明了协整关系与误差修正模型之间的关系,指出若干个一阶非平稳经济变量间若存在协整关系,那么这些变量一定存在误差修正模型表达式,反之也成立。

【简介】

时间序列计量经济学:协整与有条件的异方差自回归

——2003年诺贝尔经济学奖获奖者研究成果简介

瑞典皇家科学院10月8日在斯德哥尔摩宣布,将2003年的诺贝尔经济学奖授予美国经济学家罗伯特·恩格尔和英国经济学家克莱夫·格兰杰,以表彰他们分别用“随时间变化的变动性(time-varyingvolatility)”和“共同趋势(commontrends)”这两种新方法分析经济时间序列,从而为经济学研究和经济发展做出了巨大贡献。格兰杰和恩格尔的研究成果目前已经成为世界各国中央银行、财政部、金融市场经常使用的分析工具,特别是在评估投资组合的系统风险方面,更具有现实的应用价值。在中国,经济学家特别是计量经济学家对恩格尔和格兰杰的理论建树同样不陌生。在上世纪90年代初,恩格尔的“有条件的异方差自回归模型(ARCH模型)”就作为“现代经济学前沿”被详细地介绍到国内;格兰杰在谱分析(经济周期分析)、因果分析、经济预测、协整等方面的开拓性贡献也早为人们所熟知。不仅如此,他们的理论和方法已经在我国经济学的研究和教学中被广泛地应用。

人们在进行关系估计和经济预测以及对经济理论进行假设检验时,通常是以时间序列的形式来使用数据,进而对宏观经济变量进行研究。尽管对这种关系可以简单地通过一个静态、线性、只有两个变量的表达式(模型)进行描述,但要得出正确的估计和结论,就要求模型必须能够很好地适用时间序列的具体特征。而对许多经济时间序列来说,最重要的两个关键特征是“非平稳性”(nonstationarity)和“随时间变化的变动性”。正是恩格尔和格兰杰在80年代发明了新的统计方法来处理这两个关键特征。

一、非平稳性、共同趋势与协整从理论上说,许多宏观经济时间序列都是非平稳的,因此某个经济变量会遵循一个长期趋势,但一次暂时的失调会产生长期持续的影响。例如,净收入与消费、工资与价格、进口与出口、政府支出与税收等经济时间序列存在一种长期均衡关系,但一般来说,这些时间序列属于非平稳序列,其变动性会随着时间的变化而变化。与平稳时间序列不同的是,非平稳时间序列不能表现出任何清晰的趋势,因此也不能得到某个固定数值或某种特定趋势。格兰杰在20世纪80年代提出的“协整(cointe鄄gration)”理论发现,把两个或两个以上非平稳的时间序列进行特殊组合后可能呈现出平稳性。协整理论的主要研究对象是在两个(或多个)非平稳时间序列中寻找一种均衡关系,该理论的提出对于用非平稳经济变量建立计量经济模型,以及检验这些变量之间的长期均衡关系具有非常重要的意义,而且其应用也远远超出了对线性回归的诊断。在许多情况下,经济理论告诉我们两个变量应该是协整的,对协整性的检验也就是对经济理论正确与否的检验。例如,股票市场,如果对股票价格的估计是理性的,那么公司股票的价格应该等于预期未来股息流的现值。这事实上意味着,尽管股息和股票价格这两个变量都是非平稳的,但这两个序列应该是协整的,其协整参数等于投资者在计算盈利现值时所采用的贴现率。

格兰杰又从几个方面对协整分析进行了拓展,如处理具有季节性模式的序列。另外,在协整概念的基础上,他还进一步提出了著名的“格兰杰协整定理”,用来解决协整与误差修正模型之间的关系问题。这个定理的重要意义在于它证明了协整概念与误差修正模型之间存在的必然联系。即如果非平稳变量之间存在协整关系,那么必然可以建立误差修正模型;而如果非平稳变量可以建立误差修正模型,那么该变量之间必然存在着协整关系。除了在理论上建立了协整的概念,格兰杰在实际经济分析中也作了大量极有贡献的实证性研究,如对季节性模式的单整与协整分析;对产出、销售以及存货之间的多因素协整分析;对美国国债的产出协整分析等。

二、随时间变化的变动性和ARCH模型

在现代金融理论中,对资产收益的风险和价格不确定性的度量通常是采用方差(或标

准差)来描述。根据传统的计量经济理论,研究人员往往假设方差是不变的,即方差在不同时期都固定在一个常数上。但金融理论的后续发展和对价格行为的大量经验研究结果都表明这一假设是不合理的,也就是说,用来描述不确定性和风险的方差并不是固定不变的,而是会随着时间的变化而变化。进一步研究表明,内生变量一次大的变化(向上或向下)之后往往会跟随着一次更进一步的大波动,而小的变化之后则会出现小的波动,并且许多金融数据时间序列都表现出这种类似特征。由于传统线性回归模型中关于独立同方差的假设并不适合用来描述金融市场中的价格与收益行为,所以,许多计量经济学家和金融学家都开始尝试用改进的方法来更好地定量描述各种金融市场活动。在这些模型中,恩格尔提出的ARCH模型能够有效预测经济数据从一个时期到另一个时期的变化,因而被广泛应用于金融数据的时间序列问题上。

由于ARCH模型展示了变量之间的一种特殊的不确定性形式:变动性会随着时间的变化而变化,所以,它已被广泛用于验证市场的有效性和计算市场变化的系统风险。另外,在宏观经济范围内,该模型还可以被用于建立一国的最优负债组合以及衡量通货膨胀的不确定性,或者考察外贸与汇率的关系、央行货币政策与股票市场的关系等等。在实际应用方面,1996年以来,巴塞尔协议在控制银行资本要求时规定必须使用风险价值。银行和其他金融机构在计算它们证券组合的市场风险时,其风险分析过程中对风险价值的计算至关重要,这其中就需要用到ARCH模型。透过这些应用可以看出,在对金融领域的风险进行评估时,ARCH 的分析框架已经是一个不可或缺而又非常有效的工具。

协整关系

协整关系存在的条件是:只有当两个变量的时间序列{x}和{y}是同阶单整序列即I(d)时,才可能存在协整关系(这一点对多变量协整并不适用)。因此在进行y和x两个变量协整关系检验之前,先用ADF单位根检验对两时间序列{x}和{y}进行平稳性检验。平稳性的常用检验方法是图示法与单位根检验法。图示法即对所选各个时间序列变量及其一阶差分作时序图,从上图中可以看到,y变量和x变量的时序图均表现出明显的非平稳性。对y和x进行一阶差分变换,并用iy和ix分别表示y和x经一阶差分后的时间序列,不难看出,经过一阶差分后y和x均表现出平稳性的特征。y和x均表现出平稳性的特征走势图。

【讨论】:

【1】

请问计量高手, 在对两个时间序列进行协整检验时,首先是检验两序列的平稳性,如果是同阶的,就可以用OLS进行回归,然后再检验残差的平稳性,我想请教的问题是:在对两变量进行OLS回归时,要不要考虑残差的异方差性。另外,在检验残差的平稳性时,是否就不要检验残差的序列相关性?

什么是平稳性,什么是序列相关性,两者关系如何?

平衡性指的是:如果一个时间序列的均值是常数,方差是常数,不同观测值之间的协方差仅

仅依赖于观测值之间的滞后阶数,那么就可以说此时间序列是平衡的。而残差的序列相关,我的理解就是残差间的自相关,在通常的OLS模型中,通常要求考虑三个方面:异方差性,自相关,多重共线性。所以我不懂的是:在做协整检验时,残差的自相关问题是否也要考虑,如果考虑,是否也能用检验普通模型的方法进行处理?

那协整的内涵是什么呢?平稳性在协整中含义又是什么?如果残差是一个平稳序列但有序列相关性,这能说明什么呢?

请问高按照协整理论,如果对于两个不同阶的变量进行回归,得到的可能是虚假回归。协整理论认为只有两个(或多个)同阶单整的变量才可能存在长期稳定的某种关系即协整关系。手若两个变量不是同阶的,是否意味着这两个变量不能回归,若想做回归应怎样处理?还有怎样找到月度和季度数据资料?

你当然可以考虑异方差性,这个在EVIEWS中是很简单的,只要点一个鼠标就能做到啦。

在古扎拉蒂的书上,他对序列相关和自相关并没有区别。他的意思就是残差间是否存在相关关系。真的希望高手能告知我在对两变量求协整关系时,需不需要考虑残差的相关问题。cov(ui,uj)是否必须保证等于零?

协整关系指的是长期稳定关系.

SPSS 能进行,协整检验,df,adf检验吗?各位高手,不知在SPSS中怎么用??他们的怎么判定??比如用看t或其他值??还有怎么消除呢?EVIEWS是AR(n)???还有EVIEWS中有因果分析是不是和spss中的person一样??在SPSS中怎么因果分析??那位高手知道spss 中的应用方法?

序列相关和自相关应该是有区别的,自相关可能指序列相关在时间序列下的情景。

在做检验残差的平稳性之前要先保证残差的无序列相关性.你可以给残差项加一个AR项就可以去除序列相关性.

我做了几个练习,发现如果消除了序列相关问题后,再来检验残差时,残差都变平稳了。我也不知道在检验残差的平稳前是否需要序列相关处理。有没有理论依据来说明这个问题。否则不同的处理方式导致不同的结果。

我刚看到一篇做实证的文章,他检验协整模型的时候检验了序列相关,异方差,用检验多重共线形的方法选择自回归阶数。明这个问题。否则不同的处理方式导致不同的结果。

我理解的序列相关是针对横截面数据而言的,自相关是针对时间序列数据而言的.

【2】

在两个变量的这种简单情况下,按照你的方法,在进行cointegartion检验时,对残差的平稳性检验,就是检验残差是否是I(0)。就是应用df或adf检验。在进行OLS中你如何考虑残差的异方差呢?不可能的。在逻辑上,你要首先考虑残差的异方差性,你必须要知道残差的性质,而在cointegartion中,你想要得到的是残差的性质即是不是平稳的。

平稳性是指时间序列是否为I(0)

的adf检验就是为了消除或减少时间序列的自相关而发展起来的

【3】

这里有篇解释还挺详细,可以看看

单位根检验、协整检验和格兰杰因果关系检验三者之间的关系

实证检验步骤:先做单位根检验,看变量序列是否平稳序列,若平稳,可构造回归模型等经典计量经济学模型;若非平稳,进行差分,当进行到第i次差分时序列平稳,则服从i 阶单整(注意趋势、截距不同情况选择,根据P值和原假设判定)。若所有检验序列均服从同阶单整,可构造VAR模型,做协整检验(注意滞后期的选择),判断模型内部变量间是否

存在协整关系,即是否存在长期均衡关系。如果有,则可以构造VEC模型或者进行Granger 因果检验,检验变量之间“谁引起谁变化”,即因果关系。

一、讨论一

1、单位根检验是序列的平稳性检验,如果不检验序列的平稳性直接OLS容易导致伪回归。

2、当检验的数据是平稳的(即不存在单位根),要想进一步考察变量的因果联系,可以采用格兰杰因果检验,但要做格兰杰检验的前提是数据必须是平稳的,否则不能做。

3、当检验的数据是非平稳(即存在单位根),并且各个序列是同阶单整(协整检验的前提),想进一步确定变量之间是否存在协整关系,可以进行协整检验,协整检验主要有EG两步法和JJ检验

A、EG两步法是基于回归残差的检验,可以通过建立OLS模型检验其残差平稳性

B、JJ检验是基于回归系数的检验,前提是建立VAR模型(即模型符合ADL模式)

4、当变量之间存在协整关系时,可以建立ECM进一步考察短期关系,Eviews这里还提供了一个Wald-Granger检验,但此时的格兰杰已经不是因果关系检验,而是变量外生性检验,请注意识别

二、讨论二

1、格兰杰检验只能用于平稳序列!这是格兰杰检验的前提,而其因果关系并非我们通常理解的因与果的关系,而是说x的前期变化能有效地解释y的变化,所以称其为“格兰杰原因”。

2、非平稳序列很可能出现伪回归,协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归,即检验变量之间是否存在稳定的关系。所以,非平稳序列的因果关系检验就是协整检验。

3、平稳性检验有3个作用:1)检验平稳性,若平稳,做格兰杰检验,非平稳,作协正检验。2)协整检验中要用到每个序列的单整阶数。3)判断时间学列的数据生成过程。

三、讨论三

其实很多人存在误解。有如下几点,需要澄清:

第一,格兰杰因果检验是检验统计上的时间先后顺序,并不表示而这真正存在因果关系,是否呈因果关系需要根据理论、经验和模型来判定。

第二,格兰杰因果检验的变量应是平稳的,如果单位根检验发现两个变量是不稳定的,那么,不能直接进行格兰杰因果检验,所以,很多人对不平稳的变量进行格兰杰因果检验,这是错误的。

第三,协整结果仅表示变量间存在长期均衡关系,那么,到底是先做格兰杰还是先做协整呢?因为变量不平稳才需要协整,所以,首先因对变量进行差分,平稳后,可以用差分项进行格兰杰因果检验,来判定变量变化的先后时序,之后,进行协整,看变量是否存在长期均衡。第四,长期均衡并不意味着分析的结束,还应考虑短期波动,要做误差修正检验。

面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)

面板数据分析简要步骤与注意事项(面板单位根检验—面板协整—回归分析) 面板数据分析方法: 面板单位根检验—若为同阶—面板协整—回归分析 —若为不同阶—序列变化—同阶建模随机效应模型与固定效应模型的区别不体现为R2的大小,固定效应模型为误差项和解释变量是相关,而随机效应模型表现为误差项和解释变量不相关。先用hausman检验是fixed 还是random,面板数据R-squared值对于一般标准而言,超过0.3为非常优秀的模型。不是时间序列那种接近0.8为优秀。另外,建议回归前先做stationary。很想知道随机效应应该看哪个R方?很多资料说固定看within,随机看overall,我得出的overall非常小0.03,然后within是53%。fe和re输出差不多,不过hausman检验不能拒绝,所以只能是re。该如何选择呢? 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al.(2002)的改进,提出了检验面板单位根的LLC法。Levin et al.(2002)指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250之间,截面数介于10~250之间)的面板单位根检验。Im et al.(1997)还提出了检验面板单位根的IPS法,但Breitung(2000)发现IPS法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。 由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher和PP-Fisher5种方法进行面板单位根检验。 其中LLC-T、BR-T、IPS-W、ADF-FCS、PP-FCS、H-Z分别指Levin,Lin&Chu t*

面板数据的F检验固定效应检验

面板数据的F检验固定 效应检验 标准化工作室编码[XX968T-XX89628-XJ668-XT689N]

面板数据模型(P A N E L D A T A)F检验,固定效应检验1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y , i= 1, 2, …, N; t= 1, 2, …, T i t N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y , ( i i . = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i = 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 注意:EViwes 、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。

计量经济学的概念

计量经济学是经济科学领域内的一门应用科学,以一定的经济理论和实际统计资料为基础,运用数学、统计方法与计算机技术,以建立经济计量模型为主要手段,定量分析研究具有随机特性的经济变量关系。 2、数理经济模型与计量经济模型的区别。 数理:揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。 计量:揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述。 3、经典计量经济学模型的一般形式。 4、计量经济学的数据类型。 时间序列数据:按时间先后排列的统计数据。 截面数据:一个或多个变量在某一时点上的数据集合。 合并数据(平行数据):既包含时间序列数据又有截面 数据。 5、建立计量经济学模型的步骤。 1) 模型的数学形式。③拟定模型中待估计参数的理论期望 值。 2)样本数据的收集: 差项产生序列相关。②截面数据易引起模型随机误差项 产生异方差。③样本数据的质量:完整性、准确性、可 比性、一致性。 3)模型参数的估计。 4 度检验、变量的显着性检验、方程的显着性检验。③计 量经济学检验:序列相关、异方差法(随机误差项)、 多重共线性(解释变量)④模型预测检验。 6、计量经济学模型的应用。 1)结构分析;2)经济预测;3)政策评价;4)检验与发展经济理论。 7、如何正确选择解释变量。 作为“变量”的原因:1 2)考虑数据的可得性;3)考虑入选变量之间的关系。 8、回归分析的目的。 1)根据自变量的取值,估计应变量的均值;2)检验建立在经济理论基础上的假设;3) 值,预测应变量的均值。 9、总体回归函数(PRF)和样本回归函数(SRF)各变量系数名称及函数方程。 10、随机误差项(Ui)的性质或主要内容。

面板数据分析简要步骤与注意事项面板单位根面板协整回归分析

面板数据分析简要步骤与注意事项 面板单位根—面板协整—回归分析) 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实 际意义的。这种情况称为称为虚假回归或伪回归( spurious regression )。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述:在非平稳的面板数据渐进过程中 ,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布 , 这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002) 的改进, 提出了检验面板单位根的LLC法。Levin et al. (2002)指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25?250之间,截面数介于10?250之间)的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的 IPS 法, 但 Breitung(2000) 发现 IPS 法对限定性趋势的设定极为敏感 , 并提出了面板单位根检验的 Breitung 法。Maddala and Wu(1999)又提出了 ADF-Fisher 和 PP-Fisher 面板单位根检验方法。 由上述综述可知,可以使用 LLC、IPS、Breintung 、ADF-Fisher 和 PP-Fisher5 种方法进行面板单位根检验。其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS、H-Z 分 别指 Levin, Lin & Chu t* 统计量、 Breitung t 统计量、 lm Pesaran & Shin W 统 量、计 ADF- Fisher Chi-square 统计量、PP-Fisher Chi-square 统计量、Hadri Z 统计 量,并且 Levin, Lin & Chu t* 统计量、 Breitung t 统计量的原假设为存在普通的单位根过程, lm Pesaran & Shin W 统计量、 ADF- Fisher Chi-square 统计量、 PP-Fisher Chi-square 统计量的原假设为存在有效的单位根过程, Hadri Z 统计量的检验原假设为不存在普通的单位根过程。 有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验 LLC(Levin-Lin-Chu )检验和不同根单位根检验 Fisher-ADF 检验(注:对普通序列(非面板序列)的单位根检验方法则常用 ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我 们说此序列是平稳的,反之则不平稳。 如果我们以 T(trend )代表序列含趋势项,以 I (intercept )代表序列含截距项, T&I 代表两项都含,N (none)代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检验中选择相应检验模式。 但基于时序图得出的结论毕竟是粗略的,严格来说,那些检验结构均需一一检验。具体操作可以参照李子奈的说法:ADF检验是通过三个模型来完成,首先从含有截距和趋势项的模型开始,再检验只含截距项的模型,最后检验二者都不含的模型。并且认

面板数据分析步骤

转载:面板数据分析的思路和Eviews操作: 面板数据一般有三种:混合估计模型;随机效应模型和固定效应模型。首先,第一步是作固定效应和随机效应模型的选择,一般是用Hausman检验。 如果你选用的是所有的企业,反映的是总体的效应,则选择固定效应模型,如果你选用的是抽样估计,则要作Hausman检验。这个可以在Eviews 5.1里头做。 H0:应该建立随机效应模型。 H1:应该建立固定效应模型。 先使用随机效应回归,然后做Hausman检验,如果是小概率事件,拒绝原假设则应建立固定效应模型,反之,则应该采用随机效应模型进行估计。 第二步,固定效应模型分为三种:个体固定效应模型、时刻固定效应模型和个体时刻固定效应模型(这三个模型的含义我就不讲了,大家可以参考我列的参考书)。如果我们是对个体固定,则应选择个体固定效用模型。但是,我们还需作个体固定效应模型和混合估计模型的选择。所以,就要作F值检验。相对于混合估计模型来说,是否有必要建立个体固定效应模型可以通过F检验来完成。 H0:对于不同横截面模型截距项相同(建立混合估计模型)。SSEr H1:对于不同横截面模型的截距项不同(建立时刻固定效应模型)。SSEu

F统计量定义为:F=[( SSEr - SSEu)/(T+k-2)]/[ SSEu/(NT-T-k)] 其中,SSEr,SSEu分别表示约束模型(混合估计模型的)和非约束模型(个体固定效应模型的)的残差平方和(Sum squared resid)。非约束模型比约束模型多了T–1个被估参数。需要指出的是:当模型中含有k 个解释变量时,F统计量的分母自由度是NT-T- k。通过对F统计量我们将可选择准确、最佳的估计模型。 在作回归是也是四步:第一步,先作混合效应模型:在cross-section 一栏选择None ,Period也是None;Weights是cross-section Weights,然后把回归结果的Sum squared resid值复制出来,就是SSEr 第二步:作个体固定效用模型:在cross-section 一栏选择Fixed ,Period也是None;Weights是cross-section Weights,然后把回归结果的Sum squared resid值复制出来,就是SSEu 第三步:根据公式F=[( SSEr - SSEu)/(T+k-2)]/[ SSEu/(NT-T-k)]。计算出结果。其中,T为年数,不管我们的数据是unbalance还是balance 看observations就行了,也即Total pool (balanced) observations:的值,但是如果是balance我们也可以计算,也即是每一年的企业数的总和。比如说我们研究10年,每一年又500加企业,则NT=10×500=5000。K为解释变量,不含被解释变量。 第四步,根据计算出来的结果查F值分布表。看是否通过检验。检验准则:当F> Fα(T-1, NT-T-k) , α=0.01,0.05或0.1时,拒绝原假设,则结论是应该建立个体固定效应模型,反之,接受原假设,则不能建立个体固定效应模型。

计量经济学面板数据模型讲义(4-7)

面板数据模型 1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y i t, i= 1, 2, …, N; t = 1, 2, …, T N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y i ., ( i= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i= 1, 2, …, N; t = 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 注意:EViwes 3.1、4.1、5.0既允许用平衡面板数据也允许用非平衡面板数据估计模型。 例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。数据是7年的,每一年都有15个数据,共105组观测值。 人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的

eviews面板数据实例分析

1、已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp,不变价格)与人均收入(ip,不变价格)居民,利用数据(1)建立面板数据(panel data)工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。 年人均消费(consume)与人均收入(income)数据以及消费者价格指数(p)分别见表9、1,9、2与9、3。 表9、1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据人均消费1996 1997 1998 1999 2000 2001 2002 CONSUMEAH 3607、43 3693、55 3777、41 3901、81 4232、98 4517、65 4736、52 CONSUMEBJ 5729、52 6531、81 6970、83 7498、48 8493、49 8922、72 10284、6 CONSUMEFJ 4248、47 4935、95 5181、45 5266、69 5638、74 6015、11 6631、68 CONSUMEHB 3424、35 4003、71 3834、43 4026、3 4348、47 4479、75 5069、28 CONSUMEHLJ 3110、92 3213、42 3303、15 3481、74 3824、44 4192、36 4462、08 CONSUMEJL 3037、32 3408、03 3449、74 3661、68 4020、87 4337、22 4973、88 CONSUMEJS 4057、5 4533、57 4889、43 5010、91 5323、18 5532、74 6042、6 CONSUMEJX 2942、11 3199、61 3266、81 3482、33 3623、56 3894、51 4549、32 CONSUMELN 3493、02 3719、91 3890、74 3989、93 4356、06 4654、42 5342、64 CONSUMENMG 2767、84 3032、3 3105、74 3468、99 3927、75 4195、62 4859、88 CONSUMESD 3770、99 4040、63 4143、96 4515、05 5022 5252、41 5596、32 CONSUMESH 6763、12 6819、94 6866、41 8247、69 8868、19 9336、1 10464 CONSUMESX 3035、59 3228、71 3267、7 3492、98 3941、87 4123、01 4710、96 CONSUMETJ 4679、61 5204、15 5471、01 5851、53 6121、04 6987、22 7191、96 CONSUMEZJ 5764、27 6170、14 6217、93 6521、54 7020、22 7952、39 8713、08 表9、2 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均收入(元)数据人均收入1996 1997 1998 1999 2000 2001 2002 INCOMEAH 4512、77 4599、27 4770、47 5064、6 5293、55 5668、8 6032、4 INCOMEBJ 7332、01 7813、16 8471、98 9182、76 10349、69 11577、78 12463、92 INCOMEFJ 5172、93 6143、64 6485、63 6859、81 7432、26 8313、08 9189、36 INCOMEHB 4442、81 4958、67 5084、64 5365、03 5661、16 5984、82 6679、68 INCOMEHLJ 3768、31 4090、72 4268、5 4595、14 4912、88 5425、87 6100、56 INCOMEJL 3805、53 4190、58 4206、64 4480、01 4810 5340、46 6260、16 INCOMEJS 5185、79 5765、2 6017、85 6538、2 6800、23 7375、1 8177、64 INCOMEJX 3780、2 4071、32 4251、42 4720、58 5103、58 5506、02 6335、64 INCOMELN 4207、23 4518、1 4617、24 4898、61 5357、79 5797、01 6524、52 INCOMENMG 3431、81 3944、67 4353、02 4770、53 5129、05 5535、89 6051 INCOMESD 4890、28 5190、79 5380、08 5808、96 6489、97 7101、08 7614、36 INCOMESH 8178、48 8438、89 8773、1 10931、64 11718、01 12883、46 13249、8 INCOMESX 3702、69 3989、92 4098、73 4342、61 4724、11 5391、05 6234、36 INCOMETJ 5967、71 6608、39 7110、54 7649、83 8140、5 8958、7 9337、56 INCOMEZJ 6955、79 7358、72 7836、76 8427、95 9279、16 10464、67 11715、6 表9、3 1996—2002年中国东北、华北、华东15个省级地区的消费者物价指数物价指数1996 1997 1998 1999 2000 2001 2002 PAH 109、9 101、3 100 97、8 100、7 100、5 99

面板数据的分析步骤

面板数据的分析步骤 面板数据的分析方法或许我们已经了解许多了,但是到底有没有一个基本的步骤呢?那些步骤是必须的?这些都是我们在研究的过程中需要考虑的,而且又是很实在的问题。面板单位根检验如何进行?协整检验呢?什么情况下要进行模型的修正?面板模型回归形式的选择?如何更有效的进行回归?诸如此类的问题我们应该如何去分析并一一解决?以下是我近期对面板数据研究后做出的一个简要总结,和大家分享一下,也希望大家都进来讨论讨论。 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。 单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。 由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。 其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square 统计量、Hadri Z统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程,Hadri Z统计量的检验原假设为不存在普通的单位根过程。 有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC (Levin-Lin-Chu)检验和不同根单位根检验Fisher-ADF检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我们

基于面板数据模型及其固定效应的模型分析

基于面板数据模型及其固定效应的模型分析 在20世纪80年代及以前,还只有很少的研究面板数据模型及其应用的文献,而20世纪80年代之后一直到现在,已经有大量的文献使用同时具有横截面和时间序列信息的面板数据来进行经验研究(Hsiao,20XX)。同时,大量的面板数据计量经济学方法和技巧已经被开发了出来,并成为现在中级以上的计量经济学教科书的必备内容,面板数据计量经济学的理论研究也是现在理论计量经济学最热的领域之一。 面板数据同时包含了许多横截面在时间序列上的样本信息,不同于只有一个维度的纯粹横截面数据和时间序列数据,面板数据是同时有横截面和时序二维的。使用二维的面板数据相对于只使用横截面数据或时序数据,在理论上被认为有一些优点,其中一个重要的优点是面板数据被认为能够控制个体的异质性。在面板数据中,人们认为不同的横截面很可能具有异质性,这个异质性被认为是无法用已知的回归元观测的,同时异质性被假定为依横截面不同而不同,但在不同时点却是稳定的,因此可以用横截面虚拟变量来控制横截面的异质性,如果异质性是发生在不同时期的,那么则用时期虚拟变量来控制。而这些工作在只有横截面数据或时序数据时是无法完成的。 然而,实际上绝大多数时候我们并不关心这个异质性究竟是多少,我们关心的仍然是回归元参数的估计结果。使用面板数据做过实际研究的人可能会发现,使用的效应①不同,对回归元的估计结果经常有十分巨大的影响,在某个固定效应设定下回归系数为正显着,而另外一个效应则变为负显着,这种事情经常可以碰到,让人十分困惑。大多数的研究文献都将这种影响解释为控制了固定效应后的结果,因为不可观测的异质性(固定效应)很可能和回归元是相关的,在控制了这个效应后,由于变量之间的相关性,自然会对回归元的估计结果产生影响,因而使用的效应不同,估计的结果一般也就会有显着变化。 然而,这个被广泛接受的理论假说,本质上来讲是有问题的。我们认为,估计的效应不同,对应的自变量估计系数的含义也不同,而导致估计结果有显着变化的可能重要原因是由于面板数据是二维的数据,而在这两个不同维度上,以及将两个维度的信息放到一起时,样本信息所显现出来的自变量和因变量之间的相关关系可能是不同的。因此,我们这里提出另外一种异质性,即样本在不同维度上的相关关系是不同的,是异质的,这个异质性是发生在回归元的回归系数上,而

一分钟看懂计量经济学

一分钟看完计量经济学!!!------开学后的计量笔记 建模是计量的灵魂,所以就从建模开始。 一、 建模步骤:A,理论模型的设计: a,选择变量b,确定变量关系c,拟定参数范围 B,样本数据的收集: a,数据的类型b,数据的质量 C,样本参数的估计: a,模型的识别b,估价方法选择 D,模型的检验 a,经济意义的检验1正相关 2反相关等等 b,统计检验:1检验样本回归函数和样本的拟合优度,R的平方即其修正检验 2样本回归函数和总体回归函数的接近程度:单个解释变量显著性即t检验,函数显著性即F检验,接近程度的区间检验 c,模型预测检验1解释变量条件条件均值与个值的预测

2预测置信空间变化 d,参数的线性约束检验:1参数线性约束的检验 2模型增加或减少变量的检验 3参数的稳定性检验:邹氏参数稳定性检验,邹氏预测检验----------主要方法是以 F检验受约束前后模型的差异 e,参数的非线性约束检验:1最大似然比检验 2沃尔德检验 3拉格朗日乘数检验---------主要方法使用 X平方分布检验统计量分布特征 f,计量经济学检验 1,异方差性问题:特征:无偏,一致但标准差偏误。检测方法:图示法,Park与Gleiser检验法,Goldfeld-Quandt检验法,White检验法-------用WLS修正异方差 2,序列相关性问题:特征:无偏,一致,但检验不可靠,预测无效。检测方法:图示法,回归检验法,Durbin-Waston检验法,Lagrange乘子检验法-------用GLS或广义差分法修正序列相关性 3,多重共线性问题:特征:无偏,一致但标准差过大,t减小,正负号混乱。检测方法:先检验 多重共线性是否存在,再检验多重共线性的范围-------------用逐步回归法,差分法或使用额外信息,增大样本容量可以修正。

面板数据分析方法步骤

1.面板数据分析方法步骤 面板数据的分析方法或许我们已经了解许多了,但是到底有没有一个基本的步骤呢?那些步骤是必须的?这些都是我们在研究的过程中需要考虑的,而且又是很实在的问题。面板单位根检验如何进行?协整检验呢?什么情况下要进行模型的修正?面板模型回归形式的选择?如何更有效的进行回归?诸如此类的问题我们应该如何去分析并一一解决?以下是我近期对面板数据研究后做出的一个简要总结,和大家分享一下,也希望大家都进来讨论讨论。 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。 单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。 由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。 其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、

计量经济学数据分析

计量经济学数据分析 学院:管理与经济学院 专业:技术经济及管理 姓名:葛文 学号:20808172

分析中国经济发展对中国股票市场的影响本文通过分析2000年到2007年各月股票市场流通市值(value),成交金额(turnover),GDP现价和居民储蓄(saving)的相关数据,试图分析我国经济发展对股票市场的影响。数据来源为CCFR数据库和证监会网站。具体分析如下: 一、绘制四个数据变量的线性图,查看2000年到2007年他们各自的走势。 5000 10000 15000 20000 25000 2000200120022003200420052006 GDP 40000 60000 80000 100000 120000 140000 160000 180000 2000200120022003200420052006 SAVING 0 10000 20000 30000 40000 50000 60000 2000200120022003200420052006 turnover 10000 20000 30000 40000 50000 60000 2000200120022003200420052006 value 二、采用最小二乘法(OLS)进行分析

回归表达式:gdp=10433.48+0.191218*turnover 其中:Prob低于0.05,说明对应系数显著不为零;R2=0.195641,说明拟合程度一般;Prob(F-statistic)=0.000013<0.05,说明至少有一个解释变量的回归系数不为零。 回归表达式:gdp=8470.567+0.196853*value 其中:Prob低于0.05,说明对应系数显著不为零;R2=0.154730,说明拟合程度一般;Prob(F-statistic)=0.000125<0.05,说明至少有一个解释变量的回归系数不为零。

面板数据分析方法步骤全解

面板数据分析方法步骤全解 面板数据的分析方法或许我们已经了解许多了,但是到底有没有一个基本的步骤呢?那些步骤是必须的?这些都是我们在研究的过程中需要考虑的,而且又是很实在的问题。面板单位根检验如何进行?协整检验呢?什么情况下要进行模型的修正?面板模型回归形式的选择?如何更有效的进行回归?诸如此类的问题我们应该如何去分析并一一解决?以下是我近期对面板数据研究后做出的一个简要总结, 和大家分享一下,也希望大家都进来讨论讨论。 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈 曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归, 尽管有较高的R 平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正 含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势 以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时 有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性, 我们必须对各面板序 列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项, 从而为进一步的单位根检验的检验模式做准备。 单位根检验方法的文献综述:在非平稳的面板数据渐进过程中丄evin

an dLi n(1993)很早就发现这些估计量的极限分布是高斯分布,这些结 果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002的改进,提出了检验面板单 位根的LLC法。Levin et al. (2002)指出,该方法允许不同截距和时间趋 势,异方差和高阶序列相关,适合于中等维度(时间序列介于25?250 之间,截面数介于10?250之间)的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS法,但Breitung(2000)发现IPS法对 限定性趋势的设定极为敏感,并提出了面板单位根检验的Breit ung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位 根检验方法。 由上述综述可知,可以使用LLC IPS Breintung、ADF-Fisher和 PP-Fisher5种方法进行面板单位根检验。 其中LLC-T、BR-T IPS-W、ADF-FCS PP-FCS H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、Im Pesaran & Shin W 统计量、 ADF- Fisher Chi-square统计量、PP-FisherChi-square统计量、Hadri Z 统计量,并且Levin, Lin & Chu t*统计量、Breitung t统计量的原假设 为存在普通的单位根过程,Im Pesaran & Shin W统计量、ADF- Fisher Chi-square统计量、PP -Fisher Chi-square统计量的原假设为存在有效 的单位根过程,Hadri Z统计量的检验原假设为不存在普通的单位根 过程。

计量经济学实验题目和数据

注意:实验报告的题可以从以下题目中选择,也可以自己命题,自己命题要与金融专业知识相关。 第一部分多元线性回归 1、经研究发现,家庭书刊消费受家庭收入及户主受教育年数的影响,表中为对某地区部分家庭抽样调查得到样本数据: 家庭书刊年消费支出(元)Y 家庭月平 均收入 (元)X 户主受教 育年数 (年)T 家庭书 刊年消 费支出 (元)Y 家庭月平 均收入 (元)X 户主受教 育年数 (年)T 450 1027.2 8 793.2 1998.6 14 507.7 1045.2 9 660.8 2196 10 613.9 1225.8 12 792.7 2105.4 12 563.4 1312.2 9 580.8 2147.4 8 501.5 1316.4 7 612.7 2154 10 781.5 1442.4 15 890.8 2231.4 14 541.8 1641 9 1121 2611.8 18 611.1 1768.8 10 1094.2 3143.4 16 1222.1 1981.2 18 1253 3624.6 20 (1) 建立家庭书刊消费的计量经济模型; (2)利用样本数据估计模型的参数; (3)检验户主受教育年数对家庭书刊消费是否有显著影响; (4)分析所估计模型的经济意义和作用 2某地区城镇居民人均全年耐用消费品支出、人均年可支配收入及耐用消费品价格指数的统计资料如表所示: 年份人均耐用消费 品支出 Y(元)人均年可支配 收入 X1(元) 耐用消费品价 格指数 X2(1990年 =100) 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 137.16 124.56 107.91 102.96 125.24 162.45 217.43 253.42 251.07 285.85 327.26 1181.4 1375.7 1501.2 1700.6 2026.6 2577.4 3496.2 4283.0 4838.9 5160.3 5425.1 115.96 133.35 128.21 124.85 122.49 129.86 139.52 140.44 139.12 133.35 126.39 利用表中数据,建立该地区城镇居民人均全年耐用消费品支出关于人均年可支配收入和耐用消费品价格指数的回归模型,进行回归分析,并检验人均年可支配收入及耐用消费品价格指数对城镇居民人均全年耐用消费品支出是否有显著影响。

面板数据模型入门讲解

第十四章 面板数据模型 在第五章,当我们分析城镇居民的消费特征时,我们使用的是城镇居民的时间序列数据;而当分析农村居民的消费特征时,我们使用农村居民的时间序列数据。如果我们想要分析全体中国居民的消费特征呢?我们有两种选择:一是使用中国居民的时间序列数据进行分析,二是把城镇居民和农村居民的样本合并,实际上就是两个时间序列的样本合并为一个样本。 多个观测对象的时间序列数据所组成的样本数据,被称为面板数据(Panel Data )。通常也被称为综列数据,意即综合了多个时间序列的数据。当然,面板数据也可以看成多个横截面数据的综合。在面板数据中,每一个观测对象,我们称之为一个个体(Individual )。例如城镇居民是一个观测个体,农村居民是另一个观测个体。 如果面板数据中各观测个体的观测区间是相同的,我们称其为平衡的面板数据,反之,则为非平衡的面板数据。基于面板数据所建立的计量经济学模型则被称为面板数据模型。例如,表5.3.1中城镇居民和农村居民的样本数据具有相同的采样区间,所以,它是一个平衡的面板数据。 §14.1 面板数据模型 一、两个例子 1. 居民消费行为的面板数据分析 让我们重新回到居民消费的例子。在表5.1.1中,如果我们将城镇居民和农村居民的时间序列数据作为一个样本,以分析中国居民的消费特征。那么,此时模型(5.1.1)的凯恩斯消费函数就可以表述为: it it it Y C εββ++=10 (14.1.1) it t i it u ++=λμε (14.1.2) 其中:it C 和it Y 分别表示第i 个观测个体在第t 期的消费和收入。i =1、2分别表示城镇居民和农村居民两个观测个体,t =1980、…、2008表示不同年度。it u 为经典误差项。 在(14.1.2)中,i μ随观测个体的变化,而不随时间变化,它反映个体之间不随时间变化的差异性,被称为个体效应。t λ反映不随个体变化的时间上的差异性,被称为时间效应。在本例中,城镇居民和农村居民的消费差异一部分来自收入差异和随机扰动,还有一部分差

相关主题