搜档网
当前位置:搜档网 › 古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

第15章定性响应回归模型

15.1 复习笔记

考点一:定性响应模型的性质★★

定性响应模型是指模型中的回归子是一个二值或二分变量的模型,通常被称为概率模型。回归子也可以是多分响应变量或多类型响应变量。将二值响应变量建立成概率模型的方法包括线性概率模型(LPM)、logit模型、probit模型和tobit模型。

考点二:线性概率模型(LPM)★★★★

1.LPM的定义

以下述回归模型为例说明:Y i=β1+β2X i+u i。其中X表示家庭收入;Y=1,则表示该家庭拥有住房;Y=0,则该家庭不拥有住房。该模型被称为线性概率模型,因为Y i在给定X i下的条件期望E(Y i|X i)可解释为在给定X i下事件(家庭拥有住房)发生的条件概率,即Pr(Y i=1|X i)。

2.LPM的特征

令P i表示“Y i=1”(即事件发生)的概率,而1-P i表示“Y i=0”(即事件不发生)的概率,则变量Y i服从贝努利概率分布。

根据期望的定义,有:E(Y i)=0(1-P i)+1P i=P i。此外有:E(Y i|X i)=β1+β2X i =P i,即模型的条件期望事实上可以解释为Y i的条件概率。

该模型的约束条件为:0≤E(Y i|X i)≤1。

3.LPM的问题

(1)干扰项u i的非正态性

若把方程写成:u i=Y i-β1-β2X i,u i的概率分布见表15-1。

表15-1 u i的概率分布

可见u i服从贝努利分布而不是正态分布。虽然干扰项不满足正态性假定,但OLS的点估计值仍具有无偏性。此外在大样本下,OLS估计量一般都趋于正态分布,因此LPM的统计推断仍可用正态性假定下的OLS程序。

(2)干扰项的异方差性

即使LPM中的干扰项满足零均值和无序列相关性假定,但也不能说它具有同方差性。对于贝努利分布,理论上的均值和方差分别为P和P(1-P),可见方差是均值的函数,而均值的取值依赖于X的值,因此LPM中的干扰项具有异方差性。

由于u i的方差依赖于E(Y i|X i),解决异方差性问题的方法之一就是进行数据变换,将模型的两边同时除以:

==

即:

12i i i Y X u ββ=++ 可以证明,上述方程中变换后的误差项是同方差的。因此,可以用OLS 对该方程进行

估计,这就是加权最小二乘估计(WLS )。 在实践中,由于真实的E (Y i |X i )未知,所以权重w i 也是未知的。为了估计w i ,可以用如下两步法:

步骤1:直接先对具有异方差的方程进行OLS 回归,可得到Y ∧i ,再求出w i 的估计值w ∧

i =Y ∧i (1-Y ∧i )。

步骤2:用估计的w i 去做数据变换,并用加权最小二乘法估计变换后的方程。

(3)不满足0≤E (Y i |X i )≤1情形

用OLS 估计LPM 时,没有考虑0≤E (Y i |X i )≤1的约束条件,因此无法保证E (Y i |X i )的估计量Y ∧i 的取值在0到1之间。有两种方法可以使估计的Y ∧i 介于0到1之间: ①用OLS 法估计LPM ,对于小于0的Y ∧i 取值为零,大于1的Y ∧i 则取值为1。 ②设计logit 和probit 模型等估计方法,以保证所估计的条件概率必定处于0与1之间。

(4)可疑的拟合优度:R 2值

在二分响应模型中,计算出的R 2大多介于0.2与0.6之间,比1小很多,可见R 2的价值是有限的。因此,在有定性因变量的模型中应避免使用判定系数。LPM 的根本问题在于,它假定P i =E (Y =1|X )随X 而线性增加,即X 的边际效应一直保持不变。

考点三:logit 模型 ★★★★

1.模型 LPM 若为:P i =β1+β2X i 。现在考虑如下表达式:

()1211i i X P e ββ-+=

+

把方程写成: 111i i i

Z i Z Z e P e e -==++ 其中Z i =β1+β2X i 。上式就是logistic (累积)分布函数。

并且由于: 111i

i Z P e -=+

因此有: 111i i i Z Z i Z i P e e P e

-+==-+ 取方程的自然对数得到:L i =ln[P i /(1-P i )]=Z i =β1+β2X i 。可见,机会比率的对数

L i 是X i 和参数的线性函数,上述模型称为logit 模型。

2.logit 模型的特点(见表15-2)

表15-2 logit 模型的特点

考点四:logit模型的估计★★★★

为达到估计目的,将方程改写成:L∧i=ln[P∧i/(1-P∧i)]=β∧1+β∧2X i+u i。对于模型的估计要区分个体层次上的数据和群组观测数据。

1.个体层次上的数据

如果数据属于微观或个体层次,就无法运用标准的OLS估计,只能采用极大似然(ML)法估计。

2.群组或重复观测数据

将相对频数作为P i估计值,即P∧i=n i/N i,可得logit模型:L∧i=ln[P∧i/(1-P∧i)]=β∧1+β∧2X i。如果在每一X i处的观测个数N i都足够大,那么这将是真实logit即L i的相当好的估计值。

可以证明,如果N i相当大,且对于给定X i的每一次观测独立地服从一个二值变量的分布,那么u i~N{0,1/[N i P i(1-P i)]}。因此,logit模型的干扰项也具有异方差性,必须使用加权最小二乘法。在经验研究中,用P∧i代替未知的P i并用下式作为σ2的估计量:σ∧2=1/[N i P∧i(1-P∧i)]。

3.logit 回归的步骤 (1)对每个X i 计算估计概率P ∧

i =n i /N i 。

(2)对每个X i 求logit :L ∧i =ln[P ∧i /(1-P ∧i )]。

(3)为解决异方差性的问题,将方程变换如下:

2i i i ββ=++

或把它简写为:

2i i i L X ββυ**=++

其中权重w i =N i P ∧i (1-P ∧i )。可以证明变换后的误差项υi 是同方差的。

(4)用OLS 去估计变换后的方程。注意方程没有明确引入截距项,还需用过原点回归程序估计方程。

(5)按照平常的OLS 框架构造置信区间或检验假设。但是仅当样本足够大时,所得到的结论才合理。因此对于小样本解释估计结果时需谨慎。

4.logit 模型估计值解释

logit 估计值为L i =ln[P i /(1-P i )],取它的反对数便得到机会比率P i /(1-P i )。一般地说,如果取笫i 个斜率系数的反对数,再减去1并乘以100得到的结果表示:对应于第一个回归元,每增加1单位导致机会比率的百分比变化。

考点五:非群组数据或个体数据的logit 模型 ★★★

一般性观察的结论:

相关主题