当前位置：搜档网 › 古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

第15章定性响应回归模型

15.1 复习笔记

考点一：定性响应模型的性质★★

定性响应模型是指模型中的回归子是一个二值或二分变量的模型，通常被称为概率模型。回归子也可以是多分响应变量或多类型响应变量。将二值响应变量建立成概率模型的方法包括线性概率模型（LPM）、logit模型、probit模型和tobit模型。

考点二：线性概率模型（LPM）★★★★

1．LPM的定义

以下述回归模型为例说明：Y i＝β1＋β2X i＋u i。其中X表示家庭收入；Y＝1，则表示该家庭拥有住房；Y＝0，则该家庭不拥有住房。该模型被称为线性概率模型，因为Y i在给定X i下的条件期望E（Y i|X i）可解释为在给定X i下事件（家庭拥有住房）发生的条件概率，即Pr（Y i＝1|X i）。

2．LPM的特征

令P i表示“Y i＝1”（即事件发生）的概率，而1－P i表示“Y i＝0”（即事件不发生）的概率，则变量Y i服从贝努利概率分布。

根据期望的定义，有：E（Y i）＝0（1－P i）＋1P i＝P i。此外有：E（Y i|X i）＝β1＋β2X i ＝P i，即模型的条件期望事实上可以解释为Y i的条件概率。

该模型的约束条件为：0≤E（Y i|X i）≤1。

3．LPM的问题

（1）干扰项u i的非正态性

若把方程写成：u i＝Y i－β1－β2X i，u i的概率分布见表15-1。

表15-1 u i的概率分布

可见u i服从贝努利分布而不是正态分布。虽然干扰项不满足正态性假定，但OLS的点估计值仍具有无偏性。此外在大样本下，OLS估计量一般都趋于正态分布，因此LPM的统计推断仍可用正态性假定下的OLS程序。

（2）干扰项的异方差性

即使LPM中的干扰项满足零均值和无序列相关性假定，但也不能说它具有同方差性。对于贝努利分布，理论上的均值和方差分别为P和P（1－P），可见方差是均值的函数，而均值的取值依赖于X的值，因此LPM中的干扰项具有异方差性。

由于u i的方差依赖于E（Y i|X i），解决异方差性问题的方法之一就是进行数据变换，将模型的两边同时除以：

即：

12i i i Y X u ββ=++ 可以证明，上述方程中变换后的误差项是同方差的。因此，可以用OLS 对该方程进行

估计，这就是加权最小二乘估计（WLS ）。在实践中，由于真实的E （Y i |X i ）未知，所以权重w i 也是未知的。为了估计w i ，可以用如下两步法：

步骤1：直接先对具有异方差的方程进行OLS 回归，可得到Y ∧i ，再求出w i 的估计值w ∧

i ＝Y ∧i （1－Y ∧i ）。

步骤2：用估计的w i 去做数据变换，并用加权最小二乘法估计变换后的方程。

（3）不满足0≤E （Y i |X i ）≤1情形

用OLS 估计LPM 时，没有考虑0≤E （Y i |X i ）≤1的约束条件，因此无法保证E （Y i |X i ）的估计量Y ∧i 的取值在0到1之间。有两种方法可以使估计的Y ∧i 介于0到1之间： ①用OLS 法估计LPM ，对于小于0的Y ∧i 取值为零，大于1的Y ∧i 则取值为1。 ②设计logit 和probit 模型等估计方法，以保证所估计的条件概率必定处于0与1之间。

（4）可疑的拟合优度：R 2值

在二分响应模型中，计算出的R 2大多介于0.2与0.6之间，比1小很多，可见R 2的价值是有限的。因此，在有定性因变量的模型中应避免使用判定系数。LPM 的根本问题在于，它假定P i ＝E （Y ＝1|X ）随X 而线性增加，即X 的边际效应一直保持不变。

考点三：logit 模型 ★★★★

1．模型 LPM 若为：P i ＝β1＋β2X i 。现在考虑如下表达式：

()1211i i X P e ββ-+=

把方程写成： 111i i i

Z i Z Z e P e e -==++ 其中Z i ＝β1＋β2X i 。上式就是logistic （累积）分布函数。

并且由于： 111i

i Z P e -=+

因此有： 111i i i Z Z i Z i P e e P e

-+==-+ 取方程的自然对数得到：L i ＝ln[P i /（1－P i ）]＝Z i ＝β1＋β2X i 。可见，机会比率的对数

L i 是X i 和参数的线性函数，上述模型称为logit 模型。

2．logit 模型的特点（见表15-2）

表15-2 logit 模型的特点

考点四：logit模型的估计★★★★

为达到估计目的，将方程改写成：L∧i＝ln[P∧i/（1－P∧i）]＝β∧1＋β∧2X i＋u i。对于模型的估计要区分个体层次上的数据和群组观测数据。

1．个体层次上的数据

如果数据属于微观或个体层次，就无法运用标准的OLS估计，只能采用极大似然（ML）法估计。

2．群组或重复观测数据

将相对频数作为P i估计值，即P∧i＝n i/N i，可得logit模型：L∧i＝ln[P∧i/（1－P∧i）]＝β∧1＋β∧2X i。如果在每一X i处的观测个数N i都足够大，那么这将是真实logit即L i的相当好的估计值。

可以证明，如果N i相当大，且对于给定X i的每一次观测独立地服从一个二值变量的分布，那么u i～N{0，1/[N i P i（1－P i）]}。因此，logit模型的干扰项也具有异方差性，必须使用加权最小二乘法。在经验研究中，用P∧i代替未知的P i并用下式作为σ2的估计量：σ∧2＝1/[N i P∧i（1－P∧i）]。

3．logit 回归的步骤（1）对每个X i 计算估计概率P ∧

i ＝n i /N i 。

（2）对每个X i 求logit ：L ∧i ＝ln[P ∧i /（1－P ∧i ）]。

（3）为解决异方差性的问题，将方程变换如下：

2i i i ββ=++

或把它简写为：

2i i i L X ββυ**=++

其中权重w i ＝N i P ∧i （1－P ∧i ）。可以证明变换后的误差项υi 是同方差的。

（4）用OLS 去估计变换后的方程。注意方程没有明确引入截距项，还需用过原点回归程序估计方程。

（5）按照平常的OLS 框架构造置信区间或检验假设。但是仅当样本足够大时，所得到的结论才合理。因此对于小样本解释估计结果时需谨慎。

4．logit 模型估计值解释

logit 估计值为L i ＝ln[P i /（1－P i ）]，取它的反对数便得到机会比率P i /（1－P i ）。一般地说，如果取笫i 个斜率系数的反对数，再减去1并乘以100得到的结果表示：对应于第一个回归元，每增加1单位导致机会比率的百分比变化。

考点五：非群组数据或个体数据的logit 模型 ★★★

一般性观察的结论：

古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

相关文档

最新文档