搜档网
当前位置:搜档网 › (完整版)伍德里奇-计量经济学导论课后习题(中文版)

(完整版)伍德里奇-计量经济学导论课后习题(中文版)

(完整版)伍德里奇-计量经济学导论课后习题(中文版)
(完整版)伍德里奇-计量经济学导论课后习题(中文版)

计量经济学导论第五版第一章上机作业

过程 *describetive statistc* tabstat prate mrate totpart,stat(max min mean p50 sd n) 结果 stats | prate mrate totpart ---------+------------------------------ max | 100 4.91 58811 min | 3 .01 50 mean | 87.36291 .7315124 1354.231 p50 | 95.7 .46 276 sd | 16.71654 .7795393 4629.265 N | 1534 1534 1534 过程 summarize 全部的加总 summarize prate mrate 两个变量 summarize sole prate,detail 结果 summarize Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- prate | 1534 87.36291 16.71654 3 100 mrate | 1534 .7315124 .7795393 .01 4.91 totpart | 1534 1354.231 4629.265 50 58811 totelg | 1534 1628.535 5370.719 51 70429 age | 1534 13.18123 9.171114 4 51 -------------+-------------------------------------------------------- totemp | 1534 3568.495 11217.94 58 144387 sole | 1534 .4876141 .5000096 0 1 ltotemp | 1534 6.686034 1.453375 4.060443 11.88025 summarize prate mrate Variable | Obs Mean Std. Dev. Min Max -------------+-------------------------------------------------------- prate | 1534 87.36291 16.71654 3 100 mrate | 1534 .7315124 .7795393 .01 4.91 summarize sole prate,detail = 1 if 401k is firm's sole plan ------------------------------------------------------------- Percentiles Smallest 1% 0 0 5% 0 0 10% 0 0 Obs 1534 25% 0 0 Sum of Wgt. 1534

计量经济学导论 第五版 答案

APPENDIX A SOLUTIONS TO PROBLEMS A.1 (i) $566. (ii) The two middle numbers are 480 and 530; when these are averaged, we obtain 505, or $505. (iii) 5.66 and 5.05, respectively. (iv) The average increases to $586 while the median is unchanged ($505). A.3 If price = 15 and income = 200, quantity = 120 – 9.8(15) + .03(200) = –21, which is nonsense. This shows that linear demand functions generally cannot describe demand over a wide range of prices and income. A.5 The majority shareholder is referring to the percentage point increase in the stock return, while the CEO is referring to the change relative to the initial return of 15%. To be precise, the shareholder should specifically refer to a 3 percentage point increase. $45,935.80.≈ $40,134.84. When exper = 5, salary = exp[10.6 + .027(5)] ≈A.7 (i) When exper = 0, log(salary) = 10.6; therefore, salary = exp(10.6) (ii) The approximate proportionate increase is .027(5) = .135, so the approximate percentage change is 13.5%. 14.5%, so the exact percentage increase is about one percentage point higher.≈(iii) 100[(45,935.80 – 40,134.84)/40,134.84) A.9 (i) The relationship between yield and fertilizer is graphed below. (ii) Compared with a linear function, the function yield has a diminishing effect, and the slope approaches zero as fertilizer gets large. The initial pound of fertilizer has the largest effect, and each additional pound has an effect smaller than the previous pound.

计量经济学(伍德里奇第五版中文版)答案

第1章 解决问题的办法 1.1(一)理想的情况下,我们可以随机分配学生到不同尺寸的类。也就是说,每个学生被分配一个不同的类的大小,而不考虑任何学生的特点,能力和家庭背景。对于原因,我们将看到在第2章中,我们想的巨大变化,班级规模(主题,当然,伦理方面的考虑和资源约束)。 (二)呈负相关关系意味着,较大的一类大小是与较低的性能。因为班级规模较大的性能实际上伤害,我们可能会发现呈负相关。然而,随着观测数据,还有其他的原因,我们可能会发现负相关关系。例如,来自较富裕家庭的儿童可能更有可能参加班级规模较小的学校,和富裕的孩子一般在标准化考试中成绩更好。另一种可能性是,在学校,校长可能分配更好的学生,以小班授课。或者,有些家长可能会坚持他们的孩子都在较小的类,这些家长往往是更多地参与子女的教育。 (三)鉴于潜在的混杂因素- 其中一些是第(ii)上市- 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。 1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B公司的不同? (二)公司很可能取决于工人的特点选择在职培训。一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。企业甚至可能歧视根据年龄,性别或种族。也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。 (iii)该金额的资金和技术工人也将影响输出。所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。管理者的素质也有效果。 (iv)无,除非训练量是随机分配。许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。 1.3没有任何意义,提出这个问题的因果关系。经济学家会认为学生选择的混合学习和工作(和其他活动,如上课,休闲,睡觉)的基础上的理性行为,如效用最大化的约束,在一个星期只有168小时。然后我们可以使用统计方法来衡量之间的关联学习和工作,包括回归分析,我们覆盖第2章开始。但我们不会声称一个变量“使”等。他们都选择学生的变量。 第2章 解决问题的办法

伍德里奇《计量经济学导论》笔记和课后习题详解(计量经济学的性质与经济数据)【圣才出品】

第1章计量经济学的性质与经济数据 1.1 复习笔记 一、计量经济学 由于计量经济学主要考虑在搜集和分析非实验经济数据时的固有问题,计量经济学已从数理统计分离出来并演化成一门独立学科。 1.非实验数据是指并非从对个人、企业或经济系统中的某些部分的控制实验而得来的数据。非实验数据有时被称为观测数据或回顾数据,以强调研究者只是被动的数据搜集者这一事实。 2.实验数据通常是在实验环境中获得的,但在社会科学中要得到这些实验数据则困难得多。 二、经验经济分析的步骤 经验分析就是利用数据来检验某个理论或估计某种关系。 1.对所关心问题的详细阐述 在某些情形下,特别是涉及到对经济理论的检验时,就要构造一个规范的经济模型。经济模型总是由描述各种关系的数理方程构成。 2.经济模型变成计量模型 先了解一下计量模型和经济模型有何关系。与经济分析不同,在进行计量经济分析之前,必须明确函数的形式。

通过设定一个特定的计量经济模型,就解决了经济模型中内在的不确定性。 在多数情况下,计量经济分析是从对一个计量经济模型的设定开始的,而没有考虑模型构造的细节。一旦设定了一个计量模型,所关心的各种假设便可用未知参数来表述。 3.搜集相关变量的数据 4.用计量方法来估计计量模型中的参数,并规范地检验所关心的假设 在某些情况下,计量模型还用于对理论的检验或对政策影响的研究。 三、经济数据的结构 1.横截面数据 (1)横截面数据集,就是在给定时点对个人、家庭、企业、城市、州、国家或一系列其他单位采集的样本所构成的数据集。有时,所有单位的数据并非完全对应于同一时间段。在一个纯粹的横截面分析中,应该忽略数据搜集中细小的时间差别。 (2)横截面数据的重要特征 ①假定它们是从样本背后的总体中通过随机抽样而得到的。 当抽取的样本(特别是地理上的样本)相对总体而言太大时,可能会导致另一种偏离随机抽样的情况。这种情形中潜在的问题是,总体不够大,所以不能合理地假定观测值是独立抽取的。 ②数据排序不影响计量分析这一事实,是由随机抽样而得到横截面数据集的一个重要特征。 2.时间序列数据 (1)时间序列数据集,是由对一个或几个变量不同时间的观测值所构成。与横截面数据的排序不同,时间序列对观测值按时间先后排序,这也传递了潜在的重要信息。

伍德里奇计量经济学英文版各章总结

CHAPTER 1 TEACHING NOTES You have substantial latitude about what to emphasize in Chapter 1. I find it useful to talk about the economics of crime example (Example 1.1) and the wage example (Example 1.2) so that students see, at the outset, that econometrics is linked to economic reasoning, even if the economics is not complicated theory. I like to familiarize students with the important data structures that empirical economists use, focusing primarily on cross-sectional and time series data sets, as these are what I cover in a first-semester course. It is probably a good idea to mention the growing importance of data sets that have both a cross-sectional and time dimension. I spend almost an entire lecture talking about the problems inherent in drawing causal inferences in the social sciences. I do this mostly through the agricultural yield, return to education, and crime examples. These examples also contrast experimental and nonexperimental (observational) data. Students studying business and finance tend to find the term structure of interest rates example more relevant, although the issue there is testing the implication of a simple theory, as opposed to inferring causality. I have found that spending time talking about these examples, in place of a formal review of probability and statistics, is more successful (and more enjoyable for the students and me). CHAPTER 2 TEACHING NOTES This is the chapter where I expect students to follow most, if not all, of the algebraic derivations. In class I like to derive at least the unbiasedness of the OLS slope coefficient, and usually I derive the variance. At a minimum, I talk about the factors affecting the variance. To simplify the notation, after I emphasize the assumptions in the population model, and assume random sampling, I just condition on the values of the explanatory variables in the sample. Technically, this is justified by random sampling because, for example, E(u i|x1,x2,…,x n) = E(u i|x i) by independent sampling. I find that students are able to focus on the key assumption SLR.4 and subsequently take my word about how conditioning on the independent variables in the sample is harmless. (If you prefer, the appendix to Chapter 3 does the conditioning argument carefully.) Because statistical inference is no more difficult in multiple regression than in simple regression, I postpone inference until Chapter 4. (This reduces redundancy and allows you to focus on the interpretive differences between simple and multiple regression.) You might notice how, compared with most other texts, I use relatively few assumptions to derive the unbiasedness of the OLS slope estimator, followed by the formula for its variance. This is because I do not introduce redundant or unnecessary assumptions. For example, once SLR.4 is assumed, nothing further about the relationship between u and x is needed to obtain the unbiasedness of OLS under random sampling. CHAPTER 3

伍德里奇:计量经济学导论

APPENDIX C SOLUTIONS TO PROBLEMS C.1 (i) This is just a special case of what we covered in the text, with n = 4: E(Y) = μ and Var(Y) = σ2/4. (ii) E(W) = E(Y1)/8 + E(Y2)/8 + E(Y3)/4 + E(Y4)/2 = μ[(1/8) + (1/8) + (1/4) + (1/2)] = μ(1 + 1 + 2 + 4)/8 = μ, which shows that W is unbiased. Because the Y i are independent, Var(W) = Var(Y1)/64 + Var(Y2)/64 + Var(Y3)/16 + Var(Y4)/4 = σ2[(1/64) + (1/64) + (4/64) + (16/64)] = σ2(22/64) = σ2(11/32). (iii) Because 11/32 > 8/32 = 1/4, Var(W) > Var(Y) for any σ2 > 0, so Y is preferred to W because each is unbiased. C.3 (i) E(W1) = [(n– 1)/n]E(Y) = [(n– 1)/n]μ, and so Bias(W1) = [(n– 1)/n]μ–μ = –μ/n. Similarly, E(W2) = E(Y)/2 = μ/2, and so Bias(W2) = μ/2 –μ = –μ/2. The bias in W1 tends to zero as n→∞, while the bias in W2 is –μ/2 for all n. This is an important difference. (ii) plim(W1) = plim[(n– 1)/n]?plim(Y) = 1?μ = μ. plim(W2) = plim(Y)/2 = μ/2. Because plim(W1) = μ and plim(W2) = μ/2, W1 is consistent whereas W2 is inconsistent. (iii) Var(W1) = [(n– 1)/n]2Var(Y) = [(n– 1)2/n3]σ2 and Var(W2) = Var(Y)/4 = σ2/(4n). (iv) Because Y is unbiased, its mean squared error is simply its variance. On the other hand, MSE(W1) = Var(W1) + [Bias(W1)]2 = [(n– 1)2/n3]σ2 + μ2/n2. When μ = 0, MSE(W1) = Var(W1) = [(n– 1)2/n3]σ2 < σ2/n = Var(Y) because (n– 1)/n < 1. Therefore, MSE(W1) is smaller than Var(Y) for μ close to zero. For large n, the difference between the two estimators is trivial. C.5 (i) While the expected value of the numerator of G is E(Y) = θ, and the expected value of the denominator is E(1 –Y) = 1 –θ, the expected value of the ratio is not the ratio of the expected value. (ii) By Property PLIM.2(iii), the plim of the ratio is the ratio of the plims (provided the plim of the denominator is not zero): plim(G) = plim[Y/(1 –Y)] = plim(Y)/[1 – plim(Y)] = θ/(1 –θ) = γ. C.7 (i) The average increase in wage is d = .24, or 24 cents. The sample standard deviation is about .451, and so, with n = 15, the standard error of d is ≈.1164. From Table G.2, the 97.5th percentile in the t14 distribution is 2.145. So the 95% CI is .24 ± 2.145(.1164), or about –.010 to .490. 114

计量经济学导论第四版部分课后答案中文翻译

2.10(iii) From (2.57), Var(1?β) = σ2/21()n i i x x =??- ???∑. 由提示:: 21n i i x =∑ ≥ 21()n i i x x =-∑, and so Var(1β ) ≤ Var(1?β). A more direct way to see this is to write(一个更直接的方式看到这是编写) 21()n i i x x =-∑ = 2 21()n i i x n x =-∑, which is less than 21n i i x =∑unless x = 0. (iv)给定的c 2i x 但随着x 的增加, 1?β的方差与Var(1β )的相关性也增加.0 β小时1β 的偏差也小.因此, 在均方误差的基础上不管我们选择0β还是1β 要取决于0β,x ,和n 的大小 (除了 21n i i x =∑的大小). 3.7We can use Table 3.2. By definition, 2β > 0, and by assumption, Corr(x 1,x 2) < 0. Therefore, there is a negative bias in 1β : E(1β ) < 1 β. This means that, on average across different random samples, the simple regression estimator underestimates the effect of the training program. It is even possible that E(1 β ) is negative even though 1β > 0. 我们可以使用表3.2。根据定义,> 0,由假设,科尔(X1,X2)<0。因此,有一个负偏压为:E ()<。这意味着,平均在不同的随机抽样,简单的回归估计低估的培训计划的效果。 E (下),它甚至可能是负的,即使>0。 我们可以使用表格3.2。根据定义,> 0,通过假设,柯尔(x1,x2)< 0。因此,有一种负面的偏见:E()<。这意味着,平均跨不同的随机样本,简单的回归估计低估了培训项目的效果。甚至可能让E()是负的,尽管> 0。 3.8 Only (ii), omitting an important variable, can cause bias, and this is true only when the omitted variable is correlated with the included explanatory variables. The homoskedasticity assumption, MLR.5, played no role in showing that the OLS estimators are unbiased. (Homoskedasticity was used to obtain the usual variance formulas for the ?j β.) Further, the degree of collinearity between the explanatory variables in the sample, even if it is reflected in a correlation as high as .95, does not affect the Gauss-Markov assumptions. Only if there is a perfect linear relationship among two or more explanatory variables is MLR.3 violated. 只有3.8(ii),遗漏重要变量,会造成偏见确实是这样,只有当省略变量就与包括解释变量。homoskedasticity 的假设,多元线性回归。5,没有发挥作用在显示OLS 估计量是公正的。(Homoskedasticity 是用来获取通常的方差公式。)进一步,共线的程度解释变量之间的样品中,即使它是反映在尽可能高的相关性。95年,不影响的高斯-马尔可夫假定。只要有一个完美的线性关系在两个或更多的解释变量是多元线性回归。三违反了。 3.9 (i) Because 1x is highly correlated with 2x and 3x , and these latter variables have large partial effects on y , the simple and multiple regression coefficients on 1x can differ by large amounts. We have not done this case explicitly, but given equation (3.46) and the discussion with a single omitted variable, the intuition is pretty straightforward. 因为 是高度相关,和这些后面的变量有很大部分影响y,简单和多元回归系数的差异可大量。我们还没有做到,这种情况下显式,但鉴于方程(3.46)和以讨论单个变量遗漏,直觉是相当简单的。 (ii) Here we would expect 1β and 1 ?β to be similar (subject, of course, to what we mean by “almost uncorrelated”). The amount of correlation between 2x and 3x does not directly effect the multiple regression estimate on 1x if 1x is essentially uncorrelated with 2x and 3x . 这里我们将期待和相似(主题,当然对我们所说的“几乎不相关的”)。相关性的数量,但不会直接影响了多元回归估计如果本质上是不相关的和。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第18章 时间序列高级专题【圣才出品】

第18章时间序列高级专题 18.1复习笔记 一、无限分布滞后模型 1.无限分布滞后模型 令{(y t ,z t ):t=…,-2,-1,0,1,2,…}代表一个双变量时间序列过程。将y t 与z 的当期和所有过去值相联系的一个无限分布滞后模型(IDL)为: 01122t t t t t y z z z u αδδδ--=+++++…其中,z 的滞后可以一直追溯到无限过去,因此IDL 模型不要求在某个特定时刻截断滞后。 为了使IDL 模型有意义,随着j 趋于无穷大,滞后系数j δ必须趋于0。这并不意味着2δ在数量上比1δ小,只是要求z t-1对y t 的影响必须随着j 无限递增而最终变得很小。相应的经济含义:遥远过去的z 对y 的解释能力不如新近过去的z。 如果IDL 模型不加限制,那么是无法估计的,因为模型中有无数个参数,而只能观测到有限的样本数据。 (1)无限分布滞后模型的短期倾向 01122t t t t t y z z z u αδδδ--=+++++…的短期倾向就是0δ。假设s﹤0时,z s =0;s ﹥0时z s =1,z 1=0。也就是说,z 在t=0时期暂时性地增加一个单位,然后又回到它的初始值0。对所有h≥0,都有h h h y u αδ=++ ,所以有 ()h h E y αδ=+

给定z 在0时期的一个单位的暂时变化,h δ就是E (y k )的改变值。因为在IDL 模型中,h δ必须随着h 渐增而趋于0,所以z 的一个暂时变化对y 的期望值没有长期影响:随着h →∞,()h h E y αδα=+→。 如果z 在t 时期暂时增加一个单位,那么h δ就度量了h 个时期后y 的期望值变化。滞后分布显示了给定z 暂时增加一个单位,未来的y 所服从的期望路径。 (2)无限分布滞后模型的长期倾向 长期倾向等于所有滞后系数之和: 0123LRP δδδδ=++++… 因为假定j δ必须收敛于0,所以对于足够大的p,LRP 常常用01....p δδδ+++近似,LRP 度量了给定z 一个单位的永久性增加,y 的期望值的长期变化。 (3)无限分布滞后模型的严格外生性假定: ①无限分布滞后模型严格外生性假定规范的表述是: ()211| 0 t t t t t E u z z z z --+=…,,,,,…任何时期z 的变化都不会对u t 的期望值有影响。 ②更弱一点的假定是: ()1| 0 t t t E u z z -=,,…在该假定下,误差与现在和过去的z 都不相关,但它有可能与将来的z 相关;这就容许z t 所服从的政策规则能够取决于过去的y。 2.几何(或考依克)分布滞后 (1)模型的函数形式

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第16章 联立方程模型【圣才出品】

第16章联立方程模型 16.1复习笔记 解释变量另一种重要的内生性形式是联立性。当一个或多个解释变量与因变量联合被决定时,就出现联立性问题。 一、联立方程模型的性质 联立方程组中的每个方程都具有其他条件不变的因果性解释。SEM(联立方程模型)的经典例子是某个商品或要素投入的供给和需求方程: 劳动供给函数与需求函数是从经济理论推导出来并具有因果性解释的事实,是结构方程。这两个方程一起构成了一个联立方程模型。 联立方程模型的重要特征: ①给定z i1、z i2、u i1和u i2,这两个方程就决定了h i和w i。h i和w i是这个SEM中的内生变量。z i1和z i2由于在模型外决定,是外生变量。 ②从统计观点来看,关于z i1和z i2的关键假定是,它们都与u i1和u i2无关。由于这些误差出现在结构方程中,所以它们是结构误差。 ③SEM中的每个方程自身都应该有一个行为上的其他条件不变解释。 二、OLS中的联立性偏误 在一个简单模型中,与因变量同时决定的解释变量一般都与误差项相关,这就导致OLS

中存在偏误和不一致性。 1.约简型方程 考虑两个方程的结构模型: 112111 y y z u αβ=++221222 y y z u αβ=++专门估计第一个方程。变量z 1和z 2都是外生的,所以每个都与u 1和u 2无关。 如果将式1 12111y y z u αβ=++的右边作为y 1代入式221222y y z u αβ=++中, 得到()21221122212 1y z z u u αααββα-=+++为了解出y 2,需对参数做一个假定: 211 αα≠这个假定是否具有限制性则取决于应用。如果上式的条件成立,y 2可写成 22112222 y z z v ππ=++其中,()212121/1παβαα=-、()22221/1πβαα=-和()()221221/1v u u ααα=+-,用外生变量和误差项表示y 2的方程22112222y z z v ππ=++是y 2的约简型。参数21π和22π被称为约简型参数,它们是结构方程中出现的结构型参数的非线性函数。 约简型误差v 2是结构型误差u 1和u 2的线性函数。因为u 1和u 2都与z 1和z 2无关,所以v 2也与z 1和z 2无关。因此,可用OLS 一致地估计21π和22π。 2.联立性偏误及其方向

伍德里奇---计量经济学第4章部分计算机习题详解(MATLAB)

班级:金融学×××班姓名:××学号:×××××××C4.1 voteA=β0+β1log expendA+β2log expendB+β3prtystrA+u 其中,voteA表示候选人A得到的选票百分数,expendA和expendB分别表示候选人A和B的竞选支出,而prtystrA则是对A所在党派势力的一种度量(A所在党派在最近一次总统选举中获得的选票百分比)。 解:(ⅰ)如何解释β1? β1表示当候选人B的竞选支出和候选人A所在党派势力固定不变时,候选人A的竞选支出 (expendA)增加一个百分点时,voteA将增加β1 100。 (ⅱ)用参数表述如下虚拟假设:A的竞选支出提高1% 被B的竞选支出提高1% 所抵消。 虚拟假设为H0∶β1+β2=0 ,该假设意味着A的竞选支出提高x% 被B的竞选支出提高x% 所抵消,voteA保持不变。 (ⅲ)利用VOTE1.RAW中的数据来估计上述模型,并以通常的方式报告结论。A的竞选支出会影响结果吗?B的支出呢?你能用这些结论来检验第(ⅱ)部分中的假设吗? 所以,voteA=45.0789+6.0833log expendA?6.6154log expendB+ 0.1520prtystrA, n=173, R2=0.7926 .

由截图可得:expendA 系数β1的 t 统计量为15.9187,在很小的显著水平上都是显著的,意味着当其他条件不变时,A 的竞选支出增加1%,voteA 将增加0.0608。 同理可得,expendB 系数β2的 t 统计量为-17.4632,在很小的显著水平上都是显著的,意味着当其他条件不变时,B 的竞选支出增加1%,voteA 将增加0.066。 由于A 的竞选支出的系数β1和B 的竞选支出的系数β2符号相反,绝对值差不多,所以近似有虚拟假设“ H 0∶β1+β2=0 ”成立,即第(ⅱ)部分中的假设成立。 (ⅳ)估计一个模型,使之能直接给出检验第(ⅱ)部分中假设所需用的 t 统计量。你有什么结论?(使用双侧对立假设。) 有截图可得:se β 0 =3.9263,se β 1 =0.3821,se β 2 =0.3788,se β 3 =0.0620 . 令θ1=β1+β2,则有:voteA =β0+θ1log expendA + β2[log expendB ?log expendA ]+β3prtystrA +u , 由截图可知:θ1=?0.5321,se θ1 =0.5331, 所以第(ⅱ)部分虚拟假设的 t =?0.53210.5331≈?1, 即 H 0∶β1+β2=0 不能被拒绝。

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

第19章一个经验项目的实施 19.1 复习笔记 一、问题的提出 提出一个非常明确的问题,其重要性不容忽视。如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚至收集错误时期的数据。 1.查找数据的方法 《经济文献杂志》有一套细致的分类体系,其中每篇论文都有一组标识码,从而将其归于经济学的某一子领域之中。 因特网(Internet)服务使得搜寻各种主题的已发表论文更为方便。 《社会科学引用索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论文时非常有用,包括那些时常被其他著作引用的热门论文。 网络搜索引擎“谷歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。 2.构思题目时首先应明确的几个问题 (1)要使一个问题引起人们的兴趣,并不需要它具有广泛的政策含义;相反地,它可以只有局部意义。 (2)利用美国经济的标准宏观经济总量数据来进行真正原创性的研究非常困难,尤其对于一篇要在半个或一个学期之内完成的论文来说更是如此。然而,这并不意味着应该回避

对宏观或经验金融模型的估计,因为仅增加一些更新的数据便对争论具有建设性。 二、数据的收集 1.确定适当的数据集 首先必须确定用以回答所提问题的数据类型。最常见的类型是横截面、时间序列、混合横截面和面板数据集。有些问题可以用任何一种数据结构进行分析。 确定收集何种数据通常取决于分析的性质。关键是要考虑能够获得一个足够丰富的数据集,以进行在其他条件不变下的分析。 同一横截面单位两个或多个不同时期的数据,能够控制那些不随时间而改变的非观测效应,而这些效应通常使得单个横截面上的回归失效。 2.输入并储存数据 一旦你确定了数据类型并找到了数据来源,就必须把数据转变为可用格式。通常,数据应该具备表格形式,每次观测占一行;而数据集的每一列则代表不同的变量。 (1)不同类型数据的输入要求 ①对时间序列数据集来说,只有一种合理的方式来进行数据的输入和存储:即以时间为序,最早的时期列为第一次观测,最近的时期列为最后一次观测。最好能把标志着年份或(如有必要)季度或月份的变量包括进来。这将使得今后能估计各种模型,包括考虑到不同时期的季节性和结构突变的模型。 ②对混合横截面数据来说,通常最好是把最早一年的横截面放在第一个观测区里,接着是第二年的横截面,如此等等。这种安排并不关键,但为每次观测赋予一个标志着年份的变量则非常重要。 (2)输入数据的方法

伍德里奇计量经济学论文指导

如何利用计量经济学写实证论文 学习计量经济学的最后目的是为进行实证研究,但对初学计量经济学的人而言,要写一篇有实证研究的报告或论文时常有不知如何着手的感觉,这里我便对实证研究的规划以及论文的写作做一些粗浅的建议。 前期规划: 1.广泛收集参考文献,决定计划的目的和范畴: 1)决定所要解释的现象是什么? 2)决定所要检验的假设或理论是什么? 3)决定所要预测的趋势是什么? 4)决定所要评估的政策是什么? 2.建构实证计量模型; 除研读相关经济理论之外,应比较三至五篇有实证分析之文献中的实证计量模型:确认计量模型中解释变量和应变量之间的因果关系(causality);厘清各模型的异同及优缺点,思考改进文献中现存模型的可能;最后决定实证计量模型雏形;初步调查是否有相关的资料,若无则实证模型设计的再好也无用。 3.收集相关资料; 对数据的精确性一定要严格查核,对错假漏数据要仔细修正;使用电子表格软件对数据列表绘图,以验证数据的逻辑合理性,对不合理的数值要有所处理;不论要用的是横断面数据或是时间数列,数据数目越多越好,面板数据(Panel Data)尤佳;对资料数值作一些整理,表列各种基本统计量(样本平均值、变异数、变量间的样本相关系数等)、变量之间的两两交互列表、做一些初步图解分析。 计量方法的执行: 1.计量方法不应太简单(例如只做到最简单的 OLS),但也不必过于复杂,应针对问题采用恰到好处的计量方法。若采用了比较复杂的计量方法,则要说明为什么简单的方法不适合。计量方法的好坏不在其复杂程度,而在于它是否能够帮我们得到正确的估计值,以了解数据中所包含的真正信息。 2.除了估计值以及对应的 t 检定外外,也可做一些 F 检定之对多个系数的假设检定。 3.回归模型的设定,尤其是解释变量的取舍,可在估计过程中不断的修正。对应变量和解释变量均可尝试诸如对数、指数、幂函数等不同的转换。这些转换方式的决定,以经济理论上的考虑最为重要,不能单只为了提高模型的配适,而盲目的做一些不合理的变量转换。 4.选取解释变量时,应有如下的考虑: 解释变量和应变量之间的因果关系一定要正确,也就是说,解释变量是原因在先,应变量是结果在后,有一定的先后顺序。尤其要注意,有些变量数值的产生很可能是和应变量同时决定的,或是因果关系不很明确(也就是说,相对于应变量而言,这些变量是内生的),则在选取这些变量作为解释变量时,便要非常小心。解释变量的内生问题常常是研究被批评的主要原因;要注意解释变量的同构型,不能不分青红皂白的将一大堆彼此相关性很高的变量(包括相同变量的不同转换、或是几个变数间的各种交乘项)放进回归式内,造成严重的线性重合问题;经济理论所牵涉到的变量常常是无法观察到的,因此在做实证研究时必须采

计量经济学导论CH12习题答案

CHAPTER 12 TEACHING NOTES Most of this chapter deals with serial correlation, but it also explicitly considers heteroskedasticity in time series regressions. The first section allows a review of what assumptions were needed to obtain both finite sample and asymptotic results. Just as with heteroskedasticity, serial correlation itself does not invalidate R-squared. In fact, if the data are stationary and weakly dependent, R-squared and adjusted R-squared consistently estimate the population R-squared (which is well-defined under stationarity). Equation (12.4) is useful for explaining why the usual OLS standard errors are not generally valid with AR(1) serial correlation. It also provides a good starting point for discussing serial correlation-robust standard errors in Section 12.5. The subsection on serial correlation with lagged dependent variables is included to debunk the myth that OLS is always inconsistent with lagged dependent variables and serial correlation. I do not teach it to undergraduates, but I do to master’s students. Section 12.2 is somewhat untraditional in that it begins with an asymptotic t test for AR(1) serial correlation (under strict exogeneity of the regressors). It may seem heretical not to give the Durbin-Watson statistic its usual prominence, but I do believe the DW test is less useful than the t test. With nonstrictly exogenous regressors I cover only the regression form of Durbin’s test, as the h statistic is asymptotically equivalent and not always computable. Section 12.3, on GLS and FGLS estimation, is fairly standard, although I try to show how comparing OLS estimates and FGLS estimates is not so straightforward. Unfortunately, at the beginning level (and even beyond), it is difficult to choose a course of action when they are very different. I do not usually cover Section 12.5 in a first-semester course, but, because some econometrics packages routinely compute fully robust standard errors, students can be pointed to Section 12.5 if they need to learn something about what the corrections do. I do cover Section 12.5 for a master’s level course in applied econometrics (after the first-semester course). I also do not cover Section 12.6 in class; again, this is more to serve as a reference for more advanced students, particularly those with interests in finance. One important point is that ARCH is heteroskedasticity and not serial correlation, something that is confusing in many texts. If a model contains no serial correlation, the usual heteroskedasticity-robust statistics are valid. I have a brief subsection on correcting for a known form of heteroskedasticity and AR(1) errors in models with strictly exogenous regressors. 100

相关主题