搜档网
当前位置:搜档网 › 斯托克,沃森计量经济学第四章实证练习stata操作及答案

斯托克,沃森计量经济学第四章实证练习stata操作及答案

斯托克,沃森计量经济学第四章实证练习stata操作及答案
斯托克,沃森计量经济学第四章实证练习stata操作及答案

E4.1

E4.2

E4.3

E4.4

VARIABLES ahe

age 0.605

(0.0245)

Constant 1.082

(0.688)

Observations 7,711

R-squared 0.029

Robust standard errors in parentheses

*** p<0.01, ** p<0.05, * p<0.1

1.①截距估计值estimated intercept:1.082

②斜率估计值estimated slope:0.605

回归方程:ahe= 1.082+0.605*age

③当工人年长1岁,平均每小时工资增加0.605美元。

2.Bob: 0.605*26+1.082=16.812(美元)

Alexis: 0.605*30+1.082=19.232(美元)

答:预测Bob的收入为每小时16.812美元,Alexis为19.232美元。

3.年龄不能解释不同个体收入变化的大部分。因为R-squared反映了因变量的

全部变化能通过回归关系被自变量充分解释的比例,而分析得R-squared的值为0.029,解释度低,说明年龄不能解释不同个体收入变化的大部分。

1.

答:两者看上去有微弱的正相关关系

2.

VARIABLES course_eval

beauty 0.133

(0.0550)

Constant 3.998

(0.0449)

Observations 463

R-squared 0.036

Robust standard errors in parentheses

*** p<0.01, ** p<0.05, * p<0.1

①截距估计值:3.998

斜率估计值:0.133

回归方程:Course_Eval=3.998+0.133*beauty

//mean beauty

Mean estimation Number of obs = 463

Mean Std.Err. 95% Conf. Interval beauty 4.75e-08 0.0367 -0.0720 0.0720

②截距的估计值=Course_Eval的样本均值-斜率估计值*Beauty的样本均值

计算得Beauty的样本均值趋近于零,所以截距的估计值等于Course_Eval的样本均值。

3.//sum beauty

Variable Obs Mean Std.Dev. Min Max beauty 463 4.75e-08 0.789 -1.450 1.970

可知beauty的标准差为0.789,因此

Stock教授的预测课程评价:3.998+0.133*0.789=4.103

Watson教授的预测课程评价:3.998+0.133*0=3.998

4.//sum course_eval

Variable Obs Mean Std.Dev. Min Max course eval 463 3.998 0.555 2.100 5

答:可知course_eval的标准差为0.555,而第三问得beauty的标准差为0.789。beauty值每增加一个标准差,course_eval增加0.133*0.789=0.105,而0.105÷0.555=0.19,大概是course_eval标准差的五分之一,所以效应估计值小。

5.答:第二问跑回归得R-squared值为0.036,即beauty只解释了3.6%的课程

评价方差,beauty没有解释大部分的课程评价方差。

1.

Robust standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1

① 截距估计值:13.86 斜率估计值:-0.068 回归方程:ed=13.86-0.068*dist

② 大学盖在离中学每近10米的地方,平均完成教育年数增加0.068年。

2. 如果Bob 的中学距离最近的大学20米:predicted ed=1

3.86-0.068*2=13.724 答:预测Bob 完成的教育年数为13.724年。

如果Bob 的中学距离最近的大学10米:predicted ed=13.86-0.068*1=13.792 答:预测Bob 完成的教育年数为13.792年,比距离20米多0.068年。

3. 答:R-squared 的值为0.013,即到大学的距离只解释了1.3%个人受教育年数的方差,到大学的距离没有解释个人受教育年数的大部分方差。

4. 第一问跑回归得回归标准误差1.6733,单位是年。

VARIABLES ed

dist -0.0677

(0.0232) Constant 13.86 (0.0595)

Observations 943 R-squared

0.013

1.

答:它们看上去有关系,有微弱的正相关关系。

2.马其他是散点图中右上角的点,看上去像异常值,它的tradeshare高达1.99。

3.

VARIABLES growth

tradeshare 2.306

(0.663)

Constant 0.640

(0.459)

Observations 65

R-squared 0.124

Robust standard errors in parentheses

*** p<0.01, ** p<0.05, * p<0.1

①截距估计值:0.64 斜率估计值:2.306

回归方程:growth=0.64+2.306*tradeshare

②当tradeshare为0.5时,predicted growth=0.64+2.306*0.5=1.793

当tradeshare为1.0时,predicted growth=0.64+2.306*1.0=2.946

4.

VARIABLES growth

tradeshare 1.681

(0.866)

Constant 0.957

(0.536)

Observations 64

R-squared 0.045

Robust standard errors in parentheses

*** p<0.01, ** p<0.05, * p<0.1

①截距估计值:0.957 斜率估计值:1.681

回归方程:growth=0.957+1.681*tradeshare

②当tradeshare为0.5时,predicted growth=0.957+1.681*0.5=1.798

当tradeshare为1.0时,predicted growth=0.957+1.681*1.0=2.638

5.马其他是一个位于地中海中心的岛国,有“地中海心脏”之称,是重要的交通

位置,是货物转运的重要枢纽,且马耳他自然资源贫乏,经济发展高度依赖国际贸易,这解释了马其他贸易份额如此之大的原因。由于马其他的进口和出口规模与其他大多数国家的不一样,所以应该排除马其他的数据。

《计量经济学》第三版例题stata解答

第二章 例2.1.1(p24) (1)表2.1.2中E(Y|X=800)即条件均值的求法,将数据直接复制到stata 中。 程序: sum y if x==800 程序: 程序: (2)图2.1.1的做法: 程序: twoway(scatter y x )(lfit y x ),title("不同可支配收入水平组家庭消费支出的条件分布图")xtitle("每月可支配收入(元)")ytitle("每月消费支出(元)")xtick(500(500)4000)ytick(0(500)3500)

例2.3.1(p37) 将数据直接复制到stata 中 程序: (1) total xiyi return list scalars: r(skip) = 0 r(first) = 1 r(k_term) = 0 r(k_operator) = 0 r(k) = 0 r(k_level) = 0 r(output) = 1 r(b) = 4974750 r(se) = 1507820.761894463 g a=r(b) in 1 total xi2 xiyi 4974750 1507821 1563822 8385678 Total Std. Err. [95% Conf. Interval] Scatter 表示散点图选项, lfit 表示回归线,title 表示 题目,xtick 表示刻度,(500 (500)4000)分别表示起 始刻度,中间数表示以单 位刻度,4000表示最后的 刻度。要注意的是命令中 的符号都要用英文字符, 否则命令无效。

return list g b=r(b) in 1 di a/b .67 (2) mean Yi gen m=r(b) in 1 mean Xi g n=r(b) in 1 di m-n*0.67 142.4 由此得到回归方程:Y=142.4+0.67Xi 例2.6.2(p53) 程序:(1)回归 reg y x

伍德里奇---计量经济学第6章部分计算机习题详解(STATA)

班级:金融学×××班姓名:××学号:×××××××C6.9 NBASAL.RAW points=β0+β1exper+β2exper2+β3age+β4coll+u 解:(ⅰ)按照通常的格式报告结果。 由上图可知:points=35.22+2.364exper?0.077exper2?1.074age?1.286coll 6.9870.4050.02350.295 (0.451) n=269,R2=0.1412,R2=0.1282。 (ⅱ)保持大学打球年数和年龄不变,从加盟的第几个年份开始,在NBA打球的经历实际上将降低每场得分?这讲得通吗? 由上述估计方程可知,转折点是exper的系数与exper2系数的两倍之比:exper?= β12β2= 2.364[2×?0.077]=15.35,即从加盟的第15个到第16个年份之间,球员在NBA打球的经历实际上将降低每场得分。实际上,在模型所用的数据中,269名球员中只有2位的打球年数超过了15年,数据代表性不大,所以这个结果讲不通。 (ⅲ)为什么coll具有负系数,而且统计显著? 一般情况下,NBA运动员的球员都会在读完大学之前被选拔出,甚至从高中选出,所以这些球员在大学打球的时间少,但每场得分却很高,所以coll具有负系数。同时,coll的t统计量为-2.85,所以coll统计显著。 (ⅳ)有必要在方程中增加age的二次项吗?控制exper和coll之后,这对年龄效应意味着什么?

增加age的二次项后,原估计模型变成: points=73.59+2.864exper?0.128exper2?3.984age+0.054age2?1.313coll 35.930.610.05 2.690.05 (0.45) n=269,R2=0.1451,R2=0.1288。 由方程可知:age的t统计量为?1.48,age2的t统计量为1.09,所以age和age的二次项统计都不显著,而当不增加age2时,age的t统计量为?3.64,统计显著,因此完全没有必要在方程中增加age的二次项。当控制了exper和coll之后,年龄对points的负效应将会增大。 (ⅴ)现在将log?(wage)对points,exper,exper2,age和coll回归。以通常的格式报告结论。 所以,log wage=6.78+0.078points+0.218exper?0.0071exper2?0.048age?0.040coll 0.850.0070.0500.00280.035 (0.053) n=269,R2=0.4878,R2=0.4781。 (ⅵ)在第(ⅴ)部分的回归中检验age和coll是否联合显著。一旦控制了生产力和资历,这对考察年龄和受教育程度是否对工资具有单独影响这个问题有何含义?

斯托克,沃森计量经济学第七章实证练习stata

E7.2 E7.3 E7.4

-------------------------------------------- (1) (2) ahe ahe -------------------------------------------- age 0.605*** 0.585*** (15.02) (16.02) female -3.664*** (-17.65) bachelor 8.083*** (38.00) _cons 1.082 -0.636 (0.93) (-0.59) (表2)Robust ci in parentheses *** p<0.01, ** p<0.05, * p<0.1 -------------------------------------------- N 7711 7711 -------------------------------------------- t statistics in parentheses * p<0.10, ** p<0.05, *** p<0.01 (表1) (1) 建立ahe 对age 的回归。截距估计值是1.082,斜率估计值是0.605。 (2) ①建立ahe 对age ,female 和bachelor 的回归。Age 对收入的效应的估计值是0.585。 ② age 回归系数的95%置信区间: (0.514,0.657) (3) 设H 0:βa,(2)-βa,(1)=0 H1:βa,(2)-βa (1)≠0 由表3,得SE ,SE(βa,(2)-βa,(1))=√(0.0403)2+(0.0365)2=0.054 t=(0.605-0.585)/0.054=0.37<1.96 所以不拒绝原假设,即在5%显著水平下age 对ahe 的效应估计没有显著差异,所以(1)中的回归没有遭遇遗漏变量偏差。 (4) B ob’s predicted ahe=0.585×26-3.664×0+8.083×0-0.636=$14.574 Alexis ’s predicted ahe=0.585×30-3.664×1+8.083×1-0.636=$21.333 VARIABLES ahe age 0.585*** (0.514 - 0.657) female -3.664*** (-4.071 - -3.257) bachelor 8.083*** (7.666 - 8.500) Constant -0.636 (-2.759 - 1.487) Observations 7,711 R-squared 0.200

运用Stata做计量经济学

运用Stata做计量经济学 运用Stata建模的7步骤: 1、准备工作;目录、日志、读入数据、熟悉数据、时间变量、more、……; 2、探索数据:数据变换、描述统计量、相关系数、趋势图、散点图、……; 3、建立模型:regress、经济理论检验、实际经济问题要求、统计学检验、计量经济学检验:R2,T,t,残差; 4、诊断模型:异方差、序列相关、多重共线性、随机解释变量问题、……; 5、修正模型:WLS、GLS、工具变量法(ivregress),……; 6、应用模型:置信区间、预测、结构分析、边际分析、弹性分析、常用模型回归系数的意义、……; 7、整理:关闭日志、生成do文件备用 1、准备工作 让STATA处于初始状态,清除所有使用过的痕迹clear 指明版本号version11 设定并进入工作文件夹:cd D:\ (设定路径,将数据、程序和输出结果文件均存入该文件夹) 关闭以前的日志capture log close 建立日志:log using , replace 设定内存:set mem 20m

关闭more:set more off 读入数据:use .dta, clear 认识变量:describe 建立时间变量:tsset 2、用描述统计方法探索数据特征 必要的数据转换:gen、replace、……; 描述统计量:summarize, detail 相关系数矩阵:corr/pwcorr 散点图和拟合直线图:scatter y x || lfit y x 矩阵散点图:graph matrix y x1 x2 x3,half 线性趋势图:line y x 3、建立模型 OLS建立模型:regress y x1 x2 x3; 由方差分析表并用F和R2检验模型整体显著性; 依据p值对各系数进行t检验,一次只能剔出一个最不显著的变量,直到不包含不显著的变量; 估计参数,判别变量的相对重要性; 构造和估计约束模型,用以检验经济理论

计量经济学常用方法及应用-经济管理学院

计量经济学专题及应用 【授课计划:计划讲8个专题。主要是对计量经济学中5块常用的方法进行总结性和归纳性的介绍,侧重于讲在实际经济研究和实证分析中碰到相应问题时,计量经济方法上应当怎样处理,为什么要这样处理,如何处理,并结合STATA 讲应用例子。此外,1次专题介绍STATA的基础功能,1次专题系统梳理计量经济学的基础理论,还有1次专题结合实际研究例子,介绍一手数据搜集的调查设计和组织。通过上述课程,使学生能够在已经接受过基本理论和方法训练的基础上,更好地理解计量经济学的内容,并培养和提高开展实证研究的能力】 1、STATA简介及简单应用 介绍目前国内外最流行的计量经济分析软件STATA的基本功能和用法,通过简单例子介绍STATA在数据清理和管理、描述性统计分析、回归分析等方法的用法。同时插入EXCEL在处理数据方面的一些功能和应用。上午讲课,下午习题课。 2、计量经济分析基础 对计量经济学的基础理论进行总结性和归纳性的回顾、输理和介绍,重点讲假设检验和回归的道理,以及回归诊断。上午讲课,下午习题课。 3、项目评估与政策分析应用 系统介绍计量经济学在项目评估和政策分析上的方法和应用,特别介绍虚拟变量模型的建立及其在政策分析和项目评估研究中的应用。上午讲课,下午习题课。 4、经济学中的内生性问题及相关计量经济方法 总结和介绍计量经济学中内生性问题在经济研究中的涵义和问题,内生性问题产生的主要原因,对计量估计结果的影响,内生性问题的处理方法(工具变量和两阶段估计等)和应用例子。上午讲课,下午习题课。 5、微观个体行为的计量经济分析方法 总结和介绍分析微观个体行为的属性和受限因变量模型(Probit, Logit, Tobit, Heckman, Mlogit, Clogit等)等常用微观计量经济方法,包括模型内涵和适用范

计量经济学与stata——第一章

第一章引言 目录 1回归的本质 (1) 2计量经济学的一些基本概念和术语 (3) 2.1 统计关系与确定性关系 (3) 2.2 回归关系、相关关系与因果关系 (4) 2.3 术语与符号 (4) 2.4 数据类型 (4) 2.5 计量经济学的估计框架 (5) 2.6 经典计量经济学的方法论 (5) 3Stata简单介绍 (8) 4第一章附录: (8) 4.1 诺贝尔经济学奖与计量经济学 (8) 4.2 相关数学基础 (14) 4.3 本章相关数学证明 (19)

1 回归的本质 计量经济学的一般模型: 2(,)[]0[]y F X E E βεεεεσ′=+==Ω 回归是计量经济学的核心,理解回归的本质,对于掌握计量经济的理论与方法至关重要。回归的本质用语言来描述其实很简单,就是: 对于一组随机变量y 和X ,如果y 和X 存在特定的关系,为分析y 和X 之间的相互影响,或用X 去预测y ,需要知道y 和X 的模型形式以及模型中参数β的值,但是,由于—— 1、正确的模型形式(,)y F X β=未知,只能尽可能去逼近它(注:这涉及经济理论模型及模型设定的问题)。 2、即使假定模型的形式(,)y F X β=(不包括β)已被确定,也不可能穷尽随机变量和y X 的所有取值(即总体),来得到真实的β。 基于这两点,真实的模型形式(,)F X β和β无法得到,只能利用估计方法和 样本数据去尽可能得到与真实(,)F X β和β偏差或者误差最小的?(,)F X β和?β,即 2??min [((,))]E y F X β? (1) 使得(1)成立的?(,)F X β即是对于y X 的条件数学期望: ??(,)[/]F X E y X β= 注:从参数估计的角度来说,对于不同的估计方法,比如OLS (最小二乘估计法)、MLE (最大似然估计法)、GMM (矩估计或广义矩估计法),最小化均方误差的表述不尽相同,但本质是一样的。 理解回归的例子:凯恩斯消费函数、OLS 、一元线性回归(双变量回归) 凯恩斯消费函数是一个典型的一元线性回归模型,根据凯恩斯的经济理论,消费和收入存在密切的联系,如果用表示消费,Y 表示收入,则最简单与最常见的凯恩斯消费函数C 理论模型可表示为: C Y αβ=+ (2) 函数满足以下条件:

斯托克、沃森着《计量经济学》第九章

Chapter 9. Assessing Studies Based on Multiple Regression 9.1 Internal and External Validity Multiple regression has some key virtues: ?It provides an estimate of the effect on Y of arbitrary changes ΔX. ?It resolves the problem of omitted variable bias, if an omitted variable can be measured and included. ?It can handle nonlinear relations (effects that vary with the X’s)

Still, OLS might yield a biased estimator of the true causal effect. A Framework for Assessing Statistical Studies Internal and External Validity ?Internal validity: The statistical inferences about causal effects are valid for the population being studied.

?External validity: The statistical inferences can be generalized from the population and setting studied to other populations and settings, where the “setting” refers to the legal, policy, and physical environment and related salient features.

斯托克计量经济学课后习题实证答案

P ART T WO Solutions to Empirical Exercises

Chapter 3 Review of Statistics Solutions to Empirical Exercises 1. (a) Average Hourly Earnings, Nominal $’s Mean SE(Mean) 95% Confidence Interval AHE199211.63 0.064 11.50 11.75 AHE200416.77 0.098 16.58 16.96 Difference SE(Difference) 95% Confidence Interval AHE2004 AHE1992 5.14 0.117 4.91 5.37 (b) Average Hourly Earnings, Real $2004 Mean SE(Mean) 95% Confidence Interval AHE199215.66 0.086 15.49 15.82 AHE200416.77 0.098 16.58 16.96 Difference SE(Difference) 95% Confidence Interval AHE2004 AHE1992 1.11 0.130 0.85 1.37 (c) The results from part (b) adjust for changes in purchasing power. These results should be used. (d) Average Hourly Earnings in 2004 Mean SE(Mean) 95% Confidence Interval High School13.81 0.102 13.61 14.01 College20.31 0.158 20.00 20.62 Difference SE(Difference) 95% Confidence Interval College High School 6.50 0.188 6.13 6.87

斯托克,沃森计量经济学第四章实证练习stata操作及答案

E4.1 E4.2 E4.3 E4.4

E4.1 VARIABLES ahe age 0.605 (0.0245) Constant 1.082 (0.688) Observations 7,711 R-squared 0.029 Robust standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1 1. ① 截距估计值estimated intercept: 1.082 ② 斜率估计值estimated slope: 0.605 回归方程:ahe= 1.082+0.605*age ③ 当工人年长 1 岁,平均每小时工资增加0.605 美元。 2. Bob: 0.605*26+1.082=16.812 (美元) Alexis: 0.605*30+1.082=19.232 (美元) 答:预测Bob 的收入为每小时16.812美元,Alexis为19.232 美元。 3. 年龄不能解释不同个体收入变化的大部分。因为R-squared 反映了因变量的 全部变化能通过回归关系被自变量充分解释的比例,而分析得R-squared 的值为0.029,解释度低,说明年龄不能解释不同个体收入变化的大部分

E4.1 (0.0449) Observations 463 R-squared 0.036 Robust standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1 ① 截距估计值: 3.998 斜率估计值: 0.133 回归方程: Course_Eval=3.998+0.133*beauty lave_esruo 0a u ty a e 1. 答:两者看上去有微弱的正相关关系 2. VARIABLES course eval beauty Constant 0.133 (0.0550) 3.998

-第2章-Stata入门-计量经济学及Stata应用及应用

? 陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。 第2章 Stata入门 2.1 为什么使用Stata Stata软件因操作简单且功能强大,为目前在欧美最流行的统计与计量软件,拥有众多用户。 Stata公司定期升级软件,以适应计量经济学的迅猛发展。 Stata软件还留有“用户接口”,允许用户自己编写命令与函数,并上传到网上实现共享。一些最新计量方法,可在线查找和下载由用户编写的Stata命令程序(user-written Stata commands)。这些“非官方命令”(也称“外部命令”)的使用方法与官方命令完全相同,使得Stata的功能如虎添翼。 1

本教材使用Stata 13版本(2013年6月发布)。 对于绝大多数命令与功能,即使用更低的Stata版本(如Stata 11或Stata 12),也几乎没有差别。 2.2 Stata的窗口 安装Stata 13后,在安装的文件夹中将出现如下Stata 13图标(Stata 11或Stata 12的图标大同小异),参见图2.1: 图2.1 Stata 13的图标 双击此Stata图标,即可打开Stata。 2

3 如想在电脑桌面创建开启Stata 软件的快捷方式,可右键点击Stata 13的图标,然后选择“发送到”→“桌面快捷方式”,参见图2.2。 图2.2 发送Stata 13到桌面快捷方式

打开Stata后可看到,在最上方有一排“下拉式菜单”(pull-down menu),参见图2.3: 图2.3 Stata的下拉式菜单 在Stata中运行单个命令主要有两种方式,其一为点击菜单,其二为在“命令窗口”输入命令。 通过菜单执行命令(menu-driven)可能要点击多重菜单,通常还要填写对话框(dialog),以明确命令参数,不如在命令窗口直接输入命令方便。 在菜单之下,为一系列图标,起着快捷键的作用,参见图2.4。 4

斯托克、沃森着《计量经济学》第六章

Chapter 6. Linear Regression with Multiple Regressors 6.1 Omitted Variable Bias(遗漏变量偏差) OLS estimate of the Test Score/STR relation: n TestScore= 698.9 – 2.28×STR, R2 = .05, SER = 18.6 (10.4) (0.52) Is this a credible estimate of the causal effect on test scores of a change in the student-teacher ratio? 1

No: there are omitted confounding factors (family income; whether the students are native English speakers) that bias the OLS estimator: STR could be “picking up” the effect of these confounding factors. 2

Omitted Variable Bias The bias in the OLS estimator that occurs as a result of an omitted factor is called omitted variable bias. For omitted variable bias to occur, the omitted factor “Z” must be: 1.a determinant of Y; and 2.correlated with the regressor X. 3

计量经济学stata操作指南

计量经济学stata操作(实验课) 第一章stata基本知识 1、stata窗口介绍 2、基本操作 (1)窗口锁定:Edit-preferences-general preferences-windowing-lock splitter (2)数据导入 (3)打开文件:use E:\example.dta,clear (4)日期数据导入: gen newvar=date(varname, “ymd”) format newvar %td 年度数据 gen newvar=monthly(varname, “ym”) format newvar %tm 月度数据 gen newvar=quarterly(varname, “yq”) format newvar %tq 季度数据 (5)变量标签 Label variable tc ` “total output” ’ (6)审视数据 describe list x1 x2 list x1 x2 in 1/5 list x1 x2 if q>=1000 drop if q>=1000 keep if q>=1000 (6)考察变量的统计特征 summarize x1 su x1 if q>=10000 su q,detail su tabulate x1 correlate x1 x2 x3 x4 x5 x6 (7)画图 histogram x1, width(1000) frequency kdensity x1 scatter x1 x2 twoway (scatter x1 x2) (lfit x1 x2) twoway (scatter x1 x2) (qfit x1 x2) (8)生成新变量 gen lnx1=log(x1) gen q2=q^2 gen lnx1lnx2=lnx1*lnx2 gen larg=(x1>=10000) rename larg large

斯托克、沃森着《计量经济学》第八章

Chapter 8. Nonlinear Regression Functions 8.1 A General Strategy for Modeling Nonlinear Regression Functions ?Everything so far has been linear in the X’s ?The approximation that the regression function is linear might be good for some variables, but not for others.

?The multiple regression framework can be extended to handle regression functions that are nonlinear in one or more X.

The TestScore – STR relation looks approximately linear…

But the TestScore – average district income relation looks like it is nonlinear.

If a relation between Y and X is nonlinear: ?The effect on Y of a change in X depends on the value of X – that is, the marginal effect of X is not constant ?A linear regression is mis-specified – the functional form is wrong ?The estimator of the effect on Y of X is biased – it needn’t even be right on average. 遗漏高次项会带来遗漏变量偏 差。例如: () 2 012 Y X X u βββ =+++,显然X与2 X相关。

詹姆斯·斯托克,马克·沃森计量经济学第三章实证练习stata答案

一、 Two-sample t test with equal variances Group Obs Mean Std.Err. Std.Dev. 95% Conf. Interval 1992 7,612 11.62 0.0644 5.619 11.49 11.74 2012 7,440 19.80 0.124 10.69 19.56 20.04 combined 15,052 15.66 0.0770 9.442 15.51 15.81 diff -8,183 0.139 -8.455 -7.911 diff = mean(1992) - mean(2012) t = -58.9871 Ho: diff = 0 degrees of freedom = 15050 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000 二、 Two-sample t test with equal variances Group Obs Mean Std.Err. Std.Dev. 95% Conf. Interval 1992 7,612 15.64 0.0867 7.564 15.47 15.81 2012 7,440 19.80 0.124 10.69 19.56 20.04 combined 15,052 17.69 0.0772 9.471 17.54 17.85 diff -4.164 0.151 -4.459 -3.869 diff = mean(1992) - mean(2012) t = -27.6423 Ho: diff = 0 degrees of freedom = 15050 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000

计量经济学基础与STATA应用

计量经济学基础与STATA应用 基本概念 【经典假设】 1、模型为线性;(多项式、对数、倒数、对数倒数、含有时间趋势) 2、X为变量; 3、残差序列(条件)均值为0; 4、残差序列(条件)方差齐性,即同方差; 5、残差序列之间无自相关性; 6、残差序列与解释变量不相关; 7、解释变量之间不存在完全的线性关系; 8、残差序列服从正态分布。 【残差正态性检验】 1、残差直方图:histogram e, norm freq 2、利用偏度系数和峰度系数:sktest 3、正态概率图: 问题检验与解决 【多重共线性】 完全多重共线性:参数无法唯一确定,方差无穷大。 不完全多重共线性:方差增大 诊断方法: 1、模型判定系数R方值高而具有显着的t值得变量少 2、解释变量之间有高度的两两相关 3、检查偏相关 4、辅助回归 5、病态指数 6、方差膨胀因子(VIF) 补救方法: 1、利用先验信息 2、横截面数据与时间序列数据并用 3、剔除变量(有可能出现模型的设定偏误) 4、变量替换(一阶差分:可能使得残差存在一定的相关性、比率:可能使得残差不再同方差) 5、补充新的数据 6、在多项式回归中降低共线性 【异方差】 原因: 1、按照边错边改边学习模型,人们在学习的过程中,其行为误差随着时间的延长而减少; 2、数据采集技术的改进

3、异常值出现 4、回归模型的设定不正确,如遗漏重要变量 5、回归元的分布呈偏态,如收入 6、不正确的数据变换或函数变换 7、横截面数据中更为常见 问题: 系数依旧无偏,估计方差增大,t值变小,从而导致本来显着地回归系数变成了统计不显着 诊断方法: 1、图解法:残差平方对y预测值或某一解释变量 2、帕克检验:先用OLS产生残差,再用残差平方对X回归,系数显着就有异方差; 3、格莱泽检验:先用OLS产生残差,用残差的绝对值对X的各种变换回归; 4、戈德菲尔德-匡特检验:先将X的观测值按升序排列,略去居中的c个观测,将前后分成两组分别 回归得到各自的残差平方和,做F检验 5、布劳殊-培干-戈弗雷检验(BPG检验):先回归得到残差平方和,计算残差平方和的均值,构造pi=ui2/ 均值,用pi对全部或部分X做回归,得到ESS,做卡方检验:estat hettest 6、怀特检验(White检验):回归得到残差平方和,用残差平方和对X和X方和X交叉项做回归,得 到R方,对nR2做卡方检验:estat imtest,white 7、寇因克-巴塞特检验(KB检验):残差平方和对预测Y平方做回归 解决: 当方差已知,WLS 当方差未知,误差方差正比于X2,两边除以X 误差方差正比于X,两边除以根号X 误差方差正比于Y均值的平方,两边除以Y均值 进行对数转换。 注意:一个好的模型,绝不会因为异方差性的原因而被抛弃。只有在问题严重的时候,误差方差不相等的问题才值得去修正。当模型参数的最大方差(OLS估计)比最小方差(GLS估计)的10倍还大时,问题才是严重的。 【自相关】 Cov(ui, uj) !=0 来源: 1、惯性:如GDP、价格指数 2、设定偏误,应含而未含变量,不正确的函数形式 3、蛛网现象:如供给价格的反应要滞后一个时期,今年种植的作物受去年流行的价格影响 4、滞后效应: 5、数据的编造 问题: OLS估计量仍是无偏线性的,方差估计错误 诊断方法: 1、图解法:残差对时间,残差对残差滞后 2、游程检验:runtest 3、德宾-沃森检验(DW检验):0-dl(拒绝正自相关),dl-du(无决定域),du-2-(4-du)(不拒绝)、(4-du)-(4-dl) (无决定域)、(4-dl)-4(拒绝负自相关):dwstat 4、布劳殊-戈弗雷检验:BG检验(LM检验) 解决: 如果AR(1),

斯托克、沃森着《计量经济学》第五章

Chapter 5. Regression with a Single Regressor: Hypothesis Tests and Confidence Intervals 5.1 Testing Hypotheses about One of the Regression Coefficients(对单一系数的假设检验) Suppose a skeptic suggests that reducing the number of students in a class has no effect on learning or, specifically, test scores. The skeptic thus asserts the hypothesis, 1

H0: β1 = 0 We wish to test this hypothesis using data – reach a tentative conclusion whether it is correct or incorrect. Null hypothesis and two-sided alternative: H0: β1 = 0 vs. H1: β1≠ 0 or, more generally, 2

H0: β1 = β1,0 vs. H1: β1≠β1,0 where β1,0 is the hypothesized value under the null(β1,0是一个具体的数). Null hypothesis and one-sided alternative: H0: β1 = β1,0 vs. H1: β1 < β1,0 In economics, it is almost always possible to come up with stories in which an effect could “go either way,” so it is 3

计量经济学stata上机命令整理

计量经济学上机命令整理 实验一 edit 打开数据编辑器 browse 打开数据浏览器 rename 对变量重新命名 label save describe 对数据集简要描述 sort 排序例如:list in -10/-1 list 显示变量的数值 Generate 缩小:gen 生成新的变量后面可以接if条件句 Replace 替换append 覆盖 Summarize 缩写:su 总结后面可以接if条件句 实验二 twoway (scatter y x)(connected ey_x x) 在该散点图上,做出条件均值点 sc y x||lfit y x 画出线图和散点图 Reg y x 做出回归 Rename ** y **指原变量名用于修改变量名字 graph twoway scatter y x 画出y x 的二维散点图 Line y x 做出y x 的线条图 egen Ey_x=mean(y),by(x) 求在同一x水平下,求y的均值 实验三 Regress y x1 x2 ........做多元回归 Precict e,re 预测方差 Sort e 按照方差排序 Cor y x 测试y与x的相关程度 Pwcorr y x 也是测试y与x的相关程度 Set obs 90 (90为任意一个数字),增加一个或者多个样本值 Replace x=980 in 90 为第90个样本值赋值(980为任意一个数字) Predict yhat 预测y的估计值 Display invttail(n,p) n为自由度;p为概率(一般为0.025)。用来求t分布的t 值 Display ttail(n,t)知道t值求T

计量经济学基础与STATA应用

计量经济学基础与 S T A T A应用 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

计量经济学基础与STATA应用 基本概念 【经典假设】 1、模型为线性;(多项式、对数、倒数、对数倒数、含有时间趋势) 2、X为变量; 3、残差序列(条件)均值为0; 4、残差序列(条件)方差齐性,即同方差; 5、残差序列之间无自相关性; 6、残差序列与解释变量不相关; 7、解释变量之间不存在完全的线性关系; 8、残差序列服从正态分布。 【残差正态性检验】 1、残差直方图:histogram e, norm freq 2、利用偏度系数和峰度系数:sktest 3、正态概率图: 问题检验与解决 【多重共线性】 完全多重共线性:参数无法唯一确定,方差无穷大。 不完全多重共线性:方差增大 诊断方法: 1、模型判定系数R方值高而具有显着的t值得变量少 2、解释变量之间有高度的两两相关 3、检查偏相关 4、辅助回归 5、病态指数 6、方差膨胀因子(VIF) 补救方法: 1、利用先验信息 2、横截面数据与时间序列数据并用 3、剔除变量(有可能出现模型的设定偏误) 4、变量替换(一阶差分:可能使得残差存在一定的相关性、比率:可能使得残差不再同方差) 5、补充新的数据 6、在多项式回归中降低共线性 【异方差】 原因: 1、按照边错边改边学习模型,人们在学习的过程中,其行为误差随着时间的延长而减少; 2、数据采集技术的改进

3、异常值出现 4、回归模型的设定不正确,如遗漏重要变量 5、回归元的分布呈偏态,如收入 6、不正确的数据变换或函数变换 7、横截面数据中更为常见 问题: 系数依旧无偏,估计方差增大,t值变小,从而导致本来显着地回归系数变成了统计不显着 诊断方法: 1、图解法:残差平方对y预测值或某一解释变量 2、帕克检验:先用OLS产生残差,再用残差平方对X回归,系数显着就有异方差; 3、格莱泽检验:先用OLS产生残差,用残差的绝对值对X的各种变换回归; 4、戈德菲尔德-匡特检验:先将X的观测值按升序排列,略去居中的c个观测,将前后分成两组分 别回归得到各自的残差平方和,做F检验 5、布劳殊-培干-戈弗雷检验(BPG检验):先回归得到残差平方和,计算残差平方和的均值,构造 pi=ui2/均值,用pi对全部或部分X做回归,得到ESS,做卡方检验:estat hettest 6、怀特检验(White检验):回归得到残差平方和,用残差平方和对X和X方和X交叉项做回归, 得到R方,对nR2做卡方检验:estat imtest,white 7、寇因克-巴塞特检验(KB检验):残差平方和对预测Y平方做回归 解决: 当方差已知,WLS 当方差未知,误差方差正比于X2,两边除以X 误差方差正比于X,两边除以根号X 误差方差正比于Y均值的平方,两边除以Y均值 进行对数转换。 注意:一个好的模型,绝不会因为异方差性的原因而被抛弃。只有在问题严重的时候,误差方差不相等的问题才值得去修正。当模型参数的最大方差(OLS估计)比最小方差(GLS估计)的10倍还大时,问题才是严重的。 【自相关】 Cov(ui, uj) !=0 来源: 1、惯性:如GDP、价格指数 2、设定偏误,应含而未含变量,不正确的函数形式 3、蛛网现象:如供给价格的反应要滞后一个时期,今年种植的作物受去年流行的价格影响 4、滞后效应: 5、数据的编造 问题: OLS估计量仍是无偏线性的,方差估计错误 诊断方法: 1、图解法:残差对时间,残差对残差滞后 2、游程检验:runtest 3、德宾-沃森检验(DW检验):0-dl(拒绝正自相关),dl-du(无决定域),du-2-(4-du)(不拒 绝)、(4-du)-(4-dl)(无决定域)、(4-dl)-4(拒绝负自相关):dwstat 4、布劳殊-戈弗雷检验:BG检验(LM检验) 解决:

伍德里奇---计量经济学第7章部分计算机习题详解(STATA)

班级:金融学×××班姓名:××学号:××××××× C7.10 NBASAL.RAW points=β0+β1exper+β2exper2+β3guard+β4forward+u 解:(ⅰ)估计一个线性回归模型,将单场得分与联赛中打球经历和位置(后卫、前锋或中锋)联系起来。包括打球经历的二次项形式,并将中锋作为基组。以通常形式报告结果。 由上图可知:points=4.76+1.28exper?0.072exper2+2.31guard+1.54forward 1.180.330.024 1.00 (1.00) n=269,R2=0.0910,R2=0.0772。 (ⅱ)在第(ⅰ)部分中,你为什么不将所有三个位置虚拟变量包括进来? 由于forward+center+guard=1,意味着forward和guard之和是center的一个线性函数,所以如果在模型中同时使用三个虚拟变量将会导致完全多重共线性,即包括三个位置虚拟变量会掉入虚拟变量陷阱,故不能将三个位置虚拟变量都包括在模型中。 (ⅲ)保持经历不变,一个后卫的得分比一个中锋多吗?多多少?这个差异统计显著吗? 由(ⅰ)中估计方程可知:一个后卫的得分比一个中锋多,且多得2.31分。同时,guard的t统计量为2.31,所以这个差异统计显著。 (ⅳ)现在,将婚姻状况加入方程。保持位置和经历不变,已婚球员是否更高效?

将婚姻状况加入方程后,回归结果如下所示: points=4.703+1.233exper?0.0704exper2+2.286guard+1.541forward+0.584marr 1.180.330.024 1.00 1.00 (0.74) n=269,R2=0.0931,R2=0.0759。 从方程中marr的系数不难发现:在保持位置和经历不变时,已婚球员每场得分比没结婚的球员高0.5分,可是事实上,变量marr的t统计量为0.789,t检验的p值为43.1%,所以marr统计并不显著,故无法得出“已婚球员得分更高效”的结论。 (ⅴ)加入婚姻状况和两个经历变量的交互项。在这个扩展的模型中,是否存在有力的证据表明婚姻状况影响单场得分? 由截图可知,变量marr、marrexper和marrexpersq联合不显著,无法拒绝原假设,所以并不存在有力的证据表明婚姻状况能够影响单场得分。 (ⅵ)使用单场助攻次数作为因变量估计(ⅳ)中的模型。与(ⅳ)的结果有明显的差异吗?请讨论。 当使用单场助攻次数作为因变量时,重新估计(ⅳ)中的模型,回归结果如下: assists=?0.226+0.444exper?0.0274exper2+2.492guard+0.447forward+0.322marr 0.3550.1000.0070.3010.301 (0.222) n=269,R2=0.3499,R2=0.3375。

相关主题