搜档网
当前位置:搜档网 › -第2章-Stata入门-计量经济学及Stata应用及应用

-第2章-Stata入门-计量经济学及Stata应用及应用

? 陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。

第2章 Stata入门

2.1 为什么使用Stata

Stata软件因操作简单且功能强大,为目前在欧美最流行的统计与计量软件,拥有众多用户。

Stata公司定期升级软件,以适应计量经济学的迅猛发展。

Stata软件还留有“用户接口”,允许用户自己编写命令与函数,并上传到网上实现共享。一些最新计量方法,可在线查找和下载由用户编写的Stata命令程序(user-written Stata commands)。这些“非官方命令”(也称“外部命令”)的使用方法与官方命令完全相同,使得Stata的功能如虎添翼。

1

本教材使用Stata 13版本(2013年6月发布)。

对于绝大多数命令与功能,即使用更低的Stata版本(如Stata 11或Stata 12),也几乎没有差别。

2.2 Stata的窗口

安装Stata 13后,在安装的文件夹中将出现如下Stata 13图标(Stata 11或Stata 12的图标大同小异),参见图2.1:

图2.1 Stata 13的图标

双击此Stata图标,即可打开Stata。

2

3

如想在电脑桌面创建开启Stata 软件的快捷方式,可右键点击Stata 13的图标,然后选择“发送到”→“桌面快捷方式”,参见图2.2。

图2.2 发送Stata 13到桌面快捷方式

打开Stata后可看到,在最上方有一排“下拉式菜单”(pull-down menu),参见图2.3:

图2.3 Stata的下拉式菜单

在Stata中运行单个命令主要有两种方式,其一为点击菜单,其二为在“命令窗口”输入命令。

通过菜单执行命令(menu-driven)可能要点击多重菜单,通常还要填写对话框(dialog),以明确命令参数,不如在命令窗口直接输入命令方便。

在菜单之下,为一系列图标,起着快捷键的作用,参见图2.4。

4

5

图2.4 Stata 的快捷键

在快捷键图标之下,有五个窗口,参见图2.5。

图2.5 Stata 13的主要窗口

2.3 Stata操作实例

以数据集grilic_small.xls (Excel文件)为例,该文件包含30名美国年轻男子的教育投资回报率数据。

1.导入数据

首先,打开Stata软件,点击快捷键Data Editor (Edit)图标(参见图2.6),即可打开Stata的数据编辑器,参见图2.7。

图2.6 Data Editor (Edit)图标

6

图2.7 Stata的数据编辑器

其次,用Excel打开文件“grilic_small.xls”,会看到如下Excel

格式的数据文件:

7

8

图2.8 Excel 表中的数据

共有3列变量,分别为s (schooling, 教育年限), expr (experience, 工龄)与 lnw (lnwage, 工资对数)。

复制此Excel表中所有数据(Ctrl +C),粘贴到Data Editor中(Ctrl + V)。在Data Editor中会出现对话框,参见图2.9:

图2.9 Data Editor的对话框

此对话框问你“第一行为数据还是变量名”,点击相应选择即可。

9

导入数据的另一方法是(特别在数据量很大的情况下),点击菜单“File”→“Import”,然后导入各种格式的数据,参见图 2.10;但不如直接从Excel表中粘贴数据更为方便。

图2.10 使用Import导入数据

10

关闭Data Editor (Edit)后,会看到右上方的变量窗口出现了3个变量,分别为s, expr与lnw。

点击快捷键Save图标(参见图2.11中鼠标位置,也可点击菜单“File”→“Save”),将数据存为Stata格式的数据文件(扩展名dta,为data的缩写),比如grilic_small.dta。

图2.11 Save图标

此后可用Stata直接打开grilic_small.dta,无须再从Excel中导入数据。

11

打开Stata数据集的方式有两种。方法之一,点击快捷键Open 图标(参见图2.12),寻找要打开的dta文件位置。

图2.12 Open图标

方法之二,在命令窗口输入以下命令(假设文件grilic_small.dta 在E盘的根目录),然后回车(按Enter键):

. use E:\grilic_small.dta,clear

逗号“,”之后的“clear”为“选择项”(option),表示可替代内存中的已有数据。

12

使用命令use打开dta数据文件,需输入此文件的路径;一般不如使用快捷键Open寻找此文件更为方便。

如要关闭一个数据集,以便使用另外一个数据集,可输入命令. clear

内存中数据将被清空,然后可再打开另一数据集。

2.变量的标签

在变量窗口,变量的“名字”(Name)旁边会显示其“标签”(label)。点击Variables Manager图标(参见图2.13),即可打开变量管理器,然后编辑变量名、标签等。

13

14

图2.13 Variables Manager 图标

比如,将变量s 的标签改为“schooling ”,然后点击“Apply ”(应

用),参见图2.14。

图2.14 变量管理器的对话框

Stata严格区分大小写字母(case sensitive)。建议变量名使用小写字母,便于阅读。

3.审视数据

如想看数据集中的变量名称、标签等,可输入命令

. describe

其中,“describe”的下划线表示,可将该命令简写为“d”。

15

如想看变量s与lnw的具体数据,可使用命令. list s lnw

s lnw

1. 18 6.215

2. 11 4.868

3. 16 6.315

4. 16 6.109

5. 12 5.964

6. 12 5.481

7. 12 5.823

8. 16 5.841

9. 16 6.068

10. 12 5.416

11. 11 5.704

12. 12 5.493

13. 16 5.979

14. 12 6.356

15. 12 6.12

16. 16 6.176

17. 12 6.082

18. 15 5.849

19. 12 5.481

20. 16 6.136

21. 14 5.652

22. 12 5.142

23. 16 5.501

24. 11 5.778

25. 15 5.652

more

16

在屏幕底端出现带下划线的英文字“more”,用鼠标单击“more”,可翻看下页的结果。

如想连续滚屏显示命令运行结果,可输入命令

. set more off

如又想恢复分页显示运行结果,可输入命令

. set more on

如只想对数据集的一部分子集执行命令,比如只看s与lnw的前5个数据,可使用命令

. list s lnw in 1/5

s lnw

1. 18 6.215

2. 11 4.868

3. 16 6.315

4. 16 6.109

5. 12 5.964

17

18

如要罗列从第11-15个观测值,可输入命令 . list s lnw in 11/15

15. 12 6.12 14. 12 6.356 13. 16 5.979 12. 12 5.493 11. 11 5.704 s lnw

也可通过逻辑关系来定义数据集的子集。比如,要列出所有满足条件“16s ”(教育年限为16年及以上)的数据,可使用命令

. list s lnw if s>=16

s lnw

1. 18 6.215

3. 16 6.315

4. 16 6.109

8. 16 5.841

9. 16 6.068

13. 16 5.979

16. 16 6.176

20. 16 6.136

23. 16 5.501

27. 16 6.071

30. 16 6.071

“>=”表示“大于等于”。其他表示关系的逻辑符号为“= =”(等于),“>”(大于),“<”(小于),“<=”(小于等于),“~=”(不等于,也可用“!=”表示)。

一个等号“=”表示“赋值”,而两个等号“= =”表示“等于”。

19

查看具体数据的直接方法是,点击Data Editor (Edit)图标,或右边的Data Editor (Browse)图标,参见图2.15。二者的区别在于,Browse只能看,不能改;而Edit还可改数据。

图2.15 Data Editor (Browse)图标

如要删除满足“16

s≥”条件的观测值,可输入命令

. drop if s>=16

反之,如只想保留满足“16

s≥”条件的观测值,可使用命令. keep if s>=16

20

《计量经济学》第三版例题stata解答

第二章 例2.1.1(p24) (1)表2.1.2中E(Y|X=800)即条件均值的求法,将数据直接复制到stata 中。 程序: sum y if x==800 程序: 程序: (2)图2.1.1的做法: 程序: twoway(scatter y x )(lfit y x ),title("不同可支配收入水平组家庭消费支出的条件分布图")xtitle("每月可支配收入(元)")ytitle("每月消费支出(元)")xtick(500(500)4000)ytick(0(500)3500)

例2.3.1(p37) 将数据直接复制到stata 中 程序: (1) total xiyi return list scalars: r(skip) = 0 r(first) = 1 r(k_term) = 0 r(k_operator) = 0 r(k) = 0 r(k_level) = 0 r(output) = 1 r(b) = 4974750 r(se) = 1507820.761894463 g a=r(b) in 1 total xi2 xiyi 4974750 1507821 1563822 8385678 Total Std. Err. [95% Conf. Interval] Scatter 表示散点图选项, lfit 表示回归线,title 表示 题目,xtick 表示刻度,(500 (500)4000)分别表示起 始刻度,中间数表示以单 位刻度,4000表示最后的 刻度。要注意的是命令中 的符号都要用英文字符, 否则命令无效。

return list g b=r(b) in 1 di a/b .67 (2) mean Yi gen m=r(b) in 1 mean Xi g n=r(b) in 1 di m-n*0.67 142.4 由此得到回归方程:Y=142.4+0.67Xi 例2.6.2(p53) 程序:(1)回归 reg y x

STATA面板数据模型操作命令要点

STATA 面板数据模型估计命令一览表 一、静态面板数据的STATA 处理命令 εαβit ++=x y it i it 固定效应模型 μβit +=x y it it ε αμit +=it it 随机效应模型 (一)数据处理 输入数据 ●tsset code year 该命令是将数据定义为“面板”形式 ●xtdes 该命令是了解面板数据结构 ●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析) ●gen lag_y=L.y /////// 产生一个滞后一期的新变量

gen F_y=F.y /////// 产生一个超前项的新变量 gen D_y=D.y /////// 产生一个一阶差分的新变量 gen D2_y=D2.y /////// 产生一个二阶差分的新变量 (二)模型的筛选和检验 ●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtreg sq cpi unem g se5 ln,fe 对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。 ●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量) (原假设:使用OLS混合模型) ●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0

可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。可见,随机效应模型也优于混合OLS模型。 ●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验) 原假设:使用随机效应模型(个体效应与解释变量无关) 通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下: Step1:估计固定效应模型,存储估计结果 Step2:估计随机效应模型,存储估计结果 Step3:进行Hausman检验 ●qui xtreg sq cpi unem g se5 ln,fe est store fe qui xtreg sq cpi unem g se5 ln,re est store re hausman fe (或者更优的是hausman fe,sigmamore/ sigmaless) 可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。此时,需要采用工具变量法和是使用固定效应模型。

最新Stata软件基本操作和数据分析入门

Stata软件基本操作和数据分析入门 第一讲Stata操作入门 张文彤赵耐青 第一节概况 Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的产品,其最新版本为7.0版。它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。 Stata最为突出的特点是短小精悍、功能强大,其最新的7.0版整个系统只有10M左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是他的统计分析功能极为全面,比起1G以上大小的SAS系统也毫不逊色。另外,由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。 由于Stata的用户群始终定位于专业统计分析人员,因此他的操作方式也别具一格,在Windows席卷天下的时代,他一直坚持使用命令行/程序操作方式,拒不推出菜单操作系统。但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。更为令人叹服的是,Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。

除了操作方式简洁外,Stata的用户接口在其他方面也做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于进行统计教学的统计软件。 Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件(ADO文件),这些文件可以自行修改、添加和下载。用户可随时到Stata网站寻找并下载最新的升级文件。事实上,Stata的这一特点使得他始终处于统计分析方法发展的最前沿,用户几乎总是能很快找到最新统计算法的Stata程序版本,而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。 由于以上特点,Stata已经在科研、教育领域得到了广泛应用,WHO的研究人员现在也把Stata作为主要的统计分析工作软件。 第二节Stata操作入门 一、Stata的界面 图1即为Stata 7.0启动后的界面,除了Windows版本的软件都有的菜单栏、工具栏,状态栏等外,Stata的界面主要是由四个窗口构成,分述如下: 1.结果窗口:位于界面右上部,软件运行中的所有信息,如所执行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本,如白色表示命令,红色表示错误信息。 2.命令窗口:位于结果窗口下方,相当于DOS软件中的命令行,此处用于键入需要执行的命令,回车后即开始执行,相应的结果则会在结果窗口中显示出来。

[推荐] stata基本操作汇总常用命令

[推荐] Stata基本操作汇总——常用命令 help和search都是查找帮助文件的命令,它们之间的 区别在于help用于查找精确的命令名,而search是模糊查找。 如果你知道某个命令的名字,并且想知道它的具体使用方法,只须在stata的命令行窗口中输入help空格加上这个名字。回车后结果屏幕上就会显示出这个命令的帮助文件的全部 内容。如果你想知道在stata下做某个估计或某种计算,而 不知道具体该如何实现,就需要用search命令了。使用的 方法和help类似,只须把准确的命令名改成某个关键词。回车后结果窗口会给出所有和这个关键词相关的帮助文件名 和链接列表。在列表中寻找最相关的内容,点击后在弹出的查看窗口中会给出相关的帮助文件。耐心寻找,反复实验,通常可以较快地找到你需要的内容.下面该正式处理数据了。我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。因为很少有一项实证研究能够一次完成,所以,当你下次继续工作时。能够重复前面的工作是非常重要的。有时因为一些细小的不同,你会发现无法复制原先的结果了。这时如果有记录下以往工作的do文件将把你从地狱带到天堂。因为你不必一遍又一遍地试图重现做过的工作。在stata 窗口上部的工具栏中有个孤立的小按钮,把鼠标放上去会出

现“bring do-file editor to front”,点击它就会出现do文件编 辑器。 为了使do文件能够顺利工作,一般需要编辑do文件的“头”和“尾”。这里给出我使用的“头”和“尾”。capture clear (清空内存中的数据)capture log close (关闭所有 打开的日志文件)set more off (关闭more选项。如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。你按空格键后再输出下一屏,直到全部输完。如果关闭则中间不停,一次全部输出。)set matsize 4000 (设置矩阵的最大阶数。我用的是不是太大了?)cd D: (进入数据所在的盘符和文件夹。和dos的命令行很相似。)log using (文件名).log,replace (打开日志文件,并更新。日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果。)use (文件名),clear (打开数据文件。)(文件内容)log close (关闭日志文件。)exit,clear (退出并清空内存中的数据。) 实证工作中往往接触的是原始数据。这些数据没有经过整理,有一些错漏和不统一的地方。比如,对某个变量的缺失观察值,有时会用点,有时会用-9,-99等来表示。回归时如果 使用这些观察,往往得出非常错误的结果。还有,在不同的数据文件中,相同变量有时使用的变量名不同,会给合并数

5分钟速学stata面板数据回归(初学者超实用!)

5分钟速学stata面板数据回归(超实用!) 第一步:编辑数据。 面板数据的回归,比如该回归模型为:Y it=β0+β1X1it+β2X2it+β3X3it+εt,在stata中进行回归,需要先将各个变量的数据逐个编辑好,该模型中共有Y X1 X2 X3三个变量,那么先从Y的数据开始编辑,将变量Y的面板数据编辑到stata软件中,较方便的做法是,将excel的数据直接复制到stata软件的数据编辑框中,而excel中的数据需要如下图编辑: 从数据的第二行开始选中20个样本数据,如图:

直接复制粘贴至stata中的data editor中,如图: 第二步:格式调整。 首先,请将代表样本的var1Y变量数据是选20个省份5年的数据为样本,那么口令为rename var1 province 。例如:本例中的Y变量数据编辑接下来需要输入口令为reshape long var,i(province) 其中,var代表的是所有的年份(var2,var3,var4,var5,var6),转化后格式如图: 转化成功后,继续重命名,其中_j这里代表原始表中的年份,var代表该变量的名称

例如,我们编辑的是Y变量的数据,所以口令3和口令4的输入如下: 口令3:rename _j year 口令4:rename var taxi (注:taxi就是Y变量,我们用taxi表示Y) 命名完,数据编辑框如下图所示。 第三步:排序。 例如,本例中的Y变量(taxi),是20个省份和5年的面板数据, 那么口令4为sort province year (虽意思是将province按升序排列,然后再根据排好的province数列排year这一列升序排列。然很多时候在执行sort之前,数据已经符合排序要求了,但为以防万一,请务必执行此操作) 第三步:保存。

伍德里奇---计量经济学第6章部分计算机习题详解(STATA)

班级:金融学×××班姓名:××学号:×××××××C6.9 NBASAL.RAW points=β0+β1exper+β2exper2+β3age+β4coll+u 解:(ⅰ)按照通常的格式报告结果。 由上图可知:points=35.22+2.364exper?0.077exper2?1.074age?1.286coll 6.9870.4050.02350.295 (0.451) n=269,R2=0.1412,R2=0.1282。 (ⅱ)保持大学打球年数和年龄不变,从加盟的第几个年份开始,在NBA打球的经历实际上将降低每场得分?这讲得通吗? 由上述估计方程可知,转折点是exper的系数与exper2系数的两倍之比:exper?= β12β2= 2.364[2×?0.077]=15.35,即从加盟的第15个到第16个年份之间,球员在NBA打球的经历实际上将降低每场得分。实际上,在模型所用的数据中,269名球员中只有2位的打球年数超过了15年,数据代表性不大,所以这个结果讲不通。 (ⅲ)为什么coll具有负系数,而且统计显著? 一般情况下,NBA运动员的球员都会在读完大学之前被选拔出,甚至从高中选出,所以这些球员在大学打球的时间少,但每场得分却很高,所以coll具有负系数。同时,coll的t统计量为-2.85,所以coll统计显著。 (ⅳ)有必要在方程中增加age的二次项吗?控制exper和coll之后,这对年龄效应意味着什么?

增加age的二次项后,原估计模型变成: points=73.59+2.864exper?0.128exper2?3.984age+0.054age2?1.313coll 35.930.610.05 2.690.05 (0.45) n=269,R2=0.1451,R2=0.1288。 由方程可知:age的t统计量为?1.48,age2的t统计量为1.09,所以age和age的二次项统计都不显著,而当不增加age2时,age的t统计量为?3.64,统计显著,因此完全没有必要在方程中增加age的二次项。当控制了exper和coll之后,年龄对points的负效应将会增大。 (ⅴ)现在将log?(wage)对points,exper,exper2,age和coll回归。以通常的格式报告结论。 所以,log wage=6.78+0.078points+0.218exper?0.0071exper2?0.048age?0.040coll 0.850.0070.0500.00280.035 (0.053) n=269,R2=0.4878,R2=0.4781。 (ⅵ)在第(ⅴ)部分的回归中检验age和coll是否联合显著。一旦控制了生产力和资历,这对考察年龄和受教育程度是否对工资具有单独影响这个问题有何含义?

运用Stata做计量经济学

运用Stata做计量经济学 运用Stata建模的7步骤: 1、准备工作;目录、日志、读入数据、熟悉数据、时间变量、more、……; 2、探索数据:数据变换、描述统计量、相关系数、趋势图、散点图、……; 3、建立模型:regress、经济理论检验、实际经济问题要求、统计学检验、计量经济学检验:R2,T,t,残差; 4、诊断模型:异方差、序列相关、多重共线性、随机解释变量问题、……; 5、修正模型:WLS、GLS、工具变量法(ivregress),……; 6、应用模型:置信区间、预测、结构分析、边际分析、弹性分析、常用模型回归系数的意义、……; 7、整理:关闭日志、生成do文件备用 1、准备工作 让STATA处于初始状态,清除所有使用过的痕迹clear 指明版本号version11 设定并进入工作文件夹:cd D:\ (设定路径,将数据、程序和输出结果文件均存入该文件夹) 关闭以前的日志capture log close 建立日志:log using , replace 设定内存:set mem 20m

关闭more:set more off 读入数据:use .dta, clear 认识变量:describe 建立时间变量:tsset 2、用描述统计方法探索数据特征 必要的数据转换:gen、replace、……; 描述统计量:summarize, detail 相关系数矩阵:corr/pwcorr 散点图和拟合直线图:scatter y x || lfit y x 矩阵散点图:graph matrix y x1 x2 x3,half 线性趋势图:line y x 3、建立模型 OLS建立模型:regress y x1 x2 x3; 由方差分析表并用F和R2检验模型整体显著性; 依据p值对各系数进行t检验,一次只能剔出一个最不显著的变量,直到不包含不显著的变量; 估计参数,判别变量的相对重要性; 构造和估计约束模型,用以检验经济理论

计量经济学常用方法及应用-经济管理学院

计量经济学专题及应用 【授课计划:计划讲8个专题。主要是对计量经济学中5块常用的方法进行总结性和归纳性的介绍,侧重于讲在实际经济研究和实证分析中碰到相应问题时,计量经济方法上应当怎样处理,为什么要这样处理,如何处理,并结合STATA 讲应用例子。此外,1次专题介绍STATA的基础功能,1次专题系统梳理计量经济学的基础理论,还有1次专题结合实际研究例子,介绍一手数据搜集的调查设计和组织。通过上述课程,使学生能够在已经接受过基本理论和方法训练的基础上,更好地理解计量经济学的内容,并培养和提高开展实证研究的能力】 1、STATA简介及简单应用 介绍目前国内外最流行的计量经济分析软件STATA的基本功能和用法,通过简单例子介绍STATA在数据清理和管理、描述性统计分析、回归分析等方法的用法。同时插入EXCEL在处理数据方面的一些功能和应用。上午讲课,下午习题课。 2、计量经济分析基础 对计量经济学的基础理论进行总结性和归纳性的回顾、输理和介绍,重点讲假设检验和回归的道理,以及回归诊断。上午讲课,下午习题课。 3、项目评估与政策分析应用 系统介绍计量经济学在项目评估和政策分析上的方法和应用,特别介绍虚拟变量模型的建立及其在政策分析和项目评估研究中的应用。上午讲课,下午习题课。 4、经济学中的内生性问题及相关计量经济方法 总结和介绍计量经济学中内生性问题在经济研究中的涵义和问题,内生性问题产生的主要原因,对计量估计结果的影响,内生性问题的处理方法(工具变量和两阶段估计等)和应用例子。上午讲课,下午习题课。 5、微观个体行为的计量经济分析方法 总结和介绍分析微观个体行为的属性和受限因变量模型(Probit, Logit, Tobit, Heckman, Mlogit, Clogit等)等常用微观计量经济方法,包括模型内涵和适用范

Stata操作入门(中文)

第一讲Stata操作入门 第一节概况 Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的产品,其最新版本为7.0版。它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来 越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。 Stata最为突出的特点是短小精悍、功能强大,其最新的7.0版整个系统只有10M左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是他的统计分析功能极为全面,比起1G以上大小的SAS系统也毫不逊色。另外,由于Stata在分析时是将数据全部读入内存,在计算全部完成后才 和磁盘交换数据,因此运算速度极快。 由于Stata的用户群始终定位于专业统计分析人员,因此他的操作方式也别具一格,在Windows席卷天下的时代,他一直坚持使用命令行/程序操作方式,拒不推出菜单操作系统。但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同 一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。更为令人叹 服的是,Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。 除了操作方式简洁外,Stata的用户接口在其他方面也做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于进行统计教学的统计软件。 Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件(ADO文件),这些文件可以自行修改、添加和下载。用户可随时到Stata网站寻找并下载最新的升级文件。 事实上,Stata的这一特点使得他始终处于统计分析方法发展的最前沿,用户几乎总是能很快找到最新统计算法的Stata程序版本,而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。 由于以上特点,Stata已经在科研、教育领域得到了广泛应用,WHO的研究人员现在也把Stata作为主要的统计分析工作软件。 第二节Stata操作入门 一、Stata的界面 图1即为Stata 7.0启动后的界面,除了Windows版本的软件都有的菜单栏、工具栏,状态栏等外,Stata的界面主要是由四个窗口构成,分述如下: 1.结果窗口 位于界面右上部,软件运行中的所有信息,如所执行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本,如白色表示命令,红色表示错误信息。

计量经济学与stata——第一章

第一章引言 目录 1回归的本质 (1) 2计量经济学的一些基本概念和术语 (3) 2.1 统计关系与确定性关系 (3) 2.2 回归关系、相关关系与因果关系 (4) 2.3 术语与符号 (4) 2.4 数据类型 (4) 2.5 计量经济学的估计框架 (5) 2.6 经典计量经济学的方法论 (5) 3Stata简单介绍 (8) 4第一章附录: (8) 4.1 诺贝尔经济学奖与计量经济学 (8) 4.2 相关数学基础 (14) 4.3 本章相关数学证明 (19)

1 回归的本质 计量经济学的一般模型: 2(,)[]0[]y F X E E βεεεεσ′=+==Ω 回归是计量经济学的核心,理解回归的本质,对于掌握计量经济的理论与方法至关重要。回归的本质用语言来描述其实很简单,就是: 对于一组随机变量y 和X ,如果y 和X 存在特定的关系,为分析y 和X 之间的相互影响,或用X 去预测y ,需要知道y 和X 的模型形式以及模型中参数β的值,但是,由于—— 1、正确的模型形式(,)y F X β=未知,只能尽可能去逼近它(注:这涉及经济理论模型及模型设定的问题)。 2、即使假定模型的形式(,)y F X β=(不包括β)已被确定,也不可能穷尽随机变量和y X 的所有取值(即总体),来得到真实的β。 基于这两点,真实的模型形式(,)F X β和β无法得到,只能利用估计方法和 样本数据去尽可能得到与真实(,)F X β和β偏差或者误差最小的?(,)F X β和?β,即 2??min [((,))]E y F X β? (1) 使得(1)成立的?(,)F X β即是对于y X 的条件数学期望: ??(,)[/]F X E y X β= 注:从参数估计的角度来说,对于不同的估计方法,比如OLS (最小二乘估计法)、MLE (最大似然估计法)、GMM (矩估计或广义矩估计法),最小化均方误差的表述不尽相同,但本质是一样的。 理解回归的例子:凯恩斯消费函数、OLS 、一元线性回归(双变量回归) 凯恩斯消费函数是一个典型的一元线性回归模型,根据凯恩斯的经济理论,消费和收入存在密切的联系,如果用表示消费,Y 表示收入,则最简单与最常见的凯恩斯消费函数C 理论模型可表示为: C Y αβ=+ (2) 函数满足以下条件:

斯托克,沃森计量经济学第四章实证练习stata操作及答案

E4.1 E4.2 E4.3 E4.4

E4.1 VARIABLES ahe age 0.605 (0.0245) Constant 1.082 (0.688) Observations 7,711 R-squared 0.029 Robust standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1 1. ① 截距估计值estimated intercept: 1.082 ② 斜率估计值estimated slope: 0.605 回归方程:ahe= 1.082+0.605*age ③ 当工人年长 1 岁,平均每小时工资增加0.605 美元。 2. Bob: 0.605*26+1.082=16.812 (美元) Alexis: 0.605*30+1.082=19.232 (美元) 答:预测Bob 的收入为每小时16.812美元,Alexis为19.232 美元。 3. 年龄不能解释不同个体收入变化的大部分。因为R-squared 反映了因变量的 全部变化能通过回归关系被自变量充分解释的比例,而分析得R-squared 的值为0.029,解释度低,说明年龄不能解释不同个体收入变化的大部分

E4.1 (0.0449) Observations 463 R-squared 0.036 Robust standard errors in parentheses *** p<0.01, ** p<0.05, * p<0.1 ① 截距估计值: 3.998 斜率估计值: 0.133 回归方程: Course_Eval=3.998+0.133*beauty lave_esruo 0a u ty a e 1. 答:两者看上去有微弱的正相关关系 2. VARIABLES course eval beauty Constant 0.133 (0.0550) 3.998

-第2章-Stata入门-计量经济学及Stata应用及应用

? 陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。 第2章 Stata入门 2.1 为什么使用Stata Stata软件因操作简单且功能强大,为目前在欧美最流行的统计与计量软件,拥有众多用户。 Stata公司定期升级软件,以适应计量经济学的迅猛发展。 Stata软件还留有“用户接口”,允许用户自己编写命令与函数,并上传到网上实现共享。一些最新计量方法,可在线查找和下载由用户编写的Stata命令程序(user-written Stata commands)。这些“非官方命令”(也称“外部命令”)的使用方法与官方命令完全相同,使得Stata的功能如虎添翼。 1

本教材使用Stata 13版本(2013年6月发布)。 对于绝大多数命令与功能,即使用更低的Stata版本(如Stata 11或Stata 12),也几乎没有差别。 2.2 Stata的窗口 安装Stata 13后,在安装的文件夹中将出现如下Stata 13图标(Stata 11或Stata 12的图标大同小异),参见图2.1: 图2.1 Stata 13的图标 双击此Stata图标,即可打开Stata。 2

3 如想在电脑桌面创建开启Stata 软件的快捷方式,可右键点击Stata 13的图标,然后选择“发送到”→“桌面快捷方式”,参见图2.2。 图2.2 发送Stata 13到桌面快捷方式

打开Stata后可看到,在最上方有一排“下拉式菜单”(pull-down menu),参见图2.3: 图2.3 Stata的下拉式菜单 在Stata中运行单个命令主要有两种方式,其一为点击菜单,其二为在“命令窗口”输入命令。 通过菜单执行命令(menu-driven)可能要点击多重菜单,通常还要填写对话框(dialog),以明确命令参数,不如在命令窗口直接输入命令方便。 在菜单之下,为一系列图标,起着快捷键的作用,参见图2.4。 4

stata入门教程

Stata 快速入门 1、Stata的窗口 ?在最上方有一排菜单,即“File Edit Data Graphics Statistics User Window Help”。?左上“Review”(历史窗口):此窗口记录着自启动Stata以来执行过的命令。?右上“Variables”(变量窗口):此窗口记录着目前Stata内存中的所有变量。?正上方“Results”(结果窗口):此窗口显示执行Stata命令后的输出结果。 ?正下方“Command”(命令窗口):在此窗口输入想要执行的Stata命令。 2、将数据导入Stata ?打开Stata软件后,点击Data Editor(Edit)图标(也可以点击菜单“Window”→“Data Editor”),即可打开一个类似Excel的空白表格。 ?用Excel打开文件“nerlove.xls”,复制文件中的所有数据,并粘贴到Data Editor 中。 ?导入数据的另一方法是,点击菜单“File”→“Import”,然后导入各种格式的数据。但这种方法有时不如直接从Excel表中粘贴数据来得方便直观。 3、变量窗口 ?关闭Data Editor后,即会看到右上方的“Variables”窗口出现了5个变量:?分别为tc(total cost,总成本),q(total output, 总产量),pl(price of labor,小时工资率),pf(price of fuel,燃料价格),与pk(user cost of capital,资本的租赁价格。 4、存为dta数据文件 ?此时,可以点击Save图标(也可以点击菜单“File”→“Save”),将数据存为Stata格式的文件(扩展名为dta),比如nerlove.dta。 ?以后就可以用Stata直接打开这个数据集了(不需要再从Excel表中粘贴过来)。 5、打开dta数据文件 打开的方式有三种: 1.点击Open图标(也可以点击菜单“File”→“Open”),然后寻找要打开的dta 文件的位置。 2.直接双击想要打开的dta文件 3.在命令窗口输入以下命令(假设文件在E盘的根目录)并回车(按Enter键)

计量经济学stata操作指南

计量经济学stata操作(实验课) 第一章stata基本知识 1、stata窗口介绍 2、基本操作 (1)窗口锁定:Edit-preferences-general preferences-windowing-lock splitter (2)数据导入 (3)打开文件:use E:\example.dta,clear (4)日期数据导入: gen newvar=date(varname, “ymd”) format newvar %td 年度数据 gen newvar=monthly(varname, “ym”) format newvar %tm 月度数据 gen newvar=quarterly(varname, “yq”) format newvar %tq 季度数据 (5)变量标签 Label variable tc ` “total output” ’ (6)审视数据 describe list x1 x2 list x1 x2 in 1/5 list x1 x2 if q>=1000 drop if q>=1000 keep if q>=1000 (6)考察变量的统计特征 summarize x1 su x1 if q>=10000 su q,detail su tabulate x1 correlate x1 x2 x3 x4 x5 x6 (7)画图 histogram x1, width(1000) frequency kdensity x1 scatter x1 x2 twoway (scatter x1 x2) (lfit x1 x2) twoway (scatter x1 x2) (qfit x1 x2) (8)生成新变量 gen lnx1=log(x1) gen q2=q^2 gen lnx1lnx2=lnx1*lnx2 gen larg=(x1>=10000) rename larg large

Stata软件学习者应该收藏的学习资源

此软文主要面向讲师和做科研的人员,建议发布在此类人员关注的互动性强的网站 Stata软件学习者应该收藏的学习资源 ---- Stata牛人的学习笔记分享(转帖) 前言: 小弟小本,非统计专业科班出身,参加工作才知道原来学的统计知识不够用,在头儿的刺激下开始学习统计软件,计量知识薄弱,为了理清一堆模型,在各经济论坛潜水多时,水平没见涨,倒是收集了不少学习资料。这里转一篇Stata牛人前辈的笔记分享,供广大奋战在软件学习道路上的同学参考+瞻仰 正文如下: 我经常会被问到“Stata好学吗”、“我多长时间能学会Stata”,诸如此类的问题。诚然,相比于SPSS和Eviews等软件,Stata的门槛的确要高一些。然而,问题的关键并不在于Stata本身有多么难学,而在于你在统计和计量方面花费了多少时间,这与学习Stata所需的时间显著负相关。因此,我的回答往往会是:“哦,这个不好说,如果……,其实很简单……”。 相比于十年前,现在学习Stata的资料已经非常丰富了。虽说殊途同归,但不同的学习路径却存在着巨大的效率差异。对于初学者而言,我的建议是,首要的问题是知道“Stata能做什么”,继而才是“Stata如何做什么”。 第一个问题之所以重要,是因为从本质上讲,Stata只是我们完成统计分析的工具而已,因此,其基本平台是否宽广、是否有扩展潜力,以及它提供的分析工具是否能满足你的专业需求,都是你在选择Stata之前需要深入了解的。Stata User’s Guide(400页,中文)对这些问题做出了很好的解答,是一幅绝佳的导航图,能帮助你在短时间内了解Stata的基本架构、语法特征和核心功能。对于第二个问题,则有众多的资料可供参考: (1)网络资源 我精选了一些链接。值得一提的有如下几个: ●Stata官方网站。Stata公司提供的Web resources,涵盖了大量相关网络资源; 其FAQ则提供了各种常见问题的解答;Statalist则是一个类似于人大经济论坛 的免费的讨论区。加入Statalist的方法很简单,你只需要发送邮件至 majordomo@https://www.sodocs.net/doc/8e14328818.html,,邮件内容无需任何称谓,只需写上“subscribe Statalist”的字样即可。接到确认信息后,你便成为一名Statalist的成员了。当 然,即使不加入,你仍然可以浏览,但不能提问。 ●UCLA(加州大学洛杉矶分校)提供的网络教程。该网站提供的Data Management、

计量经济学基础与STATA应用

计量经济学基础与STATA应用 基本概念 【经典假设】 1、模型为线性;(多项式、对数、倒数、对数倒数、含有时间趋势) 2、X为变量; 3、残差序列(条件)均值为0; 4、残差序列(条件)方差齐性,即同方差; 5、残差序列之间无自相关性; 6、残差序列与解释变量不相关; 7、解释变量之间不存在完全的线性关系; 8、残差序列服从正态分布。 【残差正态性检验】 1、残差直方图:histogram e, norm freq 2、利用偏度系数和峰度系数:sktest 3、正态概率图: 问题检验与解决 【多重共线性】 完全多重共线性:参数无法唯一确定,方差无穷大。 不完全多重共线性:方差增大 诊断方法: 1、模型判定系数R方值高而具有显着的t值得变量少 2、解释变量之间有高度的两两相关 3、检查偏相关 4、辅助回归 5、病态指数 6、方差膨胀因子(VIF) 补救方法: 1、利用先验信息 2、横截面数据与时间序列数据并用 3、剔除变量(有可能出现模型的设定偏误) 4、变量替换(一阶差分:可能使得残差存在一定的相关性、比率:可能使得残差不再同方差) 5、补充新的数据 6、在多项式回归中降低共线性 【异方差】 原因: 1、按照边错边改边学习模型,人们在学习的过程中,其行为误差随着时间的延长而减少; 2、数据采集技术的改进

3、异常值出现 4、回归模型的设定不正确,如遗漏重要变量 5、回归元的分布呈偏态,如收入 6、不正确的数据变换或函数变换 7、横截面数据中更为常见 问题: 系数依旧无偏,估计方差增大,t值变小,从而导致本来显着地回归系数变成了统计不显着 诊断方法: 1、图解法:残差平方对y预测值或某一解释变量 2、帕克检验:先用OLS产生残差,再用残差平方对X回归,系数显着就有异方差; 3、格莱泽检验:先用OLS产生残差,用残差的绝对值对X的各种变换回归; 4、戈德菲尔德-匡特检验:先将X的观测值按升序排列,略去居中的c个观测,将前后分成两组分别 回归得到各自的残差平方和,做F检验 5、布劳殊-培干-戈弗雷检验(BPG检验):先回归得到残差平方和,计算残差平方和的均值,构造pi=ui2/ 均值,用pi对全部或部分X做回归,得到ESS,做卡方检验:estat hettest 6、怀特检验(White检验):回归得到残差平方和,用残差平方和对X和X方和X交叉项做回归,得 到R方,对nR2做卡方检验:estat imtest,white 7、寇因克-巴塞特检验(KB检验):残差平方和对预测Y平方做回归 解决: 当方差已知,WLS 当方差未知,误差方差正比于X2,两边除以X 误差方差正比于X,两边除以根号X 误差方差正比于Y均值的平方,两边除以Y均值 进行对数转换。 注意:一个好的模型,绝不会因为异方差性的原因而被抛弃。只有在问题严重的时候,误差方差不相等的问题才值得去修正。当模型参数的最大方差(OLS估计)比最小方差(GLS估计)的10倍还大时,问题才是严重的。 【自相关】 Cov(ui, uj) !=0 来源: 1、惯性:如GDP、价格指数 2、设定偏误,应含而未含变量,不正确的函数形式 3、蛛网现象:如供给价格的反应要滞后一个时期,今年种植的作物受去年流行的价格影响 4、滞后效应: 5、数据的编造 问题: OLS估计量仍是无偏线性的,方差估计错误 诊断方法: 1、图解法:残差对时间,残差对残差滞后 2、游程检验:runtest 3、德宾-沃森检验(DW检验):0-dl(拒绝正自相关),dl-du(无决定域),du-2-(4-du)(不拒绝)、(4-du)-(4-dl) (无决定域)、(4-dl)-4(拒绝负自相关):dwstat 4、布劳殊-戈弗雷检验:BG检验(LM检验) 解决: 如果AR(1),

STATA高级视频教程简介(连玉君)

STATA高级视频教程简介 培训目的: STATA高级视频教程的目的是使学员熟练使用STATA进行实证分析工作,主要包括: (1) 掌握多种常用的估计方法(如普通最小二乘法、广义最小二乘法、非线性最小二乘法、最大似然估计、IV估计和GMM); (2) 学会估计和分析时间序列和面板数据常用模型(如单位根检验、协整分析、VAR、固定效应模型、随机效应模型、动态面板模型、面板单位根检验和面板协整分析等等); (3) 学会编写一个完整的STATA程序; (4) 学会应用STATA进行抽样和模拟分析,包括Bootstrap和Monte Carlo 模拟分析。 课程简介:(详见课程目录) STATA高级视频教程共9讲,共48个视频文件,总计50余个学时。 第1-5讲介绍计量经济学中最为常用的五种估计方法,包括:普通最小二乘法(OLS)、广义最小二乘法(GLS)、非线性最小二乘法(NLS)、最大似然法(MLE)和广义矩估计法(GMM)。 第6讲介绍时间序列模型,包括:ARIMA模型、VAR模型、单位根检验、协整分析、误差修正模型、GARCH模型。这些模型基本上涵盖了宏观时间序列、金融时间序列分析中的常用工具。 第7讲介绍面板数据模型,包括:固定效应模型、随机效应模型、异方差和序列相关、动态面板模型、面板随机系数模型、面板随机前沿模型、面板单位根检验、面板协整分析等。这些模型由浅入深,基本上涵盖了目前文献中使用的多数面板分析方法。 第8讲介绍STATA编程技巧,包括:输入项、输出项的设定,子程序、可分组执行、可重复执行等程序高级功能,以及帮助文件的编写方法。通过本讲的学习,学员将能够独立编写复杂的STATA程序,这些程序和STATA官方提供的程序完全一致。 第9讲介绍自抽样和模拟分析,包括:Bootstrap(自抽样)、组合检验(Permutation tests)、刀切法(Jackknife)和蒙特卡洛模拟。不同于传统的假设检验和统计推断方法,这些方法都是以计算机模拟和抽样为基础的,在最近十年

计量经济学stata上机命令整理

计量经济学上机命令整理 实验一 edit 打开数据编辑器 browse 打开数据浏览器 rename 对变量重新命名 label save describe 对数据集简要描述 sort 排序例如:list in -10/-1 list 显示变量的数值 Generate 缩小:gen 生成新的变量后面可以接if条件句 Replace 替换append 覆盖 Summarize 缩写:su 总结后面可以接if条件句 实验二 twoway (scatter y x)(connected ey_x x) 在该散点图上,做出条件均值点 sc y x||lfit y x 画出线图和散点图 Reg y x 做出回归 Rename ** y **指原变量名用于修改变量名字 graph twoway scatter y x 画出y x 的二维散点图 Line y x 做出y x 的线条图 egen Ey_x=mean(y),by(x) 求在同一x水平下,求y的均值 实验三 Regress y x1 x2 ........做多元回归 Precict e,re 预测方差 Sort e 按照方差排序 Cor y x 测试y与x的相关程度 Pwcorr y x 也是测试y与x的相关程度 Set obs 90 (90为任意一个数字),增加一个或者多个样本值 Replace x=980 in 90 为第90个样本值赋值(980为任意一个数字) Predict yhat 预测y的估计值 Display invttail(n,p) n为自由度;p为概率(一般为0.025)。用来求t分布的t 值 Display ttail(n,t)知道t值求T

相关主题