搜档网
当前位置:搜档网 › stata 安装命令的一些地址 及说明

stata 安装命令的一些地址 及说明

stata 安装命令的一些地址 及说明.txt明骚易躲,暗贱难防。佛祖曰:你俩就是大傻B!当白天又一次把黑夜按翻在床上的时候,太阳就出生了直接在命令输入地址
net from https://www.sodocs.net/doc/1010773533.html,/judson.caskey/programs

Spearman 和 Pearson 检验同在一个表的命令
corrtbl Y var1 var2 var3 var4 var5 var6 var7 ,corrvars ( Y var1 var2 var3 var4 var5 var6 var7)

我所使用的常见STATA命令

一、数据的取得:
一般早期的数据处理,合并,按照本人的习惯,一般采用Excel软件进行处理,处理完成后,直接将Excel表格
内容复制到STATA数据编辑器(DATA Editor)中即可。
具体步骤:Data菜单中Data Editor下
或者,如果遇到表中存在空值,或者直接数据来源于其他格式,
(如CSMAR中的DBF格式,该DBF格式无法被Microsoft Access正常识别和打开),则可采用StatTransfer软件进行转换。

二、数据的基本分析
1. 线性回归 (Linear Regression)
命令: Regress
举例:regress auditingfee auditngfirmsize firmsize, robust
其中,robust是指报告经过异方差调整后的t值。
2. 回归结果的检验:
回归结果的检验主要包括自相关和共线性问题(异方差可用Robust轻易调整)
1.1. 共线性:
一般采用VIF(方差膨胀因子)来检验,STATA实现相对简单,只需执行命令:estat vif即可
另外,在大量的会计,财务的实证文献中,Pearson检验和Spearman检验在作为单变量分析的同时,
也常常作为共线性问题的一个佐证。其实现命令如下:
Pearson检验: pwcorr var1 var2 var3 … varN, sig
Spearman检验:spearman var1 var2 var3 … varN, stats(rho p)
只需将生成的表放入Excel中,稍加处理,即可产生我们常见的相关性表格
1.2. 异方差:
一般利用Durbin-Watson值(简称DW值)来检验回归模型的自相关问题。由于STATA
要求被检验的数据是一个序列,所以,在检验DW值以前,我们必须做一个序列。
一般情况下,若样本中无现成的序列变量,我们采用生成ID的方式来解决,简要步骤如下:
首先,若存在分组,对分组变量排序,同时对时间变量排序(如年,月等),尽量保证在
同一分组的样本中得到的ID是连续的,否则STATA会提示GAPS的存在:
命令: Sort Var
其次,生成ID,命令: gen id=_n
最后一步,设置ID为序列变量:tsset id
注意,在每次分组以后都需要重新定义ID,以防止DW出错!
此时,我们就可以进行DW值的计算,命令:DWSTAT
1.3. 异方差的调整
命令:Prais或者Newey
3. 回归结果的输出:
早期,我使用STATA时的回归结果都是手工复制到Excel中加以处理,但是,
这并不适合大量回归结果导出。事实上,STATA的UDF(User Defined Function,
用户自定义函数)为
我们提供了一个很好的解

决方案),我们可以使用Outreg2来解决这个问题:
由于该函数并不是STATA的系统函数,首先,我们需要得到这个命令:
Findit outreg2, 然后按照提示操作即可。
我常用的格式一般如下:
Outreg2 using x:/xxx, word tstat
其中,using子句规定了我打算输出的文件名和路径,而参数Word则规定了文件的格式为RTF
( 不是我们想当然的Word格式,但是Word对其有很好的兼容性),tstat则要求输出t值(该函数默认输出标准误)
三、其他问题:
1. 极端值处理:
本次论文,我们主要采用了Winsorize 的处理方法,该方法主要将1%内的极端值用该区间的均值进行替代,
以减小其波动的方法,个人认为该方法比直接剔除显得更加科学些。同outreg2一样,该命令也不是系统自带函数,
故也需通过findit winsor来取得。
例,我打算对CAR进行处理,极端值范围定义为1%, 生成新变量为CAR1,则命令如下:
Winsor car, gen (car1) p(0.01)
2. 分组回归:
有时候我们需要在回归的时候同时输出DW,VIF等值,同时还需用Outreg2来导出,此刻,
直接使用By子句显然无法达到以上的需求。这里我们可以采用For循环来解决,主要格式如下:
Forvalues i=m/n {
Regress ….. if group==`I’
Outreg2 …..
Estat vif
Dwstat
}
其中,m和n分别指代分组变量的起始值和终止值。(终止值可大于实际值,但是起始值切不可小于实际值),
group代表分组变量名
该结构也可以同时套用到Jones模型,Basu模型等计算中
3. 虚拟变量生成:
例如:我们打算对年份(year)生成虚拟变量,变量名设为(y1, y2,y3….)
则:命令如下:ta (year), gen(y) 即可
对行业也是如此 ta (ind), gen(y)
如果是连续数据, 可以 写成 y1-yn,代表y1 y2 ....yn


4. 将数列按照排序分组,生产一个新的虚拟变量
xtile quart1= growth, nq(5)


5 求残差
predict e,resid
(e 代表残差的赋值变量)

6 sum 函数 用来做描述性统计
sum
sum,detail



7 ,clear 清除原有数据
8 cor 相关性


9 描述性
tabstat
SUM
比如对现金cash 描述,即tabstat cash 或 sum cash



相关主题