当前位置：搜档网 › stata 安装命令的一些地址及说明

stata 安装命令的一些地址及说明

stata 安装命令的一些地址及说明.txt明骚易躲，暗贱难防。佛祖曰：你俩就是大傻B！当白天又一次把黑夜按翻在床上的时候，太阳就出生了直接在命令输入地址
net from https://www.sodocs.net/doc/1010773533.html,/judson.caskey/programs

Spearman 和 Pearson 检验同在一个表的命令
corrtbl Y var1 var2 var3 var4 var5 var6 var7 ,corrvars ( Y var1 var2 var3 var4 var5 var6 var7)

我所使用的常见STATA命令

一、数据的取得：
一般早期的数据处理，合并，按照本人的习惯，一般采用Excel软件进行处理，处理完成后，直接将Excel表格
内容复制到STATA数据编辑器（DATA Editor）中即可。
具体步骤：Data菜单中Data Editor下
或者，如果遇到表中存在空值，或者直接数据来源于其他格式，
（如CSMAR中的DBF格式，该DBF格式无法被Microsoft Access正常识别和打开），则可采用StatTransfer软件进行转换。

二、数据的基本分析
1. 线性回归 (Linear Regression)
命令: Regress
举例：regress auditingfee auditngfirmsize firmsize, robust
其中，robust是指报告经过异方差调整后的t值。
2. 回归结果的检验：
回归结果的检验主要包括自相关和共线性问题（异方差可用Robust轻易调整）
1.1. 共线性：
一般采用VIF（方差膨胀因子）来检验，STATA实现相对简单，只需执行命令：estat vif即可
另外，在大量的会计，财务的实证文献中，Pearson检验和Spearman检验在作为单变量分析的同时，
也常常作为共线性问题的一个佐证。其实现命令如下：
Pearson检验： pwcorr var1 var2 var3 … varN, sig
Spearman检验：spearman var1 var2 var3 … varN, stats(rho p)
只需将生成的表放入Excel中，稍加处理，即可产生我们常见的相关性表格
1.2. 异方差：
一般利用Durbin-Watson值（简称DW值）来检验回归模型的自相关问题。由于STATA
要求被检验的数据是一个序列，所以，在检验DW值以前，我们必须做一个序列。
一般情况下，若样本中无现成的序列变量，我们采用生成ID的方式来解决，简要步骤如下：
首先，若存在分组，对分组变量排序，同时对时间变量排序（如年，月等），尽量保证在
同一分组的样本中得到的ID是连续的，否则STATA会提示GAPS的存在：
命令： Sort Var
其次，生成ID，命令: gen id=_n
最后一步，设置ID为序列变量：tsset id
注意，在每次分组以后都需要重新定义ID，以防止DW出错！
此时，我们就可以进行DW值的计算，命令：DWSTAT
1.3. 异方差的调整
命令：Prais或者Newey
3. 回归结果的输出：
早期，我使用STATA时的回归结果都是手工复制到Excel中加以处理，但是，
这并不适合大量回归结果导出。事实上，STATA的UDF（User Defined Function，
用户自定义函数）为
我们提供了一个很好的解

决方案），我们可以使用Outreg2来解决这个问题：
由于该函数并不是STATA的系统函数，首先，我们需要得到这个命令：
Findit outreg2, 然后按照提示操作即可。
我常用的格式一般如下：
Outreg2 using x:/xxx, word tstat
其中，using子句规定了我打算输出的文件名和路径，而参数Word则规定了文件的格式为RTF
（不是我们想当然的Word格式，但是Word对其有很好的兼容性），tstat则要求输出t值（该函数默认输出标准误）
三、其他问题：
1. 极端值处理：
本次论文，我们主要采用了Winsorize 的处理方法，该方法主要将1%内的极端值用该区间的均值进行替代，
以减小其波动的方法，个人认为该方法比直接剔除显得更加科学些。同outreg2一样，该命令也不是系统自带函数，
故也需通过findit winsor来取得。
例，我打算对CAR进行处理，极端值范围定义为1%，生成新变量为CAR1，则命令如下：
Winsor car, gen (car1) p(0.01)
2. 分组回归：
有时候我们需要在回归的时候同时输出DW，VIF等值，同时还需用Outreg2来导出，此刻，
直接使用By子句显然无法达到以上的需求。这里我们可以采用For循环来解决，主要格式如下：
Forvalues i=m/n {
Regress ….. if group==`I’
Outreg2 …..
Estat vif
Dwstat
}
其中，m和n分别指代分组变量的起始值和终止值。（终止值可大于实际值，但是起始值切不可小于实际值），
group代表分组变量名
该结构也可以同时套用到Jones模型，Basu模型等计算中
3. 虚拟变量生成：
例如：我们打算对年份（year）生成虚拟变量，变量名设为（y1, y2,y3….）
则：命令如下：ta (year), gen(y) 即可
对行业也是如此 ta (ind), gen(y)
如果是连续数据，可以写成 y1-yn,代表y1 y2 ....yn

4. 将数列按照排序分组，生产一个新的虚拟变量
xtile quart1= growth, nq(5)

5 求残差
predict e,resid
(e 代表残差的赋值变量)

6 sum 函数用来做描述性统计
sum
sum,detail

7 ,clear 清除原有数据
8 cor 相关性

9 描述性
tabstat
SUM
比如对现金cash 描述，即tabstat cash 或 sum cash

stata 安装命令的一些地址及说明

相关文档

最新文档

stata 安装命令的一些地址 及说明

相关文档

最新文档

stata 安装命令的一些地址及说明