A. 工具变量法的Stata命令和实例
原发布者:th6572
工具变量
法的Stata命令及实例本实例使用
数据集
“grilic.dta”。先看一下数据集的统计特征:考察智商与受教育年限的
相关关系
:上表显示.智商(在一定程度上可以视为能力的代理变量)与受教育年限具有强烈的
正相关关系
(
相关系数
为0.51)。作为一个
参考系
.先进行OLS回归.并使用稳健
标准差
:其中expr,tenure,rns,smsa均为
控制变量
.而我们主要感兴趣的是变量受教育年限(s)。回归的结果显示.教育投资的年回报率为10.26%.这个似乎太高了。可能的原因是.由于遗漏变量“能力”与受教育正相关.故“能力”对工资的贡献也被纳入教育的贡献.因此高估了教育的回报率。引入智商iq作为能力的代理变量.再进行OLS回归:虽然教育的
投资回报率
有所下降.但是依然很高。由于用iq作为能力的代理变量有
测量误差
.故iq是
内生变量
.考虑使用变量(med(母亲的受教育年限)、kww(在“knowledgeoftheWorldofWork”中的成绩)、mrt(婚姻
虚拟变量
.已婚=1)age(年龄))作为iq的工具变量.进行2SLS回归.并使用稳健的标准差:在此2SLS回归中.
教育回报率
反而上升到13.73%.而iq对工资的贡献居然为
负值
。使用工具变量的前提是工具变量的有效性。为此.进行
过度识别
检验.考察是否所有的工具变量均外生.即与扰动项不相关:结果强烈拒绝所有工具变量均外生的原假设。考虑仅使用变量(med,kww)作为iq的工具变量.再次进行2SLS回归.同时显示第一阶段的回归结果:上表显示.教育的回
B. 如何使用hasuman检验内生性问题
解释变量内性检验 首先检验解释变量内性(解释变量内性Hausman 检验:使用工具变量前提存内解释变量Hausman 检验原假设:所解释变量均外变量拒绝则认存内解释变量要用IV;反接受则认存内解释变量应该使用OLS reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (面板数据使用工具变量Stata提供命令执行二SLS:xtivreg depvar [varlist一] (varlist_二=varlist_iv) (选择项fere等表示固定效应、随机效应等详见help xtivreg) 存内解释变量则应该选用工具变量工具变量数少于程内解释变量数恰识别用二SLS二SLS实质内解释变量两部即由工具变量所造外变部及与扰项相关其部;解释变量外部进行归满足OLS前定变量要求致估计量tptqtp 二、异差与自相关检验 球型扰项假定二SLS效扰项存异差或自相关 面板异差检验: xtgls enc invs exp imp esc mrl,igls panel(het) estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 一 lrtest hetero homo, df(`df') 面板自相关:xtserial enc invs exp imp esc mrl 则存种更效即GMM某种意义GMM于二SLSGLS于OLS识别情况GMM原普通工具变量;度识别传统矩估计行通才必要使用GMM度识别检验(Overidentification Test或J Test):estat overid 三、工具变量效验证 工具变量:工具变量要求与内解释变量相关能与解释变量扰项相关由于两要求矛盾故实践寻找合适工具变量困难需要相想象力与创作性用滞变量 需要做检验: 检验工具变量效性: (一) 检验工具变量与解释变量相关性 工具变量z与内解释变量完全相关则使用工具变量;与仅仅微弱相关种工具变量称弱工具变量(weak instruments)象本容量检验弱工具变量经验规则第阶段归F统计量于一0则必担弱工具变量问题Stata命令:estat first(显示第阶段归统计量) (二) 检验工具变量外性(接受原假设) 恰识别情况检验工具变量否与扰项相关度识别(工具变量数>内变量数)情况则进行度识别检验(Overidentification Test)检验原假设所工具变量都外拒绝该原假设则认至少某变量外即与扰项相关0H Sargan统计量Stata命令:estat overid 四、GMM程 Stata输入命令进行面板数据GMM估计 . ssc install ivreg二 (安装程序ivreg二 ) . ssc install ranktest (安装另外运行ivreg二 需要用辅助程序ranktest) . use "traffic.dta"(打面板数据) . xtset panelvar timevar (设置面板变量及间变量) . ivreg二 y x一 (x二=z一 z二),gmm二s (进行面板GMM估计其二s指二-step GMM
C. ivprobit模型中的工具变量回归结果怎么看
1. codebook显示不全肿么破?——label list
2. 小星星快速查看estimatestable,star(0.05,0.01,0.1)
3. RElogit:Rare Events Logistic Regression
4. 装个新工具ssc instal AAA
5. 多说有益 label var XX"XX是XXX"
6. 虚拟变量快速构造 i.abc
7. 取对数 gen B=log(A)
8. outreg自带显着性为二星模式,如何设置三星模式?outreg, starlevels(10 5 1)
9. 导出到result 这个word文档里: outreg2using result.doc,replace
10. A且B的给我删掉:drop if A==1 & B==1
11. 输出多个模型运行结果:reg y x1est store m1 reg yx2 est store m2 reg y x3 est store m3 outreg2 [m1 m2 m3]using table1,word
12. 多重共线性检验estat vif
13. 夹带一个Excel的私货,表格内绿色小三角如何清除?——“工具”—“错误检查”—“忽略”
14. 观测值所在区域某项指标平均值如何生成?——egen 某项指标摄取平均值=mean(某项指标), by(社区编码)
15. 清屏——cls -- ClearResults window
16. 部分观测值回归 reg y x1 x2 if x3==1
17. 用outreg2输出比值比oddsratio——outreg2 using myfile,eform word
18. 继续夹带Excel私货,CONCATENATE函数为数值添加括号=(“(“.A1.”)”)
19. 数字复制粘贴至Excel后括号显示为负号如何处理?选定——设置单元格格式···
或使用左上角“文本导入向导···”导入,最后一步设置文本格式
20. 内生性问题Hausman test
reg y x1 x2 x3...
estimates store ols
ivregress 2sls y x2 x3... (x1=Z1 Z2...)
estimates store iv
hausman iv ols, constant sigmamore
21.IV-probit
ivprobit y x2 x3 (x1=工具变量)
默认最大似然估计,可设置两步估计
(含有内生变量的 probit 模型通常有两种估计方法:最大似然估计和两步法,由于前者估计更有效率 (陈强 2014),所以本文采取最大似然法,并使用 stata 中的 ivprobit 命令计算回归结果。)——《多子一定多福吗:子女数量与母亲健康》
22.IV-oprobit
cmp (y=x1 x2 x3)(x1=z1 x2 x3) , ind($cmp_oprobit $cmp_cont) tech(dfp) nolr
23,outreg2保留小数点后三位
outreg2 [模型1] using table1,replace bdec(3) sdec(3)
【直接】outreg2 using file3.doc, replace bdec(3) sdec(3)
24,两两建立新变量
gen 顺序=.
replace 顺序=1 if A + B ==0
replace 顺序=2 if A + B > 0
replace 顺序=4 if A + B < 0
label var 顺序"102大3小"
25,string转为number
1,destring 原变量名,gen(新变量名) force
2,当有nonnumeric characters,一般使用encode
命令:encode 原变量名,generate(新变量名)
26,tab显示%
tabulate region agecat, row
27,outreg2出现文件无法读取现象
解决:添加文件路径信息——outreg2 [模型11 模型12 模型13 模型14 模型15 模型16] using /Users/XXX/Downloads/XXX文件,replace bdec(3) sdec(3)
28.工具变量回归 ivprobit模型要求报告第一阶段回归结果F值
ivprobit y x2 x3 (x1=IV), twostep first
即可显示