A. 工具變數法的Stata命令和實例
原發布者:th6572
工具變數
法的Stata命令及實例本實例使用
數據集
「grilic.dta」。先看一下數據集的統計特徵:考察智商與受教育年限的
相關關系
:上表顯示.智商(在一定程度上可以視為能力的代理變數)與受教育年限具有強烈的
正相關關系
(
相關系數
為0.51)。作為一個
參考系
.先進行OLS回歸.並使用穩健
標准差
:其中expr,tenure,rns,smsa均為
控制變數
.而我們主要感興趣的是變數受教育年限(s)。回歸的結果顯示.教育投資的年回報率為10.26%.這個似乎太高了。可能的原因是.由於遺漏變數「能力」與受教育正相關.故「能力」對工資的貢獻也被納入教育的貢獻.因此高估了教育的回報率。引入智商iq作為能力的代理變數.再進行OLS回歸:雖然教育的
投資回報率
有所下降.但是依然很高。由於用iq作為能力的代理變數有
測量誤差
.故iq是
內生變數
.考慮使用變數(med(母親的受教育年限)、kww(在「knowledgeoftheWorldofWork」中的成績)、mrt(婚姻
虛擬變數
.已婚=1)age(年齡))作為iq的工具變數.進行2SLS回歸.並使用穩健的標准差:在此2SLS回歸中.
教育回報率
反而上升到13.73%.而iq對工資的貢獻居然為
負值
。使用工具變數的前提是工具變數的有效性。為此.進行
過度識別
檢驗.考察是否所有的工具變數均外生.即與擾動項不相關:結果強烈拒絕所有工具變數均外生的原假設。考慮僅使用變數(med,kww)作為iq的工具變數.再次進行2SLS回歸.同時顯示第一階段的回歸結果:上表顯示.教育的回
B. 如何使用hasuman檢驗內生性問題
解釋變數內性檢驗 首先檢驗解釋變數內性(解釋變數內性Hausman 檢驗:使用工具變數前提存內解釋變數Hausman 檢驗原假設:所解釋變數均外變數拒絕則認存內解釋變數要用IV;反接受則認存內解釋變數應該使用OLS reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (面板數據使用工具變數Stata提供命令執行二SLS:xtivreg depvar [varlist一] (varlist_二=varlist_iv) (選擇項fere等表示固定效應、隨機效應等詳見help xtivreg) 存內解釋變數則應該選用工具變數工具變數數少於程內解釋變數數恰識別用二SLS二SLS實質內解釋變數兩部即由工具變數所造外變部及與擾項相關其部;解釋變數外部進行歸滿足OLS前定變數要求致估計量tptqtp 二、異差與自相關檢驗 球型擾項假定二SLS效擾項存異差或自相關 面板異差檢驗: xtgls enc invs exp imp esc mrl,igls panel(het) estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 一 lrtest hetero homo, df(`df') 面板自相關:xtserial enc invs exp imp esc mrl 則存種更效即GMM某種意義GMM於二SLSGLS於OLS識別情況GMM原普通工具變數;度識別傳統矩估計行通才必要使用GMM度識別檢驗(Overidentification Test或J Test):estat overid 三、工具變數效驗證 工具變數:工具變數要求與內解釋變數相關能與解釋變數擾項相關由於兩要求矛盾故實踐尋找合適工具變數困難需要相想像力與創作性用滯變數 需要做檢驗: 檢驗工具變數效性: (一) 檢驗工具變數與解釋變數相關性 工具變數z與內解釋變數完全相關則使用工具變數;與僅僅微弱相關種工具變數稱弱工具變數(weak instruments)象本容量檢驗弱工具變數經驗規則第階段歸F統計量於一0則必擔弱工具變數問題Stata命令:estat first(顯示第階段歸統計量) (二) 檢驗工具變數外性(接受原假設) 恰識別情況檢驗工具變數否與擾項相關度識別(工具變數數>內變數數)情況則進行度識別檢驗(Overidentification Test)檢驗原假設所工具變數都外拒絕該原假設則認至少某變數外即與擾項相關0H Sargan統計量Stata命令:estat overid 四、GMM程 Stata輸入命令進行面板數據GMM估計 . ssc install ivreg二 (安裝程序ivreg二 ) . ssc install ranktest (安裝另外運行ivreg二 需要用輔助程序ranktest) . use "traffic.dta"(打面板數據) . xtset panelvar timevar (設置面板變數及間變數) . ivreg二 y x一 (x二=z一 z二),gmm二s (進行面板GMM估計其二s指二-step GMM
C. ivprobit模型中的工具變數回歸結果怎麼看
1. codebook顯示不全腫么破?——label list
2. 小星星快速查看estimatestable,star(0.05,0.01,0.1)
3. RElogit:Rare Events Logistic Regression
4. 裝個新工具ssc instal AAA
5. 多說有益 label var XX"XX是XXX"
6. 虛擬變數快速構造 i.abc
7. 取對數 gen B=log(A)
8. outreg自帶顯著性為二星模式,如何設置三星模式?outreg, starlevels(10 5 1)
9. 導出到result 這個word文檔里: outreg2using result.doc,replace
10. A且B的給我刪掉:drop if A==1 & B==1
11. 輸出多個模型運行結果:reg y x1est store m1 reg yx2 est store m2 reg y x3 est store m3 outreg2 [m1 m2 m3]using table1,word
12. 多重共線性檢驗estat vif
13. 夾帶一個Excel的私貨,表格內綠色小三角如何清除?——「工具」—「錯誤檢查」—「忽略」
14. 觀測值所在區域某項指標平均值如何生成?——egen 某項指標攝取平均值=mean(某項指標), by(社區編碼)
15. 清屏——cls -- ClearResults window
16. 部分觀測值回歸 reg y x1 x2 if x3==1
17. 用outreg2輸出比值比oddsratio——outreg2 using myfile,eform word
18. 繼續夾帶Excel私貨,CONCATENATE函數為數值添加括弧=(「(「.A1.」)」)
19. 數字復制粘貼至Excel後括弧顯示為負號如何處理?選定——設置單元格格式···
或使用左上角「文本導入向導···」導入,最後一步設置文本格式
20. 內生性問題Hausman test
reg y x1 x2 x3...
estimates store ols
ivregress 2sls y x2 x3... (x1=Z1 Z2...)
estimates store iv
hausman iv ols, constant sigmamore
21.IV-probit
ivprobit y x2 x3 (x1=工具變數)
默認最大似然估計,可設置兩步估計
(含有內生變數的 probit 模型通常有兩種估計方法:最大似然估計和兩步法,由於前者估計更有效率 (陳強 2014),所以本文採取最大似然法,並使用 stata 中的 ivprobit 命令計算回歸結果。)——《多子一定多福嗎:子女數量與母親健康》
22.IV-oprobit
cmp (y=x1 x2 x3)(x1=z1 x2 x3) , ind($cmp_oprobit $cmp_cont) tech(dfp) nolr
23,outreg2保留小數點後三位
outreg2 [模型1] using table1,replace bdec(3) sdec(3)
【直接】outreg2 using file3.doc, replace bdec(3) sdec(3)
24,兩兩建立新變數
gen 順序=.
replace 順序=1 if A + B ==0
replace 順序=2 if A + B > 0
replace 順序=4 if A + B < 0
label var 順序"102大3小"
25,string轉為number
1,destring 原變數名,gen(新變數名) force
2,當有nonnumeric characters,一般使用encode
命令:encode 原變數名,generate(新變數名)
26,tab顯示%
tabulate region agecat, row
27,outreg2出現文件無法讀取現象
解決:添加文件路徑信息——outreg2 [模型11 模型12 模型13 模型14 模型15 模型16] using /Users/XXX/Downloads/XXX文件,replace bdec(3) sdec(3)
28.工具變數回歸 ivprobit模型要求報告第一階段回歸結果F值
ivprobit y x2 x3 (x1=IV), twostep first
即可顯示