1. 解釋變數內生性如何處理
解釋變數內生性檢驗
首先檢驗解釋變數內生性(解釋變數內生性的Hausman 檢驗:使用工具變數法的前提是存在內生解釋變數。Hausman 檢驗的原假設為:所有解釋變數均為外生變數,如果拒絕,則認為存在內生解釋變數,要用IV;反之,如果接受,則認為不存在內生解釋變數,應該使用OLS。
reg ldi lofdi
estimates store ols
xtivreg ldi (lofdi=l.lofdi ldep lexr)
estimates store iv
hausman iv ols
(在面板數據中使用工具變數,Stata提供了如下命令來執行2SLS:xtivreg depvar [varlist1] (varlist_2=varlist_iv) (選擇項可以為fe,re等,表示固定效應、隨機效應等。詳見help xtivreg)
如果存在內生解釋變數,則應該選用工具變數,工具變數個數不少於方程中內生解釋變數的個數。「恰好識別」時用2SLS。2SLS的實質是把內生解釋變數分成兩部分,即由工具變數所造成的外生的變動部分,以及與擾動項相關的其他部分;然後,把被解釋變數對中的這個外生部分進行回歸,從而滿足OLS前定變數的要求而得到一致估計量。tptqtp
二、異方差與自相關檢驗
在球型擾動項的假定下,2SLS是最有效的。但如果擾動項存在異方差或自相關,
面板異方差檢驗:
xtgls enc invs exp imp esc mrl,igls panel(het)
estimates store hetero
xtgls enc invs exp imp esc mrl,igls
estimates store homo
local df = e(N_g) - 1
lrtest hetero homo, df(`df')
面板自相關:xtserial enc invs exp imp esc mrl
則存在一種更有效的方法,即GMM。從某種意義上,GMM之於2SLS正如GLS之於OLS。好識別的情況下,GMM還原為普通的工具變數法;過度識別時傳統的矩估計法行不通,只有這時才有必要使用GMM,過度識別檢驗(Overidentification Test或J Test):estat overid
三、工具變數效果驗證
工具變數:工具變數要求與內生解釋變數相關,但又不能與被解釋變數的擾動項相關。由於這兩個要求常常是矛盾的,故在實踐上尋找合適的工具變數常常很困難,需要相當的想像力與創作性。常用滯後變數。
需要做的檢驗:
檢驗工具變數的有效性:
(1) 檢驗工具變數與解釋變數的相關性
如果工具變數z與內生解釋變數完全不相關,則無法使用工具變數法;如果與僅僅微弱地相關,。這種工具變數被稱為「弱工具變數」(weak instruments)後果就象樣本容量過小。檢驗弱工具變數的一個經驗規則是,如果在第一階段回歸中,F統計量大於10,則可不必擔心弱工具變數問題。Stata命令:estat first(顯示第一個階段回歸中的統計量)
(2) 檢驗工具變數的外生性(接受原假設好)
在恰好識別的情況下,無法檢驗工具變數是否與擾動項相關。在過度識別(工具變數個數>內生變數個數)的情況下,則可進行過度識別檢驗(Overidentification Test),檢驗原假設所有工具變數都是外生的。如果拒絕該原假設,則認為至少某個變數不是外生的,即與擾動項相關。0H
Sargan統計量,Stata命令:estat overid
四、GMM過程
在Stata輸入以下命令,就可以進行對面板數據的GMM估計。
. ssc install ivreg2 (安裝程序ivreg2 )
. ssc install ranktest (安裝另外一個在運行ivreg2 時需要用到的輔助程序ranktest)
. use "traffic.dta"(打開面板數據)
. xtset panelvar timevar (設置面板變數及時間變數)
. ivreg2 y x1 (x2=z1 z2),gmm2s (進行面板GMM估計,其中2s指的是2-step GMM)
2. 內生性處理:工具變數法
內生性問題是解釋變數與擾動項相關導致的,具體的表現形式有遺漏變數、雙向因果和測量誤差。
OLS能夠成立的最重要前提條件是解釋變數與擾動項不相關。否則,OLS估計量將是有偏且不一致的。
無偏是指估計量的期望等於真實值。一致性是指,隨著樣本的增大,估計量無限接近於真實值。
固定效應模型在 一定程度上 可以緩解內生性。因為使用固定效應模型的原因是存在個體效應、時間效應與解釋變數相關。此時如果不用固定效應模型,這些個體、時間影響就會溜到擾動項中,就產生了內生性問題。
解決內生性問題常見的做法是使用工具變數。
工具變數:與模型中內生變數(解釋變數)高度相關,但卻不與誤差項相關,估計過程中被作為工具使用,以替代模型中與誤差項相關的解釋變數的變數。
「找好的工具變數好比尋找一個好的伴侶,ta應該強烈地愛著你(強相關),但不能愛著別人(外生性)。」
IV法可以視為2SLS的特例。 當內生變數個數=工具變數個數時,稱為IV法;當內生變數個數<工具變數個數時,稱為2SLS
2SLS思路如下:
y=α+βx1+γx2+u,其中x1是嚴格外生的,x2是內生的,則至少需要1個工具變數,z1為工具變數。
第一階段回歸:內生變數和工具變數
x2=a+bz1+cx1+e
第二階段回歸:內生變數的預測值和被解釋變數
y=α+βx1+γx2'+v
2SLS背後邏輯:
將內生解釋變數分為兩部分,有工具變數造成的外生部分和與擾動項相關的內生部分。
第一階段:通過外生變數的預測回歸,得到這些變數的外生部分。
第二階段:把被解釋變數對解釋變數中的外生部分進行回歸,消除偏誤得到一致估計。
注意:為了保證2SLS的一致性,必須把原方程中所有的外生解釋變數都放入第一階段回歸。
2SLS的難點在於恰當的工具變數選擇。若存在N個內生解釋變數,則至少需要N個工具變數。
假設回歸模型
stata命令如下:
以上命令ivregress 2sls 和 ivreg2是等價的,只是 ivreg2顯示的內容更為豐富。xtivreg2 相較於ivreg2,就是OLS和FE/FD模型的差別,ivreg2 ... i.Year i.id等價於xtivreg2 ... i.Year, fe。
針對工具變數有三大檢驗:
以上三大檢驗,優先做相關性檢驗。這是由於弱工具變數會對估計結果以及外生性檢驗結果產生影響。
(1)相關性檢驗
a.不可識別檢驗
不可識別檢驗的原假設是秩條件不成立,即工具變數與解釋變數不相關。不可識別檢驗在一定程度上可以驗證是否存在弱工具變數,但不能取代對弱工具變數的檢驗。關於弱工具變數的檢驗,可以分為單個內生變數和多個內生變數。
b.弱工具變數檢驗
如果方程中有一個內生變數,一個經驗規則是在第一階段回歸中,如果F統計量>10,則可拒絕「存在弱工具變數」的原假設,不必擔心弱工具變數的問題。
如果方程中有多個內生變數,Stock & Yogo給出了檢驗規則:如果弱識別檢驗的最小特徵值統計量>15% maximal IV size對應的臨界值,就可以認為工具變數不存在弱相關問題。
如果發現是弱工具變數,解決的方法有:
(2)內生性檢驗
首先假定內生性進行2SLS回歸,然後假定不存在內生性進行OLS回歸,最後使用豪斯曼檢驗。
當p值<0.1時,表明兩個回歸的系數存在顯著的系統性差異,及關注的核心變數有內生性。
(3)外生性檢驗
在恰好識別的情況下,即工具變數數=內生變數數,此時公認無法檢驗工具變數的外生性,即工具變數與擾動項不相關。在這種情況下,只能進行定性討論或依賴於專家的意見。在過度識別的情況下,可以進行「過度識別檢驗」。當p>0.1,接受原假設,說明工具變數具有外生性。
注意,如果誤差項存在異方差或自相關,那麼2SLS的估計雖然是一致估計量,但不是有效估計量。更有效的方法是「廣義矩估計」GMM。 某種意義上,GMM之於2SLS,正如GLS之於OLS,前者可以獲得有效估計量,後者只能獲得一致估計量。
該方法的前提條件是:工具變數數>內生變數數,且2SLS存在異方差或自相關
綜上,在使用stata進行2SLS時,推薦使用ivreg2或xtivreg2。
對於面板數據,建議先對模型進行變換,然後對變換後的模型使用2SLS:
參考資料:
《高級計量經濟學及stata應用》
面板數據分析與Stata應用
測量誤差及其對統計分析的影響
有人能講講工具變數和2SLS之間的關系嗎?
工具變數法(五): 為何第一階段回歸應包括所有外生解釋變數
xtivreg2和它的山寨者