『壹』 怎樣用stata進行數據標准化
用stata算集中指數採用Stata系統自帶資料庫auto.dta。
一、集中趨勢的統計描述
以變數price為例進行說明。
均數:採用mean price計算得6165.257。
算術均數、幾何均數和調和均數可以採用means、ameans、gmeans、hmeans計算。
眾數:沒有對應的命令可以直接計算眾數,但是可以通過幾種策略進行變通計算。如通過egen x=mode(price); disp x; drop x,不過本例中price中沒有相同的數值,所以無法計算眾數;另外也可通過preserve; contract price, freq(x); sum x; list price if x==r(max); restore 來顯示。
中位數:centile price或tabstat price, s(med),當然tabstat還可以計算均數、樣本量、標准差,標准誤、方差、極差、四分位間距、變異系數、峰度系數、偏度系數等等很多指標。
不過採用Stata(summarize ,tabstat等命令)計算的峰度系數與Excel、SPSS和SAS計算的結果有所不同,原因是採用的公式不同,大家根據實際情況來選擇。
二、離散趨勢指標
極差(全距):tabstat price, s(r)
標准差:tabstat price, s(sd)
方差:tabstat price, s(v)
四分位間距:tabstat price, s(iqr)
變異系數:tabstat price, s(cv)
採用summarize , detail命令可以計算均數、標准差、峰度系數、偏度系數、多個百分位數。不加detial可以得到最大值、最小值。
『貳』 stata psm控制年份固定效應命令
操作方法如下:
xtreg表示對面板數據進行回歸,前綴xt可以說是面板數據命令的標志,與OLS的回歸命令reg相區別。
在這個例子中,被解釋變數為exit1,後面4個全是解釋變數,fe表示fixedeffect,處理的是個體固定效應,r表示robust,即採用聚類穩健標准誤,對於面板數據估計,r自動聚類到截面維度,若要更改聚類層面,可以手動將r換成cluster(hy),括弧內為想要聚類的層面,比如hy(行業)。
關於R-sq,也就是RSquare,這里也要強調一下,可以發現,回歸結果顯示了三個R-aq,到底應該用哪一個呢?之前講過,固定效應有三種估計方法,Stata默認的是組內估計(Withinestimate),因此這三個R-sq里應該用第一個:within=0.02。
不過也有一個「聰明」的辦法來識別,即通過命令將回歸結果直接導出到word,然後再看軟體給出的是哪一個R-sq(導出回歸結果的命令之前有提過,像outreg2以及esttab等都能很好實現)。
『叄』 stata裡面什麼命令可以對面板數據按時間求均值
首先對面板數據進行聲明:
前面是截面單元,後面是時間標識:
tsset company year
tsset instry year
產生新的變數:gennewvar=human*lnrd
產生滯後變數Genfiscal(2)=L2.fiscal
產生差分變數Genfiscal(D)=D.fiscal
一、描述性統計
xtdes :對Panel Data截面個數、時間跨度的整體描述
Xtsum:分組內、組間和樣本整體計算各個變數的基本統計量
xttab 採用列表的方式顯示某個變數的分布
二、主要命令和方法
Stata中用於估計面板模型的主要命令:xtreg
xtreg depvar [varlist] [if exp] , model_type [level(#) ]
Model type 模型
be Between-effects estimator
fe Fixed-effects estimator
re GLSRandom-effects estimator
pa GEEpopulation-averaged estimator
mle Maximum-likelihood Random-effectsestimator
主要估計方法:
xtreg: Fixed-, between- and random-effects, and population-averaged linear models
xtregar:Fixed- andrandom-effects linear models with an AR(1) disturbance
xtpcse :OLS orPrais-Winsten models with panel-corrected standard errors
xtrchh :Hildreth-Houckrandom coefficients models
xtivreg :Instrumentalvariables and two-stage least squares for panel-data models
xtabond:Arellano-Bond linear, dynamic panel data estimator
xttobit :Random-effectstobit models
xtlogit :Fixed-effects,random-effects, population-averaged logit models
xtprobit :Random-effects andpopulation-averaged probit models
xtfrontier :Stochastic frontiermodels for panel-data
xtrc gdp invest culture e sci health social admin,beta
三、xtreg命令的應用
聲明面板數據類型:
*1、面板聲明
use FDI.dtar, clear
xtset id year
1.固定效應模型估計:
xtreg xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe
2.隨機效應模型估計:
xtreg xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re
3. 最大似然估計Ml:
xtreg xtreg lngdp lnfdi lnie lnex lnim lnci lngp,mle
Hausman檢驗究竟選擇固定效應模型還是隨機效應模型:
第一步:估計固定效應模型,存儲結果
xtreg xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe
est store fe
第二步:估計隨機效應模型,存儲結果
xtreg xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re
est store re
第三步:進行hausman檢驗
hausman fe re
對於固定效應模型的異方差檢驗和序列相關檢驗:
xtserial xtreg lngdp lnfdi lnie lnex lnim lnci lngp
異方差檢驗:
xtreg xtreg lngdp lnfdi lnie lnex lnim lnci lngp,fe
xttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixedeffect model)
隨機效應模型的序列相關檢驗:
xtreg xtreg lngdp lnfdi lnie lnex lnim lnci lngp,re
xttest1
xttest1用於檢驗隨機效應(單尾和雙尾) 、一階序列相關以及兩者的聯合顯著
檢驗結果表明存在隨機效應和序列相關,而且對隨機效應和序列相關的聯合檢驗也非常顯著
可以使用廣義線性模型xtgls對異方差和序列相關進行修正:
xtgls xtreg lngdp lnfdi lnie lnex lnim lnci lngp, panels(hetero),修正異方差
xtgls xtreg lngdp lnfdi lnie lnex lnim lnci lngp, panels(correlated),修正依橫截面而變化的異方差
xtgls xtreg lngdp lnfdi lnie lnex lnim lnci lngp, panels(hetero) corr(ar1),修正異方差和一階序列相關ar(1)
『肆』 工具變數法的Stata命令和實例
原發布者:th6572
工具變數
法的Stata命令及實例本實例使用
數據集
「grilic.dta」。先看一下數據集的統計特徵:考察智商與受教育年限的
相關關系
:上表顯示.智商(在一定程度上可以視為能力的代理變數)與受教育年限具有強烈的
正相關關系
(
相關系數
為0.51)。作為一個
參考系
.先進行OLS回歸.並使用穩健
標准差
:其中expr,tenure,rns,smsa均為
控制變數
.而我們主要感興趣的是變數受教育年限(s)。回歸的結果顯示.教育投資的年回報率為10.26%.這個似乎太高了。可能的原因是.由於遺漏變數「能力」與受教育正相關.故「能力」對工資的貢獻也被納入教育的貢獻.因此高估了教育的回報率。引入智商iq作為能力的代理變數.再進行OLS回歸:雖然教育的
投資回報率
有所下降.但是依然很高。由於用iq作為能力的代理變數有
測量誤差
.故iq是
內生變數
.考慮使用變數(med(母親的受教育年限)、kww(在「knowledgeoftheWorldofWork」中的成績)、mrt(婚姻
虛擬變數
.已婚=1)age(年齡))作為iq的工具變數.進行2SLS回歸.並使用穩健的標准差:在此2SLS回歸中.
教育回報率
反而上升到13.73%.而iq對工資的貢獻居然為
負值
。使用工具變數的前提是工具變數的有效性。為此.進行
過度識別
檢驗.考察是否所有的工具變數均外生.即與擾動項不相關:結果強烈拒絕所有工具變數均外生的原假設。考慮僅使用變數(med,kww)作為iq的工具變數.再次進行2SLS回歸.同時顯示第一階段的回歸結果:上表顯示.教育的回