① 怎樣用stata進行數據標准化
用stata算集中指數採用Stata系統自帶資料庫auto.dta。
一、集中趨勢的統計描述
以變數price為例進行說明。
均數:採用mean price計算得6165.257。
算術均數、幾何均數和調和均數可以採用means、ameans、gmeans、hmeans計算。
眾數:沒有對應的命令可以直接計算眾數,但是可以通過幾種策略進行變通計算。如通過egen x=mode(price); disp x; drop x,不過本例中price中沒有相同的數值,所以無法計算眾數;另外也可通過preserve; contract price, freq(x); sum x; list price if x==r(max); restore 來顯示。
中位數:centile price或tabstat price, s(med),當然tabstat還可以計算均數、樣本量、標准差,標准誤、方差、極差、四分位間距、變異系數、峰度系數、偏度系數等等很多指標。
不過採用Stata(summarize ,tabstat等命令)計算的峰度系數與Excel、SPSS和SAS計算的結果有所不同,原因是採用的公式不同,大家根據實際情況來選擇。
二、離散趨勢指標
極差(全距):tabstat price, s(r)
標准差:tabstat price, s(sd)
方差:tabstat price, s(v)
四分位間距:tabstat price, s(iqr)
變異系數:tabstat price, s(cv)
採用summarize , detail命令可以計算均數、標准差、峰度系數、偏度系數、多個百分位數。不加detial可以得到最大值、最小值。
② EXCEL中如何求平均數,眾數和中位數
求A列的:
平均數: AVERAGE(a:a)
中位數: MEDIAN(a:a)
眾數: MODE(a:a)