① 怎样用stata进行数据标准化
用stata算集中指数采用Stata系统自带数据库auto.dta。
一、集中趋势的统计描述
以变量price为例进行说明。
均数:采用mean price计算得6165.257。
算术均数、几何均数和调和均数可以采用means、ameans、gmeans、hmeans计算。
众数:没有对应的命令可以直接计算众数,但是可以通过几种策略进行变通计算。如通过egen x=mode(price); disp x; drop x,不过本例中price中没有相同的数值,所以无法计算众数;另外也可通过preserve; contract price, freq(x); sum x; list price if x==r(max); restore 来显示。
中位数:centile price或tabstat price, s(med),当然tabstat还可以计算均数、样本量、标准差,标准误、方差、极差、四分位间距、变异系数、峰度系数、偏度系数等等很多指标。
不过采用Stata(summarize ,tabstat等命令)计算的峰度系数与Excel、SPSS和SAS计算的结果有所不同,原因是采用的公式不同,大家根据实际情况来选择。
二、离散趋势指标
极差(全距):tabstat price, s(r)
标准差:tabstat price, s(sd)
方差:tabstat price, s(v)
四分位间距:tabstat price, s(iqr)
变异系数:tabstat price, s(cv)
采用summarize , detail命令可以计算均数、标准差、峰度系数、偏度系数、多个百分位数。不加detial可以得到最大值、最小值。
② EXCEL中如何求平均数,众数和中位数
求A列的:
平均数: AVERAGE(a:a)
中位数: MEDIAN(a:a)
众数: MODE(a:a)