‘壹’ stata回归分析命令reg是什么
1、首先,生成一个自变量和一个复因变量。如下图所示:
使用注意事项:
调用STATA系统数据文件和以STATA系统格式存盘的命令;infile和outfile也是一对调用外部文本数据文件和以文本文件格式存盘的命令。Infile变量名using文件outfilexusing e:.txt与infile。outfile区别是有无变量名(如xy)outsheet using e:.txt
如果是excel格式,则excel另存为csv格式文件。
drop _all清除以上所有数据。
产生新的变量:STATA命令:gen新变量名=表达式。
‘贰’ stata命令汇总是什么
stata命令汇总如下:
1、input: 输入数据
例:inpurt x y
2、by: 按照某一变量的取值来进行分析
例:by group,sort: regress Y x1 x2 //按照不同的组,对Y做回归分析
3、weight: 加权或者频数
例:fw=频数变量 //多用在四格表资料中或者原资料未给出所有值,只给出了值和对应的频数
4、if: 用条件语句指定条件
例:drop if group==1|group==2 //把group变量值为1或者2的记录删除掉
5、in:指定观察值的范围,对在范围内的观察值做分析处理
例:replace x1="123" in 100/200 //把第100-200条记录中的X1变量值改为123
6、for: 用来指定变量
例:for y1-y10 z1-z5: regress @x1-x22
//把y1-y10,z1-z5分别于x1-x22做回归,一次性代表15次回归,其中@是替换符,代表y1-y10, z1-z5
7、函数
abs(x) 绝对值
exp(x) 指数函数
log(x) 自然对数
log10(x) 常用对数
sqrt(x) 平方根
uniform(x) 生成(0,1)内均匀分布的伪随机数
length(x) 计算长度
substr(s,n1,n2) 获得从S的n1个字符开始的n2个字符组成的字符串
real(x) 将字符串s转换为数值函数
trim(x) 去除字符串前面和后面的空格
int(x) 去掉x的小数部分,得到整数
sum(X) 求和
max(x) min(x) 最大值最小值
_n 当前观察值的位置
_N 观察值的总个数
8、ren: 重命名
例:ren var1 var123 ,把var1重新命名为var123
9、des:描述数据库的基本情况
10、label: 为变量添加一些说明,以示说明
11、sort: 按照某一变量从小到大排序
gsort +/-:按照某一变量从大到小或者从小到大排序
sort var1 var2:按照var1大小排序,相同的var1按照var2大小排序
Stata常用功能:
1、统计功能
Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。
2、作图功能
Stata的作图模块,主要提供如下八种基本图形的制作 : 直方图(histogram),条形图(bar),百分条图 (oneway),百分圆图(pie),散点图(two way),散点图矩阵(matrix),星形图(star),分位数图。
这些图形的巧妙应用,可以满足绝大多数用户的统计作图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。
3、程序设计
Stata是一个统计分析软件,但它也具有很强的程序语言功能,这给用户提供了一个广阔的开发应用的天地,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。事实上,Stata的ado文件(高级统计部分)都是用Stata自己的语言编写的。
‘叁’ Stata常用的基础语法命令
-《用Stata学计量经济学》
use:打开一个已存的Stata数据(.dta)文件,可以是文件名也可以是详细地址;ex:use "xxxxx" or "D:\xx\xxx\xxx(.dta)" ;use [varlist] [if] [in] using filename [, clear nolabel]
_N与_n:_N表示观测值总数;_n表示当前的观测值序号
generate(gen):产生并命名一个新变量,且要求是未存在的; generate [type] newvar[:lblname] =exp [if] [in] [, before(varname) |
after(varname)]
replace:改变一个已有变量数据; replace oldvar =exp [if] [in] [, nopromote]
sort:排序,sort varlist [in] [, stable]
gsort:只产生升序排序;gsort [+|-] varname [[+|-] varname ...] [, generate(newvar) mfirst]
if exp:条件命令;ex:gen n = x if pop>500()新建一个n变量,当变量pop的值大于500时n时将x的值赋予n,若不满足条件则为缺失值 注:x与pop已经存在)这里的“pop>500”就是exp
lables:给变量添加标签
notes:给变量添加注释
*:通配符,*pop表示以“pop”结尾的所有变量名(已存在),如smallpop,largepop都属于
drop: 删除变量,drop varlist
keep:保留变量,keep varlist
rename:重命名,rename old_varname new_varname
renpfix:重命名多个变量,renpfix income inc,(把incom80与income81改为inc80和inc81),其中的incom和inc都只是变量的一部分前缀
save:保存数据,一般操作的修改都只是在内存上,save可将数据保存到硬盘,下次亦可使用
‘肆’ stata命令有哪些
1、format x1 %10.3f ——将x1的列宽固定为10,小数点后取三位;
2、format x1 %10.3g ——将x1的列宽固定为10,有效数字取三位;
3、format x1 %10.3e ——将x1的列宽固定为10,采用科学计数法;
4、format x1 %10.3fc ——将x1的列宽固定为10,小数点后取三位,加入千分位分隔符;
5、format x1 %10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符;
6、format x1 %-10.3gc ——将x1的列宽固定为10,有效数字取三位,加入千分位分隔符,加入“-”表示左对齐;
7、generate——生成新变量的命令,注意:变量名称只能用英文和数字,且若名称中同时有英文和数字,必须以英文开头。
8、drop——去除变量的命令,如果想把变量z给去掉,那么可以输入命令:drop z;
9、twoway (scatter y x)(lfit y x)——画出拟合线,注意:这个命令最开始的字母twoway也可以简写为tw。
10、scatter y x——画散点图,注意:在Stata的许多命令中,因变量一般都放在自变量前面。