收藏 分享(赏)

STATA数据处理.pdf

上传人:精品资料 文档编号:8379287 上传时间:2019-06-23 格式:PDF 页数:12 大小:129.75KB
下载 相关 举报
STATA数据处理.pdf_第1页
第1页 / 共12页
STATA数据处理.pdf_第2页
第2页 / 共12页
STATA数据处理.pdf_第3页
第3页 / 共12页
STATA数据处理.pdf_第4页
第4页 / 共12页
STATA数据处理.pdf_第5页
第5页 / 共12页
点击查看更多>>
资源描述

1、STATA数据处理实证论文的数据结构查找命令与帮助数据下载数据导入和输出数据合并数据描述和画图数据整理命名与标注表达式生成新的变量gen and egen删除变量或者观测值生成排序后变量和滞后项时间序列基于类别变量生成虚拟变量因子变量基于连续变量生成类别变量重复值outliers数据转置与行列变换文字变量的处理判断文字是否匹配单值与暂元单值(scalar)暂元全局暂元循环语句forvalues 语句foreach 语句回归结果导出STATA数据处理实证论文的数据结构一个实证论文,前面一般会有三四个表格来描述样本选择过程、样本特征、单变量检验和相关性分析。然后是几个包含回归结果的表格,这是一篇实

2、证论文贡献最大的地方所在。结果部分一般包含主要回归结果,稳健性检验和排除其他解释的回归表格。查找命令与帮助help命令:在stata中查找某命令的帮助文件;search命令:searches the keywords ofthe help files;findit命令:类似search命令,但可以进一步搜索网络上的信息。数据下载数据下载成-tab-分割的csv格式最容易导入stata。大数据可以下载成dbf格式,然后用Stat/Transfer转成dta格式导入最方便。数据导入和输出在导入之前,可以在stata中先查看数据的情况:shellout是直接从stata中打开某个文件,type是在s

3、tata窗口中打印出数据。shellout d.csv如果是以-tab-分割的格式,可以用insheet导入。如果是dta格式,直接 use就可以。insheet using d.csv, clear如果是逗号分隔的数据,也可以用insheet导入,但需要说明分割符号:insheet using d.txt, delimiter(“,“) clear存成stata格式文件用save;导出成excel可用数据用outsheet:save filename, replaceoutsheet using d.csv, comma replace查看已导入的数据用list或者browse:list p

4、rice in 1/10数据合并如果是合并相同观测值的不同变量,用merge;merge 1:1 id using d2, replacemerge 1:m id using d2, replace如果是合并不同观测值的相同变量,用append;如果是想交叉合并,给joinby。append using d2, replacejoinby year industry using d2数据描述和画图查看数据集的变量属性,用describe;描述变量的分布用summarize,codebook和inspect:desc make pricesum price, detail更改变量排列顺序用ord

5、er:order price weight length foreign对观测值进行排序用sort或者gsort:sysuse nlsw88.dta, clear sort wage / 默认为升序排列 gsort -wage / 降序排列 gsort wage, gen(num) / 产生排序编号显示数字精度用format:format price %6.1f按照某分类变量列表统计用tabulate或者table:sysuse auto,clear tab foreign rep78 table foreign rep78, c(mean price) f(%9.2f) center row

6、 col得到论文格式的变量统计量用tabstat:tabstat price weight, s(mean sd med min max) c(s) f(%6.2f) by(foreign)将描述性表格或者相关性表格输出用logout:logout, save(mytable) excel replace: / tabstat price wei len mpg rep78, / stats(mean sd min p50 max) c(s) f(%6.2f)logout, save(mytable) word replace: / pwcorr_a price wei, star1(0.01

7、) star5(0.05) star10(0.1)画直方图用histogram, 画散点图用scatter,多变量的散点图用scatter matrix:sysuse nlsw88.dta, clear histogram wagesysuse auto, clear twoway scatter price weisysuse auto, clear graph matrix price wei len mpg数据整理命名与标注对变量进行改名用rename:rename w weight对数据集加标签和对变量加标签都是用label;对数据加说明用note:和notes:label data

8、“auto data“label variable price “auto price“note: Stanley, please double-check the data表达式关系运算符 =; ; =; 10000) gen byte bad = 0 / 事先指明变量类型是好习惯 replace bad = 1 if (rep783) replace bad = 1 if (rep783 ”, / “(2)括号中为标准误;”, / “(3)其它注释语句。”)特征: (T1) 附加表格标题; (T2) 调整变量的显示顺序和多寡 -drop()-, -sortvar()- (T3) t-value 小数点后显示两位;adj-R2 小数点后显示三位; (T4) 修改表格注释;

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报