收藏 分享(赏)

STATA与面板数据回归.ppt

上传人:hwpkd79526 文档编号:8176429 上传时间:2019-06-12 格式:PPT 页数:67 大小:1.29MB
下载 相关 举报
STATA与面板数据回归.ppt_第1页
第1页 / 共67页
STATA与面板数据回归.ppt_第2页
第2页 / 共67页
STATA与面板数据回归.ppt_第3页
第3页 / 共67页
STATA与面板数据回归.ppt_第4页
第4页 / 共67页
STATA与面板数据回归.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

1、STATA在实证研究中的应用,刘永东 中国科学院农业政策研究中心,,Company Logo,Outline,Discrete Choice Model及STATA应用,4,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,软件名称 最新版本 安装文件大小 SAS 9.1.3 3G SPSS 15.0 1CD Stata 10.0 94M GAUSS 8.0 25M 计量经济学专用 Limdep/Nlogit 9.0/4.0 3M Shazam 10.0 90M Eviews 6.0 100M Winrat 6.0 21M TSP 5.0 R free 30M,中

2、国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(Computer Resource Center)研制。从1985到现在,已连续推出1.1,1.2,1.3,1.4,1.5,及2.0,2.1,3.0,3.1,4.0,5.0,6.0,7.0.,8.0, 9.0.,10.0等多个版本。 Stata里不要修改原始数据,不可恢复,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,Stata主要功能 数据管理功能 统计分析功能 统计分析:描述统计、交叉

3、表格 回归分析:OLS, 2SLS, Logit, Probit, Tobit, Heckman, GMM, Panel data, Time series, Survey data 多变量分析:multivariate regression, cluster analysis, 抽样和模拟: 绘图功能 编程和矩阵运算功能,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,Stata软件的特点 Stata功能强大 Stata软件小巧 Stata操作灵活、简单,易学易用 Stata编程语言简单,容易上手 Stata功能更新快,中国科学院农业政策研究中心,,Compa

4、ny Logo,STATA数据分析基础,三类文件 数据文件:*.dta 程序文件:*.do 结果文件:*.log 四个窗口和1个程序编辑器,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,STATA的界面,中国科学院农业政策研究中心,Result Window,Command Window,Review Window,Variable Window,Buttons,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,中国科学院农业政策研究中心,STATA的界面Buttons: open, save, print, open log f

5、ile, open viewer, bring results window to front, bring graph window to front, open do-file, edit window, browse window, continue, break,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,Stata的运行方式 菜单操作: 执行菜单操作后,在结果窗口能够显示命令行和命令的结果 命令行操作: 在命令窗口中直接写入命令,一次只能写一行命令 程序操作: 利用do edit编辑do文件,执行批量的命令,中国科学院农业政策研究中心,,Compa

6、ny Logo,STATA数据分析基础,如何导入数据 直接输入(通过edit窗口) 粘贴数据(通过edit窗口)容易出错 用命令从外部文件导入(insheet命令) insheet命令: Insheet using filename, options 通过option指定外部文件类型 Excel的sls文件不能直接读取 如何导出数据 粘贴 使用outsheet命令,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,如何保存数据 Save命令 如何调用数据 Use命令 Use filename,options 查看内存中的数据 Browse命令 List命令 ord

7、er命令,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,练习数据导入,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,do-file 什么是do-file? 通俗来说,do-file就是STATA命令和程序的记事本。 使用do-file的理由? 可追溯过往操作 可以整合庞杂的命令,减少命令输入 便于发现错误 怎么打开do-file? Button Do-file中做注释 程序前打*号,换行/,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,do-file 如何写do-file? 规范的do-fil

8、e应该包括哪些内容 第一步:清理内存,clear 第二步:设定内存,set memory 第三步:指定路径 cd: f/research/stata/. Use打开文件 (比 Global libname方便) Global libname “文件夹路径”,用$libname代替该路径 第四部:打开log: Cap log close Log using filename Log的暂停和开启,log on/log off 查看log: view d:statadataauto.log,中国科学院农业政策研究中心,,Company Logo,clear set memory 50m cd “F:

9、stata seminarpractise data“cap log close log using zheda.log log onuse 2006.data use ruralincome.dta,clear sum ruralincomeview zheda.log,,Company Logo,STATA数据分析基础,数据的初步处理 If语句,in语句和by语句 生成新变量 generate和egen(egen后面可以跟函数,比generate功能强大) 改名字 Rename 替换 Replace STATA中的逻辑运算符 And / or: & / | 等于“=”,不等于“!=”(负值

10、=),中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,数据的初步处理 删除/保留 变量或者观测 Drop/keep 排序 Sort与gsort的区别(gsort可以设置排序,多个变量排序) gsort variable, option(降序在变量前加-)gsort -year code, generate(order) 合并数据 Merge(两个或多个文件必须有一个唯一对应的默认值建立链接关系)save 2004_2006.dtasort year code save,replace

11、 file 2004_2006.dta saved use ruralincome.dta,clear sort year code merge year code using 2004_2006.dta 需要检查variables窗口 是不是有1,2 的情况存在,如果存在需要重新检查续接数据 Append use 2004_2005.dta,clearappend using 2006.dta,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,数据的初步处理 贴标签 Label Label data Label var des(显示命令) label var c

12、ode “省代码“ label data “农村收入“ des 面板数据与截面数据转换 Reshape long reshape wide ruralincome,i(code) j(year) 面板到截面 Reshape wide reshape long ruralincome,i(code) j(year)截面到面板 “压缩”数据(如取平均值) Collapse collapse (mean)ruralincome,by(code),中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,数据的初步处理 STATA中常用的operator 生成dummy Xi:

13、i.year _n与_N的区别(_N默认最大值) 面板数据tsset code year 告诉stata是面板数据,然后使用下面功能 滞后算子l. 差分算子d. 截面数据 滞后与滞前 _n+1 _n-1bysort code:gen try1=ruralincome_n-1 bysort是通过code相同的变量才进行命令,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,练习数据处理,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,STATA的描述统计功能 Summarize最常用的描述统计命令 均值、方差、百分位数、最大值、最小值

14、 use final.dta,clear sumTable功能强大的表格统计命令(常用) 多变量表、多变量表 Tabulate简写为tab,是table的简化版 Count数数命令 Correlate相关系数 Pwcorrcorrelate姊妹版 Corr可以报告协方差,pwcorr可以报告p值(p值表示两变量在多大的显著程度上是相关的) Corr删除所有缺失值,pwcorr仅删除pairwise中的缺失值,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,STATA的描述统计功能画图 直方图 Histogram,options (kden,normal) 分布检

15、验的图形 QQ图qnorm,pnorm 对称分布symplot 均匀分布quantile 数学变换后的分布检验qladder,中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,STATA的描述统计功能画图 Graph命令 Graph bar/box/dot/pie Graph twoway(双变量图) Graph twoway line/scatter/connected(连线图) Graph matrix(多个变量矩阵图),中国科学院农业政策研究中心,,Company Logo,STATA数据分析基础,练习数据的描述性统计,中国科学院农业政策研究中心,,Comp

16、any Logo,简单回归分析与STATA应用,OLS的五个经典假设 1 线形模型假设Y=X+u 2 样本随机 3 E (u | x)=0 4 不存在完全共线性 5 同方差假设 其中前四个假设保证OLS估计量无偏,加上第五个假设,使得OLS成为BLUE(Best Linear Unbiased Estimator) 如果假设不再满足,则需要新的估计方法。,中国科学院农业政策研究中心,,Company Logo,简单回归分析与STATA应用,STATA的应用 估计命令 Reg dependent independent, options 预测值 Predict newvariable, opti

17、on (xb, residuals ) 保存回归结果 est store/drop/restore use final.dta gen en= food/expenditure reg ruralincome en predict residhat,residuals est store ols,中国科学院农业政策研究中心,,Company Logo,简单回归分析与STATA应用,STATA的应用 输出回归结果 outreg using 文件名, coefastr p 3aster replace outreg using outcome.doc,3aster replace outreg u

18、sing 文件名, coefastr se 3aster appendoutreg using outcome.doc,3aster append option coefastr:给系数加星号 P: 系数下面标P值 Se: 系数下面标标准误差 3aster: 加3个星号,1,5,10,中国科学院农业政策研究中心,,Company Logo,简单回归分析与STATA应用,各种统计检验在STATA中的实现 总体均值的检验 ttest 总体方差的检验 sdtest 相关性检验 Pwcorr 正态分布检验 sktest/swilk,中国科学院农业政策研究中心,,Company Logo,简单回归分析与

19、STATA应用,OLS中涉及的检验 回归系数的检验 线性检验Test 非线性检验testnl 异方差 estat hettest 多重共线性 多重共线性的表现:拟合优度很大,但是系数显著程度很低 检验:系数之间的相关系数,膨胀系数检验(vif) 解决:增加样本容量,删除共线变量,重新设定模型,中国科学院农业政策研究中心,,Company Logo,简单回归分析与STATA应用,练习OLS的STATA操作,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,什么是内生性 公式上来说,内生性会导致OLS的经典假设E (u | x)=0不再成立,从而导致估计量不再一致

20、。 逻辑上来讲,内生性是因为解释变量与残差相关,而这意味着被解释变量也会影响解释变量,从而无法确定实证研究中常常关心的因果关系。 内生性产生的原因: 测量误差 而e和u有关系 遗漏重要变量 反向因果关系,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,什么是工具变量法 工具变量法就是寻找一个外生的冲击,来识别内生变量对于被解释变量的影响,X,Y,u,IV,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,IV选取的几个标准 IVY(iv与y无关) IV与X相关 IV选取的几个例子 教育与工资 wage=f(educ,othe

21、rs) 然而工资和教育可能都会受个人能力的影响,比如智商,内生性问题出现了。 第一个IV,母亲的教育程度 第二个IV,出生的季度 Which is better?,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,IV选取的几个例子 教育与工资 第一个IV,与educ关系密切,however,可能不是一个外生的iv 第二个IV,是个外生的IV,however,可能与educ的关系不大,尤其是高学历的人。 入学法要求7岁才可上学,同时要求年满16岁才可以退学,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,IV选取的几个例子

22、服兵役对收入的影响 Income=f(serving,others) Serving和income可能与个人能力有关,内生性! draft lottery,对1月1日-12月31日,每天随机赋1-365的整数。只有小于90才有资格当兵。 IV,draft lottery是否小于90,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,两阶段最小二乘法(2SLS) 第一阶段,用其他解释变量和工具变量回归内生变量 第二阶段,用第一阶段得到的拟合值,运行最初的方程 常用的检验 关于IV的检验 Overid test(检验iv是否外生,原假设iv是外生的,工具变量数必须

23、大于内生变量数) 显著性检验(lv是否与x有直接关系) 关于内生性是否存在的检验 Hausman test Hausman test 检验结果2sls ols 如果一致则无内生性,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,两阶段最小二乘法(2SLS) 关于内生性是否存在的检验(ols和2sls的结果不一致就说明存在内生性,把永远是一致的结果放在第一位2sls ,可能不不一致的放在第二位ols) Hausman test,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,Seeming Uncorrelated Regr

24、ession(SUR),中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,方程组,x and y endogenous var(内生变量), z predetermined var(外生变量)(前定变量个数=内生变量个数-1) 前定变量个数内生变量个数-1 则过度识别 识别问题 估计问题 Reduce form(用前定变量表示内生变量) Structure form 2SLS Run endogenous var on predetermined var Using fitted value, run structure form,中国科学院农业政策研究中心,

25、,Company Logo,内生性及STATA处理方法,Recursive Model,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,Generalized Least Square,中国科学院农业政策研究中心,Ols是GLS的一个特例,,Company Logo,内生性及STATA处理方法,3SLS Step one: treat endogeneity(y 和z1,z2, IV1, IV2回归;X和z1,z2, IV1, IV2回归) Step two: estimate Step three: identify system equations,中国

26、科学院农业政策研究中心,,Company Logo,文章讲评,Challenging, complementing or assuming the Mandate of Heaven? Political distrust and the rise of self-governing social organizations in rural China,中国科学院农业政策研究中心,,Company Logo,文章讲评,H1: Other things being equal, villagers political distrust in local governments increase

27、s their participation rate in self-governing social organizations. H2: Other things being equal, higher level of public goods investment and election quality (a) directly reduces villagers participation rate and (b) indirectly reduces villagers participation rate via the channel of increased politic

28、al trust in local governments.,中国科学院农业政策研究中心,,Company Logo,文章讲评,H3: Other things being equal, (a) tension between sub-village lineage groups reduces villagers participation rate and (b) the number of ancestral halls/temples is positively correlated with villagers participation rate in self-governing

29、 social organizations.,中国科学院农业政策研究中心,,Company Logo,文章讲评,中国科学院农业政策研究中心,,Company Logo,文章讲评,中国科学院农业政策研究中心,,Company Logo,文章讲评,中国科学院农业政策研究中心,,Company Logo,文章讲评,农民组织对村庄公共融资的影响:掣肘还是助推?农村税费体制改革前后农民负担变化的启示,中国科学院农业政策研究中心,,Company Logo,文章讲评,中国科学院农业政策研究中心,,Company Logo,文章讲评,中国科学院农业政策研究中心,,Company Logo,中国科学院农业政策

30、研究中心,,Company Logo,中国科学院农业政策研究中心,,Company Logo,中国科学院农业政策研究中心,,Company Logo,中国科学院农业政策研究中心,,Company Logo,内生性及STATA处理方法,练习2SLS和3SLS的STATA操作,中国科学院农业政策研究中心,,Company Logo,Limited Dependent Var Model,Unlimited Dependent,Limited Dependent,Noncategorical,Categorical,Ordered,Unordered 无好坏优劣之分,Count data(数数的数据

31、分析,无类别之分,保证数据是离散的,且不小于0,Order probit,Probit and logit,中国科学院农业政策研究中心,,Company Logo,Discrete Choice Model,Choice set 的三个条件 Mutually exclusive(相互排斥) Discrete(离散的) Exhaustive(可穷尽的) 注意选择集必须符合条件,中国科学院农业政策研究中心,,Company Logo,Discrete Choice Model,中国科学院农业政策研究中心,,Company Logo,Discrete Choice Model,中国科学院农业政策研究

32、中心,,Company Logo,Discrete Choice Model,估计most likelihood estimate 如何解释logit和probit模型的估计结果 以logit为例 系数意义不大 Marginal effect更有意义(系数的显著性),而marginal effect依赖于x(与x和有关)mfx(可指定系数),中国科学院农业政策研究中心,,Company Logo,Discrete Choice Model,Multinomial logit model,Independence of Irrelevance Alterntives (IIA),Odds rat

33、io,中国科学院农业政策研究中心,,Company Logo,Discrete Choice Model,一个例子 bus; car, then odds ration=1 bus; car, but red bus and blue bus, then IIA FAILS!(就不能用简单的logit模型) 更加复杂的模型 Nest logit Ordered logit Logit/probit Ivprobit Mlogit ,base(),中国科学院农业政策研究中心,,Company Logo,Panel Data,Simple regression with variable interceptsFixed effect model Random effect model Fixed or Random? Xtreg,fe(cv) Hausman test (fixed effect model检验结果放在第一位,random effect model检验结果放在第二位),中国科学院农业政策研究中心,Thank You !,欢迎指正! ,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报