收藏 分享(赏)

stata简明教程.ppt

上传人:weiwoduzun 文档编号:3790132 上传时间:2018-11-19 格式:PPT 页数:39 大小:251.02KB
下载 相关 举报
stata简明教程.ppt_第1页
第1页 / 共39页
stata简明教程.ppt_第2页
第2页 / 共39页
stata简明教程.ppt_第3页
第3页 / 共39页
stata简明教程.ppt_第4页
第4页 / 共39页
stata简明教程.ppt_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、Stata上机实验,Stata 统计软件包是目前世界上最著名的统计软件之一,国外将Stata与SAS、SPSS 一起被并称为三大权威软件。它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,几乎可以完成全部复杂的统计分析工作。,Stata有什么优势?,1。Stata 的命令语句极为简洁明快,易学易记。 2。强大的帮助信息。本地帮助 Help 命令名 在线帮助Findit 命令名 3。始终处于计量经济学和统计学的最前沿。许多Stata 程序员会针对计量经济学发展编写一些最新的程序(ADO 文件), Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数

2、,同时可随时到Stata 网站寻找并下载最新的升级文件。下载后可以直接使用,也可以自行修改、添加功能。(例如当前流行的面板单位根和面板门限数据,均可以安装下载使用),学习有什么困难?,1。不同于以往的软件较多的运用菜单,Stata较多运用命令操作。(菜单很难记住和找到)。 2。目前国内相关教材较少。 3。有些计量方法需要编程(如极大似然估计),编程需要一定的计算机基础(不是我们学习的重点)。,版本说明,最新版本Stata 12 我们使用的 Stata10.0 stata 10包括四种版本:Small(小型版)、IC(标准版)、SE(特殊版)和MP(多处理器版)。其中属MP版本最为强大。MP版与

3、SE版的功能完全相同,但MP版的运算速度比SE版的要快很多。用户可以在命令栏输入 about 查看所安装的Stata所属的版本。,不同版本对样本容量、变量个数、矩阵阶数、宏的字符长度等有着不同的限制。以SE版为例,其最大变量个数为32767,最大字符长度为244字节,最大矩阵阶数为11000(即1100011000)。Stata默认值为:最大变量个数为5000,最大矩阵阶数为400,最大内存为10兆。如果用户需要更多的内存或者更多的变量,可以在命令栏输入如下命令进行扩展。 set maxvar 5000 set memory 50m ,Stata的窗口介绍,结果窗口:位于界面右上部,软件运行中

4、的所有信息,如所执行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本,如白色表示命令,红色表示错误信息。 命令窗口:位于结果窗口下方,相当于DOS 软件中的命令行,此处用于键入需要执行的命令,回车后即开始执行,相应的结果则会在结果窗口中显示出来。,命令回顾窗口:即review 窗口,位于界面左上方,所有执行过的命令会依次在该窗口中列出,选中某一行单击后命令即被自动拷贝到命令窗口中;如果需要重复执行,用鼠标双击相应的命令行即可。 变量名窗口:位于界面左下方,列出当前数据集中的所有变量名称。 其他窗口一般使用时会自动跳出。我们以auto数据源为例使用上述窗口。,Sta

5、ta的菜单介绍,最重要的菜单项: Data菜单 Graphic菜单 Statistics菜单 每执行一个菜单性会自动产生相应的命令。(我们以summarize和regress为例加以阐述)。 我们的讲述以命令方式为主。,安装指南,分为安装版和简易版 安装版: (部分vista机器不支持) 解压 setup.rar 运行 setup 安装时选择 Stata SE 安装到C盘或者D盘(最好D盘) 安装完毕,第一次运行会出现注册信息,此时需运行keygen文件,将注册数据贴入。,Stata的文件,最重要的有三类文件 1。文件名.dta 数据文件 2。文件名.do 命令文件 3。文件名.ado 程序文

6、件,Stata的目录结构及打开文件的操作,如果不加改变,安装时Stata会将系统程序安装到: C:Program filestata10 中。 将所用系统自带的一些系统数据、应用程序、帮助文件安装到 C:Program filestata10adobase 中 将所有升级程序安装到: C:Program filestata10adoupdate 中,Stata自带的示例数据表,为了方便大家学习,stata中有很多自带示例数据,绝大部分数据都是美国的一些真实统计数据,较新的数据和统计资料可以到stata网站中下载。,文件的打开,1。所有的系统示例数据可以利用sysuse命令打开。 2。用户自己的

7、统计数据需要用use命令打开。use命令默认打开 C:data 或者 D:data中的数据。 3。如果需要打开其他文件夹的数据,必须改变目录(例如,将自己的数据放入D:abc)cd “D:abc”或者直接 file-open,Stata命令的规定,1。Stata的命令一定要区分大小写,除了极个别的情况下,stata命令全部用小写。2。大部分命令可以缩写。 使用缩写可以使stata的命令书写大为简化: 例如: display-disummarize-sumdescribe-des 得到正确命令缩写的简单方法:看help。,几条最简单的命令,use 打开数据文件,一般加clear选型清空内存中现有

8、数据。 sysuse 打开系统数据文件。 describe 描述数据 edit 利用数据编辑器进行数据编辑 list 类似于edit,但只能显示不能修改数据。,display 显示计算结果。经常写为: di summarize 求某个变量的观察值个数、平均值、标准差、最小值和最大值。经常写为:sum scatter 生成两个变量的散点图。 set obs 定义样本个数(使用前一定要用drop或者clear命令清空当前样本) generate 建立新变量并赋值。经常写为gen,几个简单的例子 di use sysuse sum scatter gen,举例:画出Y=X2的曲线图drop _all

9、 (drop data from memory) set obs 100 (make 100 observations) gen x = _n (x = 1, 2, 3, , 100) gen y = x2 (y = 2, 4, 9, , 10000) scatter y x (make a graph),命令格式简介,stata命令格式 by varlist: command varlist =exp if exp in range weight , options 1。Command 命令动词,经常用缩写。 2。varlist 表示一个变量或者多个变量,多个变量之间用空格隔开。如 sum

10、price weight 3。 by varlist 分类信息 按照某一变量的不同特性分类,4。 =exp 赋值及运算 5。 if exp 挑选满足条件的数据 6。 in range 对数据进行范围筛选 7。 Weight 给数据赋一个权重 8。 , options 命令增加一些可选信息下面通过多个例子详解以上参数。,Stata数据处理,1。Stata的数据格式为 文件名.dta 2。对于系统自带数据文件,任何情况下可以用 sysuse 命令打开。 3。对于C:data(或者D:data)下的文件,可以使用use命令打开。 4。 放在其他目录的文件可以利用设置目录或者“打开” 菜单打开。,St

11、ata数据类型,数值型:用0、1、29 及+、(正负号)与小数点和( )来表示。 字符型:字符串变量由字母数字或一些特殊的符号组成(如地名、住址,职业等等)。 注意:数字不表示大小信息,如电话、身份证号等。 字符型数据必须要加 “”。 日期型:在Stata中,1960 年1 月1 日被认为是第0 天,因此1959 年12 月31 日为第-1天,表示形式为:jan/10/2001或者10jan2001。,Stata数据的录入,1。直接录入。 2。在Excel或者记事本文件编辑好后导入。,1。直接录入。 利用data editor 2。在Excel或者记事本文件编辑好后导入。 直接粘贴 impor

12、t导入(必须将excel文件存成csv格式) 除了csv格式,还可以导入txt格式和raw格式。 练习:利用import方法将wage1.csv导入。,添加标签,打开wage1数据文件。 1。为整个数据添加标签:例如,将数据命名为“工资表”。菜单:Data-Labels-Label dataset命令:label data “工资表“ 2。为变量增加标签,例如,给变量wage增加标签“年工资总额”菜单:Data-Labels-Label variables命令 label variable wage “年工资总额”,自己练习:为下列变量增加标签 educ:受教育年限。 exper:工龄。 te

13、nure:现有岗位任期。,为变量值增加标签 例如:为变量marrid添加数值标签marry:1=married; 0=Unmarried 菜单:Data-Labels-Label values-Define or modify label valuesData-Labels-Label values-Assign label values to variable命令: . label define marry 1 “married” 0 “unmarried“ . label values married marry,使用tabstat命令计算描述性统计量 1.使用stat()输出统计指标:观

14、测值的个数、均值、中位数、标准差、偏度和峰度。 Tabstat wage lwage, stat(count mean p50 sd skew kurt) Bwt,还可以增加col(stat)选项使结果更便于分析和对比。,2.还可以加入by选项和long选项,例如 Tabstat wage lwage, by(female) stat() col(stat) long,Stata作图,STATA 提供各种曲线类型,包括点(scatter)、线(line)、面(area),直方图(histogram)、 条形图(bar)、饼图(pie)、函数曲线(function)以及矩阵图(matrix)等。

15、 同时,对时间序列数据有以ts 开头的一系列特殊命令,如tsline。还有一类是对双变量的回归拟合图(lfit、qfit 、lowess)等。,作图时命令方式比较复杂,建议多用菜单方式。 一起来做下列图形: 1。mpg 与 weight的散点图 2。 mpg 与 weight的散点图 3。 price 与 weight 均值的条形图 4。国产车与进口车价格的饼图 5。Mpg的直方图,并检验是否服从正态分布。,组合图形: 画出price与weight的散点图,并画出其拟合线。 图形界面设计: 图形标题,X轴标志,Y轴标志,样式选择,图例,分组标志。,建立回归方程,打开系统文件auto,建立如下方

16、程:sysuse auto,clearregress price mpg weight foreign打开文件score,建立如下方程:use score,clearreg testscr str,结果分析,回归后预测值的获得,Predict 1。拟合值的获得: predict yhat, xb 或者 predict yhat 2。残差的获得 predict e , residuals 或者 predict e, res,3. 比较Y的拟合值和Y的真实值 list testscr yhat e 4. 显示残差的统计特征。 hist e,normal,作业: EXCEL文件中的例题4-2包含如下信息:某市城镇居民1979-1992当年新增储蓄Yi(亿元)和可支配收入Xi(亿元)的观测数据。 建立方程: Y=b0+b1X 1. 将数据导入到stata中,另存为consumption.dta。 2. 画出Y与X的散点图。 3. 建立回归方程并说明截距和斜率的含义。 4. 方程的拟合优度和回归标准误差是多少? 5. 计算残差的平方和。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 实用文档 > 简明教程

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报