stata操作介绍之编程简介.pptx

上传人：weiwoduzun

文档编号：5300145

上传时间：2019-02-19

格式：PPTX

页数：27

大小：724.02KB

下载提示：本站仅提供存储空间/不修改/不编辑

1.请仔细阅读文档，确保文档完整性，对于不预览、不比对内容而直接下载带来的问题本站不予受理。
2.下载的文档，不会出现我们的网址水印。
3、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

文档包含非法信息？点此举报后获取现金奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 文币 0人已下载

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: stata操作介绍之编程简介.pptx

资源描述：: 1、应用STATA做统计分析,王琦-2016200794-技术经济及管理,2016.11.12,五、STATA编程基础,这一章讨论Stata中一些常用的编程语句。主要讲解do文件与log文件，用户可以将任何顺序的Stata命令存入一个文本文件或do文件中，并通过Stata中的do命令或do文件编辑器来执行。通过使用Stata的do文件，用户可以避免重复键入相同的程序，使得一些重复性编程问题的处理变得更加方便。本章的内容包括do文件和log文件的介绍、局部宏和全局宏、标量和矩阵、循环语句以及如何利用return list和ereturn list命令获得Stata命令的结果，这些内容都是Stata
2、编程的基础。,5.1 do文件和Log文件,5.1.1 do文件的编写所谓do文件是以. do为后缀的包含一系列Stata命令的文本文件。编写do文件的标准步骤如下：（1）确定当前工作目录。查看当前工作目录只需输入cd，而要改变当前目录，可以在cd后加上要更改的目标目录地址。（2）打开一个Do文件编辑器。（3）输入Do文件的内容，并保存。保存可以直接点击save按钮，或者打开菜单file，然后寻找并点击save。另外，作为一个比较快捷的方式，用户也可以直接在命令框中输入： doedit,5.1 do文件和Log文件,5.1.2 Log文件编写 Log文件可以通过log命令创建。
3、例如，为了创建一个名为example.txt的log文件，用户可以在命令框中键入: . log using example .txt, text replace 其中replace选项允许新写入的log文件覆盖原有的同名文件。如果这里没有replace，且文件中已经存在同名log文件，Stata会拒绝该文件的创建。当程序执行完毕时，用户可以键入 . log close 来关闭当前的log文件。,5.2 局部宏与全局宏,宏在STATA的编程语句中，宏是一个最基本、应用最广泛的要素。一个宏可能包含非常多的变量值。一个宏往往只是一个别名，既包含了它的名字也涵盖了其中的数值。当一个宏的名字无法被使用
4、时，可以通过它的值来调用这个宏。局部宏将在一个do文件或ado文件中创建，并在文件执行完毕后从内存中自动清除，无论程序的结束是自然完成还是突然终止的。全局宏在STATA程序运行的整个过程中都一直存在。,5.2 局部宏与全局宏,5.2.1 局部宏【例5-1】请定义一个计数宏count从1到4，定义一个包含四个国家简写（US UK DE FR）的局部宏country，然后通过使用foreach语句（循环语句foreach会在13.4节详细介绍）和display语句生成如下样式的结果： Country 1 : US Country 2 : UK Country 3 : DE Country 4
5、 : FR 【例5-2】请定义一个计数宏count从1到4，定义一个包含四个国家简写（US UK DE FR）的局部宏country，然后通过使用foreach语句（循环语句foreach会在）和display语句生成如下样式的结果： 1 US 2 UK 3 DE 4 FR,举例,宏的名称,宏的内容,显示一个宏,定义一个局部宏为计数器，初始赋值为0,定义一个局部宏country，其赋值为4个字符串,表明对country这个局部宏中的每一个元素进行循环,表明对于每次循环，重新对局部宏count赋值，在原来的基础上加1,表明对每次循环，重新对newlist赋值，其赋值为一个字符串，即newlis
6、t原有字符串，加上count的数值再加上country所代表的内容,以字符串的形式显示局部宏newlist的内容,从这两个例子中可以看出，STATA的宏在创建列表、计算数值、循环索引中都起到了非常重要的作用。宏最常用的还是在do文件与ado文件的编写。宏可以使用户避免重复键入同样的命令或重复输入运行结果。,5.2.2全局宏,全局宏的内涵与定义方式不同于局部宏。它往往被用来存储整个过程中所需要的用到的宏。例如，当我们需要存储一些当前的数据，且这些数据将会被所有的程序或默认路径下的数据集与do文件所使用时，我们就可以创建一个全局宏。因为全局宏的使用可能会带来一些意想不到的问题，只有在少数下我们
7、才会选择使用全局宏。比如我们在do文件A中创建了一个全局宏abc，之后我们却忘记了。若之后我们在do文件G或H的编写中，又使用了宏abc，此时会将其作为一个它全局宏进行计算，运行出来的结果将会是不合意的，而我们很难避免这样的问题。一些教FORTRAN或C语言的老师经常会鼓励同学们多使用局部宏，尽量避免使用全局宏，运用到Stata的编程中道理也是一样的。,5.3 一些扩展函数以及列表函数,在Stata的编程过程中，用户可以通过许多扩展函数以各种灵活的方式来使用宏，此时需要在宏的名称和扩展函数之间添加一个冒号（：），这样用户便可以更加简单的重获或修改宏的内容。使用宏的扩展函数的语法是： loca
8、l | global macname : extended_function 其中，macname是局部宏或者全局宏名，而extended_function就宏的扩展函数。,举例,【例5-3】请定义一个包含四个国家简写（US UK DE FR）的局部宏country，使用宏扩展函数word count定义局部宏wds表示最大的循环个数，使用宏扩展函数word i生成局部宏wd作为计数依据，然后通过使用foreach语句（循环语句foreach会在14.4节详细介绍）和display语句生成如下样式的结果： Country 1 : US Country 2 : UK Country 3 : DE
9、 Country 4 : FR,利用扩展函数word count string得到country中单词个数,循环,使用扩展函数word # of string，对country中每个单词显示语句“Country i is wd，其中的序数变量是i，其取值在1到wd之间，步长为1,5.4 标量简介,定义标量 scalar define scalar_name = exp 其中，scalar_name是要定义的标量名，标量的赋值通过一个数值或者文字表达式 exp 来表示。显示标量的内容 scalar dir | list _all | scalar_names 其中，scalar dir和sc
10、alar list都用于显示标量的内容，其后面可以使用_all表示内存中的所有变量，也可以指定某些标量名称（scalar_names）。从内存中删掉某些标量 scalar drop _all | scalar_names ,举例,下面举一些简单的例子说明。定义标量a，赋值为2：. scalar a = 2 定义标量b，赋值为a的赋值加上3：. scalar b = a+3 定义标量root2，其赋值为2的开方：. scalar root2 = sqrt(2) 定义标量s1，其赋值是字符串“hello world“： . scalar s1 = “hello world“,举例,显示定义好的
11、所有标量：. scalar list 删掉标量a和b：. scalar drop a b 再比如如下两个命令，要求定义标量，并且将这个标量用于定义新的变量： .scalar root2 = sqrt(2.0) /生成一个标量，其赋值为2的开根号 .generate DOuble rootGDP = gdp*root2 /将这个标量用于定义新的变量,5.5 循环结构,5.5.1 forvalues语句 forvalues语句如下：forvalues lname = range commands referring to lname 其中，lname是指定的局部宏名称，而rang可以有如下形式：
12、#1(#d)#2 表示从#1到#2步长为#d #1/#2 表示以步长为1从#1到#2,举例,【例5-4】数据集gdp4cty.dta是美国、英国、德国和法国GDP的季度数据，从1971年的第1季度到1995年的第4季度。（1）这里的任务是利用forvalues语句生成四个变量lngdp1、lngdp2、lndgp3和lngdp4，它们分别是gdp1、gdp2、gdp3和gdp4的对数，然后显示新生成的四个变量的描述性统计量。（2）生成变量gdp1_1995、gdp2_1995、gdp3_1995、gdp4_1995、gdp1_1997、gdp2_1997、gdp3_1997、gdp4_19
13、97、gdp1_1999、gdp2_1999、gdp3_1999、gdp4_1999的描述性统计结果。,例5-4,序数i取值1到4,对每一个i产生一个双浮点变量lngdp i取值是log(gdp i),局部宏i被定义为程序中的一个循环系数，把i的取值范围定义为一个数值列表。,序数变量从1995到1999，步长是2,序数变量i从1到4,对每一个i和y的取值，得到gdp i _y的描述性统计,5.5.2 foreach语句,foreach语句的语法如下：foreach lname in|of listtype list commands referring to lname 可以使用的类型包括：
14、对于每一个局部宏 foreach lname of local lmacname 对于每一个全局宏 foreach lname of global gmacname 对于变量列表中的每一个变量 foreach lname of varlist varlist 对于数字列表中的每一个数字 foreach lname of numlist numlist ,举例,【例5-5】这里使用数据集lifeexp来说明foreach命令语句的使用，这个数据集在第三章已经使用过了，该数据集是一个关于全球68国人口生存状况的数据，这些国家分别来自欧亚、北美和南美四大洲。计算这些变量的描述性统计量以及它们与po
15、pgrowth的相关性，并且绘制它们与popgrowth的散点图。,例5-5,对于从lexp到safewater的每一个变量进行操作,生产该变量的描述性统计量,计算popgrowth与该变量的相关系数,绘制popgrowth与该变量的散点图,5.6 使用Stata命令的结果,所有的Stata的命令都可以被归入一下三类：r类、e类、s类（属于这类的情况较少）。其中e类命令是指估计命令（estimation commands），这类命令将返回两个矩阵：e(b)被估计的系数矩阵，e(v)被估计系数的方差与协方差矩阵，同时也会返回一些其他信息（详情参见help ereturn）。其他绝大多数的Stat
16、a官方命令属于r类命令，这类命令是将运行结果返回到调用程序当中（详情参见help return）。 14.6.1 r类命令下面让我们从最简单的r类命令入手。理论上说，所有的Stata命令都会将其所有的输出项存放在一个返回列表中。输入命令： return list 就可以获得这些输出项。,举例,【例5-6】打开数据集wage.dta，使用describe命令描述该数据集，然后返回describe命令中的输出项。【例5-7】本例使用数据集abdata.dta，该数据集是一个面板数据，是140个国家 1976年到1984年的各种宏观指标。在这里的关键变量是id代表每个国家的标号，year代表年
17、份，一个面板数据通常定义这两个变量以便进行各种面板回归和统计。其他的变量包括就业率emp（%）、平均工资wage（指标）、投资占GDP的百分比cap（%）。要求用tsset命令查看该面板数据的结构，并使用return list返回相关的结果。,例5-6,describre 命令的结果,观测值个数,变量的数量,指示变量，一旦数据集被修改，即被制定为1,利用summarize中的detail获得返回结果的全部信息,观测案例数目,均值,方差,标准差,偏度,峰度,加总,最小值,最大值,5.6.2 e类命令,通过ereturn list命令可以返回e类命令的计算结果。ereturn list命令的语
18、法如下： ereturn list 这个命令在通过Stata执行了e类命令之后使用，大多数的e类命令返回的结果中包含四类：标量比如e(N)，总结估计的过程；宏比如关于响应变量的信息（e(depvar)）、使用的估计方法（e(model)）；矩阵系数和方差矩阵（e(b) e(v)）； Stata函数比如e(sample)，如果估计过程中使用了所有观测值则返回1，否则为0。,举例,【例5-7】本例使用数据集wage.dta，观测值有526个，主要变量有被调查者的工资（百元）、经验（年）、受教育水平（年）等，这里要求首先以工资（wage）为被解释变量，经验（experience）和受教育水平（
19、education）做回归，然后使用ereturn list返回上述回归的结果。本例中我们将演示如何将回归结果中的各种元素导出，分以下五个部分介绍。（1）首先我们做回归，以工资（wage）为被解释变量，经验（experience）和受教育水平（education），然后使用ereturn list命令返回结果。（2）通过矩阵e(b)导出解释变量名。（3）灵活运用e(sample)函数定义数据的子集。（4）使用estat summarize输出用于回归的样本的概要统计。（5）使用matrix list命令输出由回归命令产生的系数矩阵e(b),例 5-7,wage从低到高排列观测值,将第
20、80个到第100个观测值的wage数值改为缺失值,回归命令，wage是被解释的变量，educ和exper是解释变量,505个观测值,t值均在0.001的显著水平上，十分显著,系数,保持其他变量不变，受教育年龄每提高一年，工资提高640元,样本数,模型的自由度,残差的自由度,F统计量,R2,回归方程的均方误,受约束的最大似然函数的值,未受约束的最大似然函数的值,例5-7,使用扩展函数colnames matrixname，提取矩阵e(b)的列名，将它分给宏局部regressors,显示regressors的内容,e(sample)是一个函数而不是标量、宏或者矩阵。使用if或者in定义数据的子集，所以用于回归的观测值个数可能小于全部观测值个数，此时利用e(sample)找到用于回归的那些观测值,estat可以输出回归中的一系列指标,除了变量wage由于缺失值造成两个结果一致外，变量educ和exper的结果均不一致，说明前者输出的是用于回归的505个观测值的描述性统计的结果，而后者是全部数据的描述性统计结果。,用matrix list命令输出由回归命令产生的系数矩阵e(b),estat命令可以输出方差协方差矩阵(VCE)，VCE矩阵对角线上的元素是相应系数标准差的平方,敬请各位批评指正！谢谢！,

展开阅读全文

道客多多所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：stata操作介绍之编程简介.pptx
链接地址：https://www.docduoduo.com/p-5300145.html