分享
分享赚钱 收藏 举报 版权申诉 / 27

类型stata操作介绍之编程简介.pptx

  • 上传人:weiwoduzun
  • 文档编号:5300145
  • 上传时间:2019-02-19
  • 格式:PPTX
  • 页数:27
  • 大小:724.02KB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    stata操作介绍之编程简介.pptx
    资源描述:

    1、应用STATA做统计分析,王琦-2016200794-技术经济及管理,2016.11.12,五、STATA编程基础,这一章讨论Stata中一些常用的编程语句。主要讲解do文件与log文件,用户可以将任何顺序的Stata命令存入一个文本文件或do文件中,并通过Stata中的do命令或do文件编辑器来执行。通过使用Stata的do文件,用户可以避免重复键入相同的程序,使得一些重复性编程问题的处理变得更加方便。 本章的内容包括do文件和log文件的介绍、局部宏和全局宏、标量和矩阵、循环语句以及如何利用return list和ereturn list命令获得Stata命令的结果,这些内容都是Stata

    2、编程的基础。,5.1 do文件和Log文件,5.1.1 do文件的编写 所谓do文件是以. do为后缀的包含一系列Stata命令的文本文件。编写do文件的标准步骤如下: (1)确定当前工作目录。 查看当前工作目录只需输入cd,而要改变当前目录,可以在cd后加上要更改的目标目录地址。 (2)打开一个Do文件编辑器。 (3)输入Do文件的内容,并保存。 保存可以直接点击save按钮,或者打开菜单file,然后寻找并点击save。 另外,作为一个比较快捷的方式,用户也可以直接在命令框中输入: doedit,5.1 do文件 和Log文件,5.1.2 Log文件编写 Log文件可以通过log命令创建。

    3、例如,为了创建一个名为example.txt的log文件,用户可以在命令框中键入: . log using example .txt, text replace 其中replace选项允许新写入的log文件覆盖原有的同名文件。如果这里没有replace,且文件中已经存在同名log文件,Stata会拒绝该文件的创建。当程序执行完毕时,用户可以键入 . log close 来关闭当前的log文件。,5.2 局部宏与全局宏,宏 在STATA的编程语句中,宏是一个最基本、应用最广泛的要素。一个宏可能包含非常多的变量值。一个宏往往只是一个别名,既包含了它的名字也涵盖了其中的数值。当一个宏的名字无法被使用

    4、时,可以通过它的值来调用这个宏。局部宏 将在一个do文件或ado文件中创建,并在文件执行完毕后从内存中自动清除,无论程序的结束是自然完成还是突然终止的。全局宏 在STATA程序运行的整个过程中都一直存在。,5.2 局部宏与全局宏,5.2.1 局部宏 【例5-1】请定义一个计数宏count从1到4,定义一个包含四个国家简写(US UK DE FR)的局部宏country,然后通过使用foreach语句(循环语句foreach会在13.4节详细介绍)和display语句生成如下样式的结果: Country 1 : US Country 2 : UK Country 3 : DE Country 4

    5、 : FR 【例5-2】请定义一个计数宏count从1到4,定义一个包含四个国家简写(US UK DE FR)的局部宏country,然后通过使用foreach语句(循环语句foreach会在)和display语句生成如下样式的结果: 1 US 2 UK 3 DE 4 FR,举例,宏的名称,宏的内容,显示一个宏,定义一个局部宏为计数器,初始赋值为0,定义一个局部宏country,其赋值为4个字符串,表明对country这个局部宏中的每一个元素进行循环,表明对于每次循环,重新对局部宏count赋值,在原来的基础上加1,表明对每次循环,重新对newlist赋值,其赋值为一个 字符串,即newlis

    6、t原有字符串,加上count的数值再加上country所代表的内容,以字符串的形式显示 局部宏newlist的内容,从这两个例子中可以看出,STATA的宏在创建列表、计算数值、循环索引中都起到了非常重要的作用。宏最常用的还是在do文件与ado文件的编写。宏可以使用户避免重复键入同样的命令或重复输入运行结果。,5.2.2全局宏,全局宏的内涵与定义方式不同于局部宏。它往往被用来存储整个过程中所需要的用到的宏。例如,当我们需要存储一些当前的数据,且这些数据将会被所有的程序或默认路径下的数据集与do文件所使用时,我们就可以创建一个全局宏。 因为全局宏的使用可能会带来一些意想不到的问题,只有在少数下我们

    7、才会选择使用全局宏。比如我们在do文件A中创建了一个全局宏abc,之后我们却忘记了。若之后我们在do文件G或H的编写中,又使用了宏abc,此时会将其作为一个它全局宏进行计算,运行出来的结果将会是不合意的,而我们很难避免这样的问题。一些教FORTRAN或C语言的老师经常会鼓励同学们多使用局部宏,尽量避免使用全局宏,运用到Stata的编程中道理也是一样的。,5.3 一些扩展函数以及列表函数,在Stata的编程过程中,用户可以通过许多扩展函数以各种灵活的方式来使用宏,此时需要在宏的名称和扩展函数之间添加一个冒号(:),这样用户便可以更加简单的重获或修改宏的内容。 使用宏的扩展函数的语法是: loca

    8、l | global macname : extended_function 其中,macname是局部宏或者全局宏名,而extended_function就宏的扩展函数。,举例,【例5-3】请定义一个包含四个国家简写(US UK DE FR)的局部宏country,使用宏扩展函数word count定义局部宏wds表示最大的循环个数,使用宏扩展函数word i生成局部宏wd作为计数依据,然后通过使用foreach语句(循环语句foreach会在14.4节详细介绍)和display语句生成如下样式的结果: Country 1 : US Country 2 : UK Country 3 : DE

    9、 Country 4 : FR,利用扩展函数word count string得到country中单词个数,循环,使用扩展函数word # of string,对country中每个单词显示语句“Country i is wd, 其中的序数变量是i,其取值在1到wd之间,步长为1,5.4 标量简介,定义标量 scalar define scalar_name = exp 其中,scalar_name是要定义的标量名,标量的赋值通过一个数值或者文字表达式 exp 来表示。 显示标量的内容 scalar dir | list _all | scalar_names 其中,scalar dir和sc

    10、alar list都用于显示标量的内容,其后面可以使用_all表示内存中的所有变量,也可以指定某些标量名称(scalar_names)。 从内存中删掉某些标量 scalar drop _all | scalar_names ,举例,下面举一些简单的例子说明。 定义标量a,赋值为2:. scalar a = 2 定义标量b,赋值为a的赋值加上3:. scalar b = a+3 定义标量root2,其赋值为2的开方:. scalar root2 = sqrt(2) 定义标量s1,其赋值是字符串“hello world“: . scalar s1 = “hello world“,举例,显示定义好的

    11、所有标量:. scalar list 删掉标量a和b:. scalar drop a b 再比如如下两个命令,要求定义标量,并且将这个标量用于定义新的变量: .scalar root2 = sqrt(2.0) /生成一个标量,其赋值为2的开根号 .generate DOuble rootGDP = gdp*root2 /将这个标量用于定义新的变量,5.5 循环结构,5.5.1 forvalues语句 forvalues语句如下:forvalues lname = range commands referring to lname 其中,lname是指定的局部宏名称,而rang可以有如下形式:

    12、#1(#d)#2 表示从#1到#2步长为#d #1/#2 表示以步长为1从#1到#2,举例,【例5-4】数据集gdp4cty.dta是美国、英国、德国和法国GDP的季度数据,从1971年的第1季度到1995年的第4季度。 (1)这里的任务是利用forvalues语句生成四个变量lngdp1、lngdp2、lndgp3和lngdp4,它们分别是gdp1、gdp2、gdp3和gdp4的对数,然后显示新生成的四个变量的描述性统计量。 (2)生成变量gdp1_1995、gdp2_1995、gdp3_1995、gdp4_1995、gdp1_1997、gdp2_1997、gdp3_1997、gdp4_19

    13、97、gdp1_1999、gdp2_1999、gdp3_1999、gdp4_1999的描述性统计结果。,例5-4,序数i取值1到4,对每一个i产生一个双浮点变量lngdp i取值是log(gdp i),局部宏i被定义为程序中的一个循环系数,把i的取值范围定义为一个数值列表。,序数变量从1995到1999,步长是2,序数变量i从1到4,对每一个i和y的取值,得到gdp i _y的描述性统计,5.5.2 foreach语句,foreach语句的语法如下:foreach lname in|of listtype list commands referring to lname 可以使用的类型包括:

    14、对于每一个局部宏 foreach lname of local lmacname 对于每一个全局宏 foreach lname of global gmacname 对于变量列表中的每一个变量 foreach lname of varlist varlist 对于数字列表中的每一个数字 foreach lname of numlist numlist ,举例,【例5-5】这里使用数据集lifeexp来说明foreach命令语句的使用,这个数据集在第三章已经使用过了,该数据集是一个关于全球68国人口生存状况的数据,这些国家分别来自欧亚、北美和南美四大洲。 计算这些变量的描述性统计量以及它们与po

    15、pgrowth的相关性,并且绘制它们与popgrowth的散点图。,例5-5,对于从lexp到safewater的每一个变量进行操作,生产该变量的描述性统计量,计算popgrowth与该变量的相关系数,绘制popgrowth与该变量的散点图,5.6 使用Stata命令的结果,所有的Stata的命令都可以被归入一下三类:r类、e类、s类(属于这类的情况较少)。其中e类命令是指估计命令(estimation commands),这类命令将返回两个矩阵:e(b)被估计的系数矩阵,e(v)被估计系数的方差与协方差矩阵,同时也会返回一些其他信息(详情参见help ereturn)。其他绝大多数的Stat

    16、a官方命令属于r类命令,这类命令是将运行结果返回到调用程序当中(详情参见help return)。 14.6.1 r类命令 下面让我们从最简单的r类命令入手。理论上说,所有的Stata命令都会将其所有的输出项存放在一个返回列表中。输入命令: return list 就可以获得这些输出项。,举例,【例5-6】 打开数据集wage.dta,使用describe命令描述该数据集,然后返回describe命令中的输出项。 【例5-7】本例使用数据集abdata.dta,该数据集是一个面板数据,是140个国家 1976年到1984年的各种宏观指标。在这里的关键变量是id代表每个国家的标号,year代表年

    17、份,一个面板数据通常定义这两个变量以便进行各种面板回归和统计。其他的变量包括就业率emp(%)、平均工资wage(指标)、投资占GDP的百分比cap(%)。 要求用tsset命令查看该面板数据的结构,并使用return list返回相关的结果。,例5-6,describre 命令的结果,观测值个数,变量的数量,指示变量,一旦数据集被修改, 即被制定为1,利用summarize中的detail获得返回结果的全部信息,观测案例数目,均值,方差,标准差,偏度,峰度,加总,最小值,最大值,5.6.2 e类命令,通过ereturn list命令可以返回e类命令的计算结果。ereturn list命令的语

    18、法如下: ereturn list 这个命令在通过Stata执行了e类命令之后使用,大多数的e类命令返回的结果中包含四类: 标量比如e(N),总结估计的过程; 宏比如关于响应变量的信息(e(depvar))、使用的估计方法(e(model)); 矩阵系数和方差矩阵(e(b) e(v)); Stata函数比如e(sample),如果估计过程中使用了所有观测值则返回1,否则为0。,举例,【例5-7】本例使用数据集wage.dta,观测值有526个,主要变量有被调查者的工资(百元)、经验(年)、受教育水平(年)等,这里要求首先以工资(wage)为被解释变量,经验(experience)和受教育水平(

    19、education)做回归,然后使用ereturn list返回上述回归的结果。本例中我们将演示如何将回归结果中的各种元素导出,分以下五个部分介绍。 (1)首先我们做回归,以工资(wage)为被解释变量,经验(experience)和受教育水平(education),然后使用ereturn list命令返回结果。 (2)通过矩阵e(b)导出解释变量名。 (3)灵活运用e(sample)函数定义数据的子集。 (4)使用estat summarize输出用于回归的样本的概要统计。 (5)使用matrix list命令输出由回归命令产生的系数矩阵e(b),例 5-7,wage从低到高排列观测值,将第

    20、80个到第100个观测值的wage数值改为缺失值,回归命令,wage是被解释的变量,educ和exper是解释变量,505个观测值,t值均在0.001的显著水平上, 十分显著,系数,保持其他变量不变,受教育年龄每提高一年,工资提高640元,样本数,模型的自由度,残差的自由度,F统计量,R2,回归方程的均方误,受约束的最大似然函数的值,未受约束的最大似然函数的值,例5-7,使用扩展函数colnames matrixname,提取 矩阵e(b)的列名,将它分给宏局部regressors,显示regressors的内容,e(sample)是一个函数而不是标量、宏或者矩阵。使用if或者in定义数据的子集,所以用于 回归的观测值个数可能小于全部观测值个数,此时利用e(sample)找到用于回归的那些观测值,estat可以输出回归中的一系列指标,除了变量wage由于缺失值造成两个结果一致外,变量educ和exper的结果均不一致,说明前者输出的是用 于回归的505个观测值的描述性统计的结果,而后者是全部数据的描述性统计结果。,用matrix list命令输出由回归命令产生的系数矩阵e(b),estat命令可以输出方差协方差矩阵(VCE),VCE矩阵对角线上的元素是相应系数标准差的平方,敬请各位批评指正!谢谢!,

    展开阅读全文
    提示  道客多多所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:stata操作介绍之编程简介.pptx
    链接地址:https://www.docduoduo.com/p-5300145.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    道客多多用户QQ群:832276834  微博官方号:道客多多官方   知乎号:道客多多

    Copyright© 2025 道客多多 docduoduo.com 网站版权所有世界地图

    经营许可证编号:粤ICP备2021046453号    营业执照商标

    1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png



    收起
    展开