收藏 分享(赏)

第十章 定性选择模型与受限因变量模型.ppt

上传人:oil007 文档编号:2434682 上传时间:2018-09-16 格式:PPT 页数:127 大小:1.83MB
下载 相关 举报
第十章 定性选择模型与受限因变量模型.ppt_第1页
第1页 / 共127页
第十章 定性选择模型与受限因变量模型.ppt_第2页
第2页 / 共127页
第十章 定性选择模型与受限因变量模型.ppt_第3页
第3页 / 共127页
第十章 定性选择模型与受限因变量模型.ppt_第4页
第4页 / 共127页
第十章 定性选择模型与受限因变量模型.ppt_第5页
第5页 / 共127页
点击查看更多>>
资源描述

1、第十章 定性选择模型和 受限因变量模型,在经典计量经济学模型中,被解释变量通常被假定为连续变量。 离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables)和离散选择模型(DCM, Discrete Choice Model)。,离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。 1962年,Warner首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。 70、80年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。 模型的估计方法主要发展于8

2、0年代初期。,离散模型样本数据一般是横截面数据。两类模型被广泛应用于消费者行为、劳动经济学、农业经济学等领域,大多属于微观计量经济学的研究范畴。,10.1 二元选择模型 Models with Discrete Dependent VariablesBinary Choice Model,如果只有两个选择,我们可用0和1分别表示它们,如乘公交为0,自驾车为1,这样的模型称为二元选择模型(binary choice Models),多于两个选择(如上班方式加上一种骑自行车)的定性选择模型称为多项选择模型(Multinomial choice models)。,实际经济生活中的二元选择问题,研究选

3、择结果与影响因素之间的关系。 影响因素包括两部分:决策者的属性和备选方案的属性。 对于单个方案的取舍。例如,购买者对某种商品的购买决策问题 ,求职者对某种职业的选择问题,投票人对某候选人的投票决策,银行对某客户的贷款决策。由决策者的属性决定。 对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由决策者的属性和备选方案的属性共同决定。,常用的二元选择模型: 1.线性概率模型(LPM) 2.logit模型 3.probit模型由于LPM相对简单且能用OLS估计,我们先考虑LPM。,一、线性概率模型的概念下面用一个关于是否读研究生的例子来说明如何解释线性概率模型的结果。模型为:,其中:,

4、第一节 线性概率模型,设回归结果如下(所有系数值均在10%水平统计上显著):,对每个观测值,我们可计算响应变量的拟合值或预测值。在常规OLS回归中,响应变量的拟合值或预测值的含义是,平均而言,我们可以预期的响应变量的值。但在本例的情况下,这种解释就不适用了。假设学生甲的平均分为3.5,家庭年收入为5万美元,Y的拟合值为,尽管响应变量在这个二元选择模型中只能取两个值:0或1,可是该学生的的拟合值或预测值为0.8。我们将该拟合值解释为该生决定读研的概率的估计值。因此,该生决定读研的可能性或概率的估计值为0.8。需要注意的是,这种概率不是我们能观测到的数字,能观测的是读研还是不读研的决定。,斜率系数

5、:在线性概率模型中,斜率系数表示其他解释变量不变的情况下,该解释变量的单位变动引起的响应变量等于1的概率的变动。,CPA的系数估计值0.4意味着家庭收入不变的情况下,一个学生的增加一个点(如从3.0到4.0),该生决定去读研的概率的估计值增加0.4。INCOME的系数估计值0.002表明,一个学生的成绩不变,而家庭收入增加1000美元(单位为千美元),该生决定去读研的概率的估计值增加0.002。LPM模型中,解释变量的变动与虚拟响应变量值为1的概率线性相关,因而称为线性概率模型。,二、线性概率模型的估计和问题,1. 扰动项的非正态性和异方差,为了简化说明,我们在此考虑仅有一个解释变量的情况。响

6、应变量是一个二值变量,它表示一个事件的发生或不发生,因而仅取两个值,如前面例子中读研取1,不读研取0。设p为Y=1的概率。则有:(10.5)其中,当模型存在异方差,应用OLS,则估计量不再是有效的。,回到有关读研的例子。假设学生乙的为4.0,家庭收入为20万美元,则代入(10.3)式,Y的拟合值为从而得到一个不可能的结果(概率值大于1)。假设另有一个学生丙的为1.0,家庭收入为5万元,则其Y的拟合值为 -0.2,表明读研的概率为负数,这也是一个不可能的结果。,2.拟合值可能小于0或大于1,而概率值必须位于0和1的闭区间内。,解决此问题的一种方法是,令所有负拟合值都等于0,所有大于1的拟合值都等

7、于1。但也无法令人十分满意,因为在现实中很少会有决策前某人读研的概率就等于1的情况,同样,尽管某些人成绩不是很好,但他去读研的机会仍会大于0。线性概率模型倾向于给出过多的极端结果:估计的概率等于0或1。,在线性概率模型中, 以及 不再是合适的拟合优度测度。,3.拟合优度的测度,4.模型正确预测的观测值的百分比。首先,我们将每一预测归类为1或0。如果拟合值大于等于0.5,则认为响应变量的预测值为1。若小于0.5,则认为响应变量的预测值为0。然后,将这些预测值与实际发生的情况相比较,计算出正确预测的百分比:,线性概率模型的解释变量与Y=1的概率之间存在线性关系,但实际中此假设总不成立。比如成绩对是

8、否考研的影响,如果学生的成绩从1增加到1.2时,他考研的意愿可能不会增加;如果学生的成绩从3.8增加到3.9时,对他的考研概率也不会有什么影响。因此,在分布的两端,成绩的小小增加实质上不会影响是否考研的概率。,因此,我们所需要的二元模型应是:(1)随着Xi的增加,Pi=E(Y=1|X)也增加,但永不会超出0到1这个区间;(2)Pi和Xi之间关系是非线性的,即随着X的逐渐变小,概率趋向于零的速度越来越慢,而随着Xi的逐渐变大,概率趋向于1的速度也越来越慢,应是S型曲线。,图中的S曲线很像随机变量的累积分布函数(CDF),现实中通常选择用以代表0和1的响应模型的CDF是logistic和norma

9、l,前者给出的是logit模型,而后者给出的probit或normit模型。,设模型为:,这里 不可观测,通常称为潜变量(latent variable)。 与Y之间的关系如下:,(10.1),第二节 Probit模型和Logit模型,一、Probit模型和Logit模型表示,其中F是u的累积分布函数。 由于不管是正态分布还是logistic分布,u的分布是对称的, ,则我们可以将上式写成,模型的概率密度函数为:,则累积密度函数(似然函数)为:,上式中F的函数形式取决于有关扰动项u的假设,如果 的累积分布是logistic分布,则我们得到的是logit模型;如果 的累积分布是normal分布,

10、则我们得到的是probit模型。,Probit模型,Probit模型假设u服从正态分布,则Y=1的概率p表达为:,累积分布函数为:,因此,logit模型,则,上式的左端是机会(odds)的对数,称为对数机会比率(log-odds ratio),因而上式表明对数机会比率是各解释变量的线性函数,而对于线性概率模型, 为各解释变量的线性函数。,可见,logit模型的一个重要的优点是它把在(0,1)上预测概率的问题转化为在实数轴预测一个事件发生的机会比的问题。Logistic分布函数的斜率在p=1/2时最大,这说明自变量对某一选择概率的影响在分布的中点最大。,由于累积正态分布和累积logistic分布

11、很接近,只是logistic的条件概率趋向于0或1的速度更慢一些。因此,我们无论logit法还是probit法,得到的结果都不会有很大不同。但是两种方法得到的参数估计值不是直接可比的,因为它们的方差不同,标准logistic分布的方差为 ,因此,logit模型得到的的估计值必须除以 ,才能与标准probit模型得到的估计值相比较(正态分布标准差为1)。,实际上,由于logit模型计算上更容易,所以logit模型常被用来替代probit模型。,二、Probit模型和Logit模型的参数估计和假设检验,估计LPM,我们可以采用OLS或WLS。在Probit模型和Logit模型中,由于其非线性性质,

12、OLS或WLS都不再适用。,以考研案例为例,若学生决定考研,这p=1;否则p0。如果我们将这些数据直接带入logit模型,则,Li=log(1/0),显然这表达式无意义。因此,在样本为个体数据或不可重复观测数据时,估计Probit模型和Logit模型,通常采用极大似然法。,这里所谓非重复观测值是指对每个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。,1.非重复观测值数据或个体数据的Probit模型和logit模型的参数估计,极大似然估计量(MLE)即由极大化此对数似然函数得到。对于logit模型,F是标准logistic cdf,是logit估计量;对于probit模型

13、,F是标准正态cdf,是probit估计量。 由于此最大化问题的非线性性质,我们很难写出Probit模型和Logit模型的参数的极大似然估计量的具体表达式。可以证明,在很一般的条件下,MLE是一致的、渐近正态和渐近有效的(一般性讨论参见Woodridge(2002)。,2.群组或重复观测数据下Probit和logit模型的参数估计,对每个决策者有多个重复(例如10次左右)观测值。 对第i个决策者重复观测Ni次,选择yi=1的次数为ni次,则ni / Ni作为真实概率Pi的一个估计量。 在Ni足够大时,模型采用广义(加权)最小二乘法估计 ;对于小样本,对结果的解释需格外慎重。 此类样本在实际中并

14、不常用。,例 贷款决策模型,分析与建模:某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(CC)和“市场竞争地位等级”(CM),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。目的是研究JG与CC、CM之间的关系,并为正确贷款决策提供支持。,样本观测值,CC=XY CM=SC,该方程表示,当CC和CM已知时,代入方程,可以计算贷款成功的概率JGF。例如,将表中第19个样本观测值CC=15、CM=1代入方程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于0.1326552的累积正态分布为0.5517;于是

15、,JG的预测值JGF=10.5517=0.4483,即对应于该客户,贷款成功的概率为0.4483。,输出的估计结果,模拟预测,预测:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。,Probit 0.999999 1.000000 0.447233 0.000000,如果解释变量是一个大致连续的变量,则无论Probit模型还是Logit模型,对响应概率 的偏效应都在 处取最大值:,三、偏效应,在二元响应模型的大多数应用中,首要的目标是解释变量 对响应概率 的影响,这就是偏效应。,与LPM模

16、型相比,偏效应的值多出一个乘积项,称为比例因子(scale factor)或调整因子(adjustment factor),它与全部解释变量有关,因而会随X的值而变。在计算偏效应时,为方便起见,通常希望有一个适用于模型中所有斜率的比例因子。有两种方法解决这个问题:,Logit模型的偏效应为:,Probit模型的偏效应:,第一种方法是用解释变量观测值的均值计算偏效应的表达式,比例因子为第二种方法是对每个观测值计算偏效应,然后计算它们的样本均值,这样得到的是平均偏效应(average partial effect, APE)。,四、拟合优度的测度,1. 正确预测的百分比,2. McFadden(1

17、974)提出的pseudo- 测度 似然比指数,其中 表示被估计模型的对数似然函数值,则 表示只有截距项的模型的对数似然函数值。,10.2 多元选择模型 Models with Discrete Dependent VariablesMultiple Choice Model,一、一般多元离散选择Logit模型 二、嵌套多元离散选择模型 三、排序多元离散选择模型,多元(项)选择模型是研究在多于两个的选项中进行决策的模型。一般可以依照选择集分为有序和无序两种宽泛的类型。比如,城市交通工具的选择显然是无序的,而投资者选择公司债券(债券经过评级)是有序的。,一般的多元选择问题 排序选择问题 将选择对

18、象按照某个准则排队,由决策者从中选择。 决策者对同一个选择对象的偏好程度。 嵌套选择问题,在多元离散选择模型中,因为Probit模型需要对多元正态分布的整体进行评价,所以它的应用受到限制。 逻辑分布更适合于效用最大化时的分布选择,所以应用最多的多元离散选择模型是Logit模型。 Logit模型的似然函数能够快速可靠地收敛,当方案或者决策个体数量较大时,计算比较简便。,一、一般多元离散选择Logit模型, 一般多元选择Logit模型的思路,如果决策者i在(J+1)项可供选择方案中选择了第j项,那么其效用模型为:,如果(J+1)个随机误差项互不相关,并且服从Weibull分布,效用模型的解释变量中

19、包括所有影响选择的因素,既包括决策者所具有的属性,也包括备选方案所具有的属性。 备选方案所具有的属性是随着方案的变化而变化的。 决策者所具有的属性中一部分是随着方案的变化而变化的,而一部分是不随着方案的变化而变化的。 用Zij表示随着方案的变化而变化的那部分解释变量,Wi表示不随着方案的变化而变化的那部分解释变量。,实用的一般多元Logit选择模型又分3种情况。 一是研究选择某种方案的概率与决策者的特征变量之间的关系; 二是研究选择某种方案的概率与决策者的特征变量以及方案的特征变量之间的关系; 三是考虑到不同方案之间的相关性的情况。,Multinomial Logit Model 多项式Log

20、it模型 名义Logit模型,Conditional Logit Model 条件Logit模型,Nested Logit模型 嵌套模型,多元名义Logit离散选择模型及其参数估计,X中未包含备选方案所具有的属性变量,而参数向量B对不同的选择方案(即不同的方程)是不同的。,令B0=0,j=1,2,J,由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。,另一种估计方法,可以计算得到相对于基准方案的对数概率比为:,例题,农村异地转移劳动力的迁移目标研究。 被解释变量:迁移目标,即小城镇、县级市、地级市、省级城市和超大城市,依次取值1、2、3、

21、4、5。 解释变量:个人特征和目前所在地属性。连续变量包括受教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、原有收入、现有收入,目前所在地属性中的所在地农村人口、国内生产总值、城乡居民储蓄余额、粮食产量、中学生在校人数、小学生在校人数等。离散变量包括性别、婚姻状况、收入稳定与否,目前所在地所属级别与家乡所在地所属级别等。,调查样本,有效样本303份。 用SAS统计软件进行估计与分析。 首先将定义的全部变量放进模型中进行估计,并通过比较各个变量的P值来考虑具体剔除哪些变量以及对哪些变量考虑将其交互影响的效应放进模型中去。 小城镇、县级市、地级市、省级城市和超大城市依次取值1、2、3、4、5。

22、,虽然作为被解释变量的城市规模本身是有序的,但是对于农村劳动力来说,选择进入哪一个级别的城市,本身是无序的,因此对于城市化迁移目标构造多元名义logit离散选择模型。,由于得到了频数,可以采用“对数概率模型”进行估计。,最终模型的估计结果(部分),*代表的是90的显著性水平, *代表的是95的显著性水平, *代表的是99的显著性水平。,将模型的结果整理出来,并对每个解释变量进行分析。 例如:教育程度、家庭情况及现有收入对迁移目标的影响:,从家庭情况来看,所有系数都是负值,也就是说家庭情况越好的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,省级城市最不容易被选中,其次

23、是县级市,而小城镇与地级市之间没有明显区别 。从现有收入来看,所有系数都是负值,也就是说目前收入越高的农村劳动力越愿意进入规模较大的城市;再从显著性水平来看,所有系数都是显著的,这说明相对于任何级别的城市而言,农村劳动力都更倾向于超大城市。,从教育程度来看,所有系数都是负值,教育程度越高的农村劳动力越愿意进入规模较大的城市;从显著性水平来看,相对于超大城市来说,县级市被选择的可能性最小,其次是小城镇,然后是地级城市,而教育程度相似的农村劳动力在省级城市与超大城市之间的选择没有明显的差异。,多元条件Logit离散选择模型及其参数估计,选择某种方案的概率不仅与决策者的特征变量有关,而且也与方案的特

24、征变量有关,模型为:,区别在于B的下标,由对数似然函数最大化的一阶条件,利用Newton 迭代方法可以迅速地得到方程组的解,得到模型的参数估计量。,1. 问题的提出,(J+1)个不同的选择方案之间具有相关性,而且必须考虑这种相关性,表现为模型随机误差项相关。 可行的思路是将(J+1)个选择方案分为L组,在每组内部的选择方案之间不具有相关性,而组间则具有相关性。 就是将条件Logit模型中隐含的齐次方差性条件放松,允许方差在组间可以不同,但在组内仍然是同方差的。 这样的模型被称为Nested Logit模型。,二、嵌套多元离散选择模型,2. Nested Logit模型,表示对选择第l组产生影响

25、的变量,表示在第l组内对选择第j种方案产生影响的变量,定义第l组的“内值”(Inclusive Value),3. 估计方法,两阶段最大似然法,是一种有限信息估计方法。其具体步骤是: 在组内,作为一个简单的条件Logit模型,估计参数; 计算每组的“内值”; 将每组看成是一种选择方案,再进行简单的条件Logit模型的估计,得到参数和T的估计量。此时用到的贡献变量是Zl和Il。,完全信息最大似然法。将对数似然函数写为:,1.问题的提出,作为被解释变量的(J+1)个选择结果本身是排序的,J优于(J1),2优于1,1优于0。 决策者选择不同的方案所得到的效用也是排序的。 一般多元离散选择模型中的效用

26、关系不再适用。,三、排序多元离散选择模型 Multivariate Choice Model for Ordered Dada,2.效用关系,选择不同方案的效用关系:,3. 模型,为了保证所有的概率都是正的,必须有 :,假定服从正态分布,并且标准化为服从期望为0、方差为1的正态分布。那么可以得到选择各个方案的概率,为正态分布的概率函数,4.估计,采用最大似然法估计。,10.3 离散计数数据模型 (Models For Count Data),1.经济、社会活动中的计数数据问题,发生事故次数的影响因素分析 更换工作次数的影响因素分析,2.计量模型中的计数数据问题,通常计数数据模型的形式可以表示如

27、下:,其中N代表被解释变量,通常为正整数,N和X之间的关系由经济理论决定。,该模型假定,通过调查能够得到一组代表被解释变量的数字(如0,1,2,3)以及相应的解释变量的观察值。,建立模型的目的主要有两点: 检验从数据中可以观察到的行为模式是否与理论预期相符; 将N和X之间的内在联系用数量化的方式表现出来。 从理论上讲,多元线性方程的参数估计方法也可以被应用来分析计数数据模型问题。 但是很容易发现,计数数据中零元素和绝对值较小的数据出现得较为频繁,而且离散特征十分明显,利用这些特点,可以找到更合适的估计方法。,七十年代末以来,许多学者在计数数据模型的处理方法方面作出了较大贡献,包括: Gilbe

28、rt(1979)提出了泊松回归模型, Hausman,Hall和Griliches(1984)提出了负二项回归模型和Panel方法, Gourier,Monfort和Trogonon(1984)提出了仿最大似然法。 其中,最先提出的泊松方法在研究计数数据模型问题中应用得非常广泛。,二、泊松回归模型,1.泊松回归模型,泊松回归模型假定,被解释变量yi服从参数为i的泊松分布,其中i同解释变量xi存在某种关系。该模型的初始方程为:,最常用的关于i的方程是对数线性模型,即,根据泊松分布的性质,2.泊松回归模型的ML估计,是一个非线性模型,最简单的方法是最大似然估计法。对数似然函数为:,可以利用Newt

29、on迭代法迅速地得到方程的参数估计值。,3.拟合优度,由于泊松模型的条件均值非线性,且回归方程存在异方差,所以它不能产生类似于线性方程中的R2统计量。学者提出了若干个替代性的统计量,用以衡量该模型的拟合优度。,该统计量通过把泊松模型同只有一种观察值的模型相比较的方法,考察该模型的拟合优度。但是这个统计量有时为负,而且会随变量的减少而变小。,该统计量为各样本观察值的偏差之和。如果拟合达到完美状态,则该统计量为零。,分子和分母都衡量了模型在只有一种观察值的模型基础上的改进,分母为改进的最大空间。所以该统计量的数值在0到1之间。,“仿R2”统计量,4.假设检验,检验解释变量的约束。 可以用三种标准的

30、检验方法来检验泊松回归模型的假设。,Wald统计量。其中为2受到限制的解释变量的参数,,LR统计量。分母描述受到限制后的方程的解释变量的似然概率。,三个统计量都服从2分布,自由度为受限变量的个数。如果统计值大于临界值,则拒绝原假设。,5.例题,轮船事故次数(accidents)与轮船型号(typea、b、c、d、e)、制造年份(year60、65、70、75)、投入使用年份(yearop60、75)和实际服务时间(servmonth)的关系研究。 样本:34,注意入选的解释变量,部分参数的经济意义缺乏合理解释。只作为试例。,ACCIDENTS = EXP(1.645572184*TYPEA +

31、 2.353413299*TYPEB + 0.4488787812*TYPEC + 0.8131627072*TYPED + 1.401045748*TYPEE - 0.6726004217*YEAR60 + 0.3731874354*YEAR65 + 0.7675535312*YEAR70 - 0.6994767419*YEAROP60 + 6.388715642e-05*SERVMONTH),用LR统计量进行假设检验,0假设为:制造年份对事故次数无影响,拒绝0假设,预测结果与观测值的比较,OLS估计与计数数据估计拟合值的比较,10.4 受限被解释变量数据模型 选择性样本 Model wit

32、h Limited Dependent Variable Selective Samples Model,“截断”(truncation)问题,由于条件限制,样本不能随机抽取,即不能从全部个体,而只能从一部分个体中随机抽取被解释变量的样本观测值,而这部分个体的观测值都大于或者小于某个确定值。 “掐头”或者“去尾”。 消费函数例题:被解释变量最低200元、最高10000元。原因:抽样。 离散选择模型的例题:银行贷款,实际上是选择性样本,通常表现为“截断样本”。 原因:问题的局限。,能够获得贷款的企业是全部有贷款需求的企业中表现良好的一部分,“归并” (censoring)问题,Censored模

33、型研究一类重要的受限被解释变量:在取正值时大致连续,但总体中有一个不可忽略的部分取值为零。将被解释变量的处于某一范围的样本观测值都用一个相同的值代替。 经常出现在“检查”、“调查”活动中,因此也称为“检查”(censoring) 问题。 考察决定居民家庭用于耐用消费品(如汽车等)支出的因素,或者研究居民每年用于慈善捐助支出的决定因素,或者研究居民每月用于特殊消费品(如酒类等)支出的决定因素等等。这些研究都需要对总体进行抽样调查取得相关的数据,而抽样调查的结果有一个共同的特点,那就是有相当一部分个体用于这些方面支出的金额为零,同时不为零的支出数据会呈现出基本连续的形态。,1.思路,如果一个单方程

34、计量经济学模型,只能从“掐头”或者“去尾”的连续区间随机抽取被解释变量的样本观测值,那么很显然,抽取每一个样本观测值的概率以及抽取一组样本观测值的联合概率,与被解释变量的样本观测值不受限制的情况是不同的。 如果能够知道在这种情况下抽取一组样本观测值的联合概率函数,那么就可以通过该函数极大化求得模型的参数估计量。,一、“截断”问题的计量经济学模型,2.截断分布,如果服从均匀分布U(a, b),但是它只能在(c, b)内取得样本观测值,那么取得每一个样本观测值的概率,为随机变量分布范围内的一个常数,服从正态分布,是标准正态分布条件概率函数,3.截断被解释变量数据模型的最大似然估计,求解该1阶极值条

35、件,即可以得到模型的参数估计量。 由于这是一个复杂的非线性问题,需要采用迭代方法求解,例如牛顿法。,4.例题城镇居民消费模型 -截断样本数据,将这组样本看成是在4500的条件下随机抽取得到,将这组样本看成是在4000的条件下随机抽取得到,参数由 0. 750072变化为,似然函数值由228.6718减小为,似然函数值为什么变小?,将这组样本看成是在11500、4500条件下随机抽取得到,参数由 0. 750072变化为,似然函数值由228.6718增大为,似然函数值为什么增大?,将这组样本看成是在0条件下随机抽取得到,结果与OLS相同 似然函数值减小,似然函数值最小,5.为什么截断被解释变量数

36、据模型不能采用普通最小二乘估计,对于截断被解释变量数据计量经济学模型,如果仍然把它看作为经典的线性模型,采用OLS估计,会产生什么样的结果? 因为yi只能在大于a的范围内取得观测值,那么yi的条件均值为:,由于被解释变量数据的截断问题,使得原模型变换为包含一个非线性项模型。 如果采用OLS直接估计原模型: 实际上忽略了一个非线性项; 忽略了随机误差项实际上的异方差性。 这就造成参数估计量的偏误,而且如果不了解解释变量的分布,要估计该偏误的严重性也是很困难的。,1.Censored模型的概念,当被解释变量在特定范围内的值都转换成(或报告为)某个值时,称被解释变量被归并(censoring),称此

37、变量为归并变量(censored variable)。censored回归模型的一般形式是,三、“归并”问题的计量经济学模型 由于该模型是由Tobin于1958年最早提出的,所以也称为Tobit模型。,2.Tobit模型的估计,为了计估模型参数,我们推导Y的均值 设 ,称为逆米尔斯比率(inverse Mills ratio),它是标准正态pdf与标准正态cdf在c处的比值。则,有了上面的结果,我们可以计算从总体中随机抽取的观测值的均值因此,一旦有了 的估计值,我们就可以确保Y 的预测值为正。当然,保证Y 的预测值为正的代价是使用了更为复杂的非线性模型。,Censored模型通常采用极大似然估

38、计。由Y 的分布,可得模型的对数似然函数为该对数似然函数由两部分组成:一部分对应于没有限制的观测值,是经典回归部分;一部分对应于受到限制的观测值。因而上式是一个非标准的对数似然函数,实际上是离散分布与连续分布的混合。 最大化对数似然函数,可得极大似然估计量。这一估计量的性质与普通MLE的性质相同。一般情况下,需采用数值方法来求极大似然估计值。,求标准误差的矩阵表达式很复杂,详细的讨论见Wooldridge(2002)。 利用Eviews软件,很方便得到模型的参数估计值及标准误差,因而可以进行参数的假设检验。我们还可以采用沃尔德统计量或似然比统计量同时检验多个约束,其方法与一般的MLE相同。Ce

39、nsored模型的MLE需要两个基本假定:潜变量模型中随机干扰项的同方差性和正态性。如果存在异方差性或非正态性,那么MLE估计量便是不一致的。,在实践中,研究人员估计Censored模型时往往采用OLS法,尽管OLS估计值不一致。人们发现OLS估计值通常小于ML估计值,几乎没有例外。一个值得注意的经验规律是,极大似然估计值通常约等于OLS估计值除以样本中非受限观测值的比例。这恐怕是人们估计Censored模型时采用OLS法的原因。,3.Tobit模型的偏效应,在潜变量模型中,参数的含义与线性模型相同,事实上但潜变量不可观测,因而这个结果通常没有什么意义。我们更关心的是解释变量如何影响可观测变量

40、。 可以证明,在Tobit模型扰动项正态分布的假设下, 对 的偏效应为,4.例题城镇居民消费模型 -归并样本数据,11123.84,11040.34,Censored(11000) 估计,参数估计结果、似然函数值都与OLS估计差异较大。为什么似然函数值大于OLS估计?,Censored(12000) 估计与OLS相同,5.实际模型中的Truncation与Censored,时间序列样本,不考虑。 截面上的全部个体作为样本,不考虑Truncation。 按照抽样理论选取截面上的部分个体作为样本,不考虑Truncation。 按照特定的规则选取截面上的部分个体作为样本,必须考虑Truncation。 截面数据作样本,根据样本观测值的经济背景,决定是否考虑Censored。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报