收藏 分享(赏)

第七章 扩展的单方程计量经济学模型(计量经济学-李子奈(第3版).ppt

上传人:j35w19 文档编号:6809401 上传时间:2019-04-23 格式:PPT 页数:137 大小:2.02MB
下载 相关 举报
第七章 扩展的单方程计量经济学模型(计量经济学-李子奈(第3版).ppt_第1页
第1页 / 共137页
第七章 扩展的单方程计量经济学模型(计量经济学-李子奈(第3版).ppt_第2页
第2页 / 共137页
第七章 扩展的单方程计量经济学模型(计量经济学-李子奈(第3版).ppt_第3页
第3页 / 共137页
第七章 扩展的单方程计量经济学模型(计量经济学-李子奈(第3版).ppt_第4页
第4页 / 共137页
第七章 扩展的单方程计量经济学模型(计量经济学-李子奈(第3版).ppt_第5页
第5页 / 共137页
点击查看更多>>
资源描述

1、第7章说明,经典的单方程计量经济学模型理论与方法,限于常参数、线性、揭示变量之间因果关系的单方程模型,被解释变量是连续的随机变量,其抽样是随机和不受限制的,在模型估计过程中或者只利用时间序列样本,或者只利用截面数据样本,主要依靠对经济理论和行为规律的理解确定模型的结构形式。 本章中,将讨论几种扩展模型,主要包括将被解释变量抽样由完全随机扩展为受到限制的选择性样本模型,将被解释变量是连续的扩展为离散的离散选择模型,将单一种类的样本扩展为同时包含截面数据和时间序列数据的平行数据样本(Panel Data)等。,第7章说明,这些模型与方法,无论在计量经济学理论方面还是在实际应用方面,都具有重要意义。

2、但是,这些模型都形成了各自丰富的内容体系,甚至是计量经济学的新分支学科,模型方法的数学过程较为复杂。 本章只介绍其中最简单的模型,以了解这些模型理论与方法的概念与思路。,7.1 选择性样本模型 Selective Samples Model,一、经济生活中的选择性样本问题 二、“截断”问题的计量经济学模型 三、“归并”问题的计量经济学模型,The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000 “for his development of theory and methods for analy

3、zing selective samples”,James J Heckman USA,“Shadow Prices, Market Wages and Labour Supply”, Econometrica 42 (4), 1974, P679-694发现并提出“选择性样本”问题。 “Sample Selection Bias as a Specification Error”, Econometrica 47(1), 1979, P153-161证明了偏误的存在并提出了Heckman两步修正法。,一、经济生活中的选择性样本问题,1、“截断”(truncation)问题,由于条件限制,样本

4、不能随机抽取,即不能从全部个体,而只能从一部分个体中随机抽取被解释变量的样本观测值,而这部分个体的观测值都大于或者小于某个确定值。 “掐头”或者“去尾”。 例如消费函数模型:由于抽样原因,被解释变量样本观测值最低200元、最高10000元。 例如农户贷款影响因素分析模型:如果调查了10000户,其中只有6000户在一年内发生了贷款。仅以发生了贷款的6000户的贷款额作为被解释变量观测值,显然是将其它没有发生贷款的4000户“截断”掉了。,2、“归并” (censoring)问题,将被解释变量的处于某一范围的样本观测值都用一个相同的值代替。 经常出现在“检查”、“调查”活动中,因此也称为“检查”

5、(censoring) 问题。 例如需求函数模型:用实际消费量作为需求量的观测值,如果存在供给限制,就出现“归并”问题。 被解释变量观测值存在最高和最低的限制。例如考试成绩,最高100,最低0,出现“归并”问题。,二、“截断”问题的计量经济学模型,1、思路,如果一个单方程计量经济学模型,只能从“掐头”或者“去尾”的连续区间随机抽取被解释变量的样本观测值,那么很显然,抽取每一个样本观测值的概率以及抽取一组样本观测值的联合概率,与被解释变量的样本观测值不受限制的情况是不同的。 如果能够知道在这种情况下抽取一组样本观测值的联合概率函数,那么就可以通过该函数极大化求得模型的参数估计量。,2、截断分布,

6、如果服从均匀分布U(a, b),但是它只能在(c, b)内取得样本观测值,那么取得每一个样本观测值的概率,为随机变量分布范围内的一个常数,服从正态分布,是标准正态分布条件概率函数,3、截断被解释变量数据模型的最大似然估计,求解该1阶极值条件,即可以得到模型的参数估计量。 由于这是一个复杂的非线性问题,需要采用迭代方法求解,例如牛顿法。,4、例7.1.1:城镇居民消费模型,OLS估计:将样本看为不受任何限制下随机抽取的样本,ML估计:将样本看为在消费水平大于1000元、小于5000元的特定人群中随机抽取的样本,估计方法选择,样本类型选择,截断点选择,5、为什么截断被解释变量数据模型不能采用普通最

7、小二乘估计,对于截断被解释变量数据计量经济学模型,如果仍然把它看作为经典的线性模型,采用OLS估计,会产生什么样的结果? 因为yi只能在大于a的范围内取得观测值,那么yi的条件均值为:,由于被解释变量数据的截断问题,使得原模型变换为包含一个非线性项模型。 如果采用OLS直接估计原模型: 实际上忽略了一个非线性项; 忽略了随机误差项实际上的异方差性。 这就造成参数估计量的偏误,而且如果不了解解释变量的分布,要估计该偏误的严重性也是很困难的。,三、“归并”问题的计量经济学模型,1、思路,以一种简单的情况为例,讨论“归并”问题的计量经济学模型。即假设被解释变量服从正态分布,其样本观测值以0为界,凡小

8、于0的都归并为0,大于0的则取实际值。如果y*以表示原始被解释变量,y以表示归并后的被解释变量,那么则有:,单方程线性“归并”问题的计量经济学模型为:,如果能够得到yi的概率密度函数,那么就可以方便地采用最大似然法估计模型,这就是研究这类问题的思路。 由于该模型是由Tobin于1958年最早提出的,所以也称为Tobin模型。,2、“归并”变量的正态分布,由于原始被解释变量y*服从正态分布,有,3、归并被解释变量数据模型的最大似然估计,该似然函数由两部分组成,一部分对应于没有限制的观测值,是经典回归部分;一部分对应于受到限制的观测值。 这是一个非标准的似然函数,它实际上是离散分布与连续分布的混合

9、。 如何理解后一部分?,为什么要求和?,如果样本观测值不是以0为界,而是以某一个数值a为界,则有,估计原理与方法相同。,4、例7.1.2:城镇居民消费模型,OLS估计:将样本看为不受任何限制下随机抽取的样本,OLS估计:将样本看为在消费水平为1000元的归并样本,选择归并样本,选择归并值,Censored(11000) 估计,参数估计结果、似然函数值都与OLS估计差异较大。为什么似然函数值大于OLS估计?,Censored(12000) 估计与OLS相同,5、实际模型中的Truncation与Censored,时间序列样本,不考虑。 截面上的全部个体作为样本,不考虑Truncation。 按照

10、抽样理论选取截面上的部分个体作为样本,不考虑Truncation。 按照特定的规则选取截面上的部分个体作为样本,必须考虑Truncation。 截面数据作样本,根据样本观测值的经济背景,决定是否考虑Censored。,7.2 二元选择模型 Binary Choice Model,一、二元离散选择模型的经济背景 二、二元离散选择模型 三、二元Probit离散选择模型及其参数估计 四、二元Logit离散选择模型及其参数估计 五、二元离散选择模型的检验,说明,在经典计量经济学模型中,被解释变量通常被假定为连续变量。 离散被解释变量数据计量经济学模型(Models with Discrete Depe

11、ndent Variables)和离散选择模型(DCM, Discrete Choice Model)。 二元选择模型(Binary Choice Model)和多元选择模型(Multiple Choice Model)。 本节只介绍二元选择模型。,离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。 1962年,Warner首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。 70、80年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。 模型的估计方法主要发展于80年代初期。,一、二元离散选择模型的经

12、济背景,实际经济生活中的二元选择问题,研究选择结果与影响因素之间的关系。 影响因素包括两部分:决策者的属性和备选方案的属性。 对于单个方案的取舍。例如,购买者对某种商品的购买决策问题 ,求职者对某种职业的选择问题,投票人对某候选人的投票决策,银行对某客户的贷款决策。由决策者的属性决定。 对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由决策者的属性和备选方案的属性共同决定。,二、二元离散选择模型,1、原始模型,对于二元选择问题,可以建立如下计量经济学模型。其中Y为观测值为1和0的决策被解释变量;X为解释变量,包括选择对象所具有的属性和选择主体所具有的属性。,左右端矛盾,由于存在这

13、两方面的问题,所以原始模型不能作为实际研究二元选择问题的模型。 需要将原始模型变换为效用模型。 这是离散选择模型的关键。,具有异方差性,2、效用模型,作为研究对象的二元选择模型,第i个个体 选择1的效用,第i个个体 选择0的效用,注意,在模型中,效用是不可观测的,人们能够得到的观测值仍然是选择结果,即1和0。 很显然,如果不可观测的U1U0,即对应于观测值为1,因为该个体选择公共交通工具的效用大于选择私人交通工具的效用,他当然要选择公共交通工具; 相反,如果不可观测的U1U0,即对应于观测值为0,因为该个体选择公共交通工具的效用小于选择私人交通工具的效用,他当然要选择私人交通工具。,3、最大似

14、然估计,欲使得效用模型可以估计,就必须为随机误差项选择一种特定的概率分布。 两种最常用的分布是标准正态分布和逻辑(logistic)分布,于是形成了两种最常用的二元选择模型Probit模型和Logit模型。 最大似然函数及其估计过程如下:,标准正态分布或逻辑分布的对称性,似然函数,在样本数据的支持下,如果知道概率分布函数和概率密度函数,求解该方程组,可以得到模型参数估计量。,1阶极值条件,三、二元Probit离散选择模型及其参数估计,1、标准正态分布的概率分布函数,2、重复观测值不可以得到情况下二元Probit离散选择模型的参数估计,关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法

15、中所采用的迭代方法。 应用计量经济学软件。 这里所谓“重复观测值不可以得到”,是指对每个决策者只有一个观测值。如果有多个观测值,也将其看成为多个不同的决策者。,例7.2.2 贷款决策模型,分析与建模:某商业银行从历史贷款客户中随机抽取78个样本,根据设计的指标体系分别计算它们的“商业信用支持度”(CC)和“市场竞争地位等级”(CM),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。目的是研究JG与CC、CM之间的关系,并为正确贷款决策提供支持。,样本观测值,CC=XY CM=SC,该方程表示,当CC和CM已知时,代入方程,可以计算贷款成功的概率JGF。例如,将表中第1

16、9个样本观测值CC=15、CM=1代入方程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于0.1326552的累积正态分布为0.5517;于是,JG的预测值JGF=10.5517=0.4483,即对应于该客户,贷款成功的概率为0.4483。,输出的估计结果,模拟预测,预测:如果有一个新客户,根据客户资料,计算的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。,3、重复观测值可以得到情况下二元Probit离散选择模型的参数估计,思路 对每个决策者有多个重复(例如10次左右)观测值。 对第i个决策者重复观测ni次

17、,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。 建立 “概率单位模型” ,采用广义最小二乘法估计 。 实际中并不常用。,对第i个决策者重复观测n次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。,定义“观测到的”概率单位,V的观测值通过求解标准正态分布的概率分布函数的反函数得到,实际观测得到的,四、二元Logit离散选择模型及其参数估计,1、逻辑分布的概率分布函数,Brsch-Supan于1987年指出:,如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这种情况下的二元选择模型应该采用Logit模型。,2、重复观测值

18、不可以得到情况下二元logit离散选择模型的参数估计,关于参数的非线性函数,不能直接求解,需采用完全信息最大似然法中所采用的迭代方法。 应用计量经济学软件。,Probit 0.999999 1.000000 0.447233 0.000000,3、重复观测值可以得到情况下二元logit离散选择模型的参数估计,思路 对每个决策者有多个重复(例如10次左右)观测值。 对第i个决策者重复观测ni次,选择yi=1的次数比例为pi,那么可以将pi作为真实概率Pi的一个估计量。 建立“对数成败比例模型” ,采用广义最小二乘法估计 。 实际中并不常用。,用样本重复观测得到的pi构成“成败比例”,取对数并进行

19、台劳展开,有,逻辑分布的概率分布函数,五、二元离散选择模型的检验,1、计量经济学模型中的两类检验统计量,基于LS R2 总体显著性F检验 约束回归的F检验 基于ML Wald LR (likelihood ratio) LM (lagrange multiplier) 原理相同,2、拟合检验,P:样本观测值中被解释变量等于1的比例。L0:模型中所有解释变量的系数都为0时的似然函数值。 LRI=1,即L=1,完全拟合。LRI=0,所有解释变量完全不显著,完全不拟合。,LnL=1.639954 LnL0=52.80224 LRI=0.968942,3、省略变量检验,经典模型中采用的变量显著性t检验

20、仍然是有效的。 如果省略的变量与保留的变量不是正交的,那么对参数估计量将产生影响,需要进一步检验这种省略是否恰当。,如果X2中的变量省略后对参数估计量没有影响,那么H1和H0情况下的对数最大似然函数值应该相差不大,此时LR统计量的值很小,自然会小于临界值,不拒绝 H0。,检验步骤 首先进行约束模型的估计 选择系数检验 引入省略的变量 判断,省略CC,只保留CM,估计模型,选择”Omitted Variables-LR Test”,引入CC,拒绝CC系数为0的0假设,4、异方差性检验,截面数据样本,容易存在异方差性。 假定异方差结构为:,采用LM检验,将解释变量分为两类,Z为只与个体特征有关的变

21、量。显然异方差与这些变量相关。,将异方差检验问题变为一个约束检验问题,一般都存在异方差。 不检验,采用White修正进行估计,5、分布检验,检验关于分布的假设(probit、logit )。 一般不进行该项检验。 具体见相关教科书(Greene,P682)。,:模型1的参数,:模型2的参数。 组合模型的似然函数:,构造LM统计量,如果不拒绝0假设,表明模型1是适当的。,6、回代检验,当二元离散选择模型被估计后,将所有样本的解释变量观测值代入模型,计算得到每个样本的被解释变量选择1的概率,与每个样本被解释变量的实际观测值进行比较,以判断模型的预测(回代)效果,是一种实际有效的模型检验方法。 概率

22、阈值 朴素选择:p=0.5 (1、0的样本相当时) 先验选择:p=(选1的样本数/全部样本)(全样本时) 最优阈值:犯第一类错误最小原则,例7.2.2,朴素选择,即以0.5为阈值:除了2个样本外,所有样本都通过了回代检验。 先验选择,即以选择1的样本的比例0.41为阈值:除了1个样本外,所有样本都通过了回代检验。,实例财务欺诈识别模型,我国上市公司财务欺诈识别模型 样本:年度报告审计意见为“无法发表意见”或者“证监会立案调查”等公司属于财务欺诈样本;年度报告审计意见为“标准无保留意见”和财务报表满足“利润现金流量0”的公司属于配对样本。 解释变量:开始选择11个财务指标;通过T检验,确定6个指

23、标:资产负债率、资产毛利率、资产周转率、营运资金比率、应收账款周转率、经营活动现金流量/资产额。,样本:财务欺诈公司30,非财务欺诈公司30 采用犯第一类错误最小原则确定最优阈值为0.68 欺诈样本中,p0.68,25个,占83.3%,实例上市公司并购,被解释变量:当年发生并购行为为1,反之为0。 解释变量:净利润率、,全流通虚变量。 试图研究全流通都并购的影响。 样本:1994-2008上市公司,并购样本731,非并购样本9835。 采用先验原则,P=5% 模拟结果: 并购样本中:p5%占53% 非并购样本中:p5%占72%,7.3 Panel Data 模型,一、概述 二、模型的设定F检验

24、 三、固定影响变截距模型 四、固定影响变系数模型,一、Panel Data 模型概述,1、关于Panel Data Model,独立的计量经济学分支 比较多地用于宏观经济分析统计数据 也可以用于微观经济分析调查数据 几种翻译 面板数据模型 综列数据模型 平行数据模型 时空数据模型,常用Panel Data 模型 变截矩模型(Variable-Intercept Models)固定影响(Fixed-Effects)随机影响(Random-Effects) 变系数模型(Variable-Coefficient Models)固定影响随机影响 动态变截矩模型(Dynamic Models with

25、Variable Intercepts)固定影响随机影响,其它Panel Data 模型 联立方程Panel Data模型 离散数据Panel Data模型 选择性样本Panel Data模型 Panel Data单位根检验和协整检验,2、计量经济分析中的Panel Data问题,研究目的的需要 通过建立计量经济学模型进行经济分析,经常发现,只利用截面数据或者只利用时间序列数据不能满足分析目的的需要。 例如,如果分析生产成本问题。 例如,分析目前我国的结构性失业问题。 数据信息的充分利用 在计量经济分析中,利用信息越多越有效。 利用Panel Data比仅利用截面数据或者时间序列数据更有效。,

26、二、Panel Data 模型的设定F检验,单方程Panel Data模型常见的三种情形,情形1:变系数模型。在横截面上有个体影响,有结构变化。即除了存在个体影响外,在横截面上还存在变化的经济结构,因而结构参数在不同横截面单位上是不同的。,情形2:变截距模型。在横截面上有个体影响,无结构变化。即个体影响表现为模型中被忽略的反映个体差异的变量的影响,又分为固定影响和随机影响两种情况。,情形3:在横截面上无个体影响,无结构变化。则普通最小二乘估计给出了一致有效估计。相当于将多个时期的截面数据放在一起作为样本数据。,情形4:不讨论。 Because it is seldom meaningful t

27、o ask if the intercepts are the same when the slopes are unequal, we shall ignore the type of restrictions.,情形5:在时间序列上有个体影响,有结构变化。在理论方法方面与情形1相同,不讨论。,情形6:有实践,无理论。,F检验,F检验的思路是:将情形2、3分别视为对情形1施加了参数约束。 经典模型中的约束检验:,假设1:斜率在不同的横截面样本点上和时间上都相同,但截距不相同。(情形2) 假设2:截距和斜率在不同的横截面样本点和时间上都相同。(情形3) 如果接收了假设2,则没有必要进行进一步的

28、检验。如果拒绝了假设2,就应该检验假设1,判断是否斜率都相等。如果假设1被拒绝,就应该采用情形1的模型。 主要工作是计算3种情形的残差平方和。下面列出了计算过程,可以忽略。因为在实际应用中,分别对3种情形的的模型进行估计,以得到残差平方和。,F统计量的计算方法,第i群的残差平方和,的残差平方和,的残差平方和,的残差平方和,检验假设2的F统计量,从直观上看,如S3S1很小,F2则很小,低于临界值,接受H2。 S3为截距、系数都不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。,检验假设1的F统计量,从直观上看,如S2S1很小,F1则很小,低于临界值,接受H1。 S2为截距变化、系

29、数不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。,Eviews 不能自动进行F检验,需要单独进行检验。 从理论上讲,模型设定检验是不可缺少的。 在实际应用中,最容易被忽视。,二、固定影响变截距模型,1. LSDV模型及其参数估计,T阶向量,(Tn)阶向量,该模型通常被称为最小二乘虚拟变量(LSDV)模型,有时也称之为协方差分析模型(解释变量既有定量的,也有定性的)。 如果n充分小,此模型可以当作具有(n+K)个参数的多元回归,参数可由普通最小二乘进行估计。 当n很大,甚至成千上万,OLS计算可能超过任何计算机的存储容量。此时,可用分块回归的方法进行计算。 分块回归的思路是:

30、设法消去数量很多的i,估计,然后利用每个个体的时间序列数据计算i 。,ee=T,这是一个不含高阶的Qi,只含的模型,可以估计,的协方差估计是无偏的,且当n或T趋于无穷大时,为一致估计。它的协方差阵为:,截距的估计是无偏估计,且仅当T趋于无穷大时为一致估计。,随机项方差估计量,分块估计的思路: 首先构造1个不含i,只包含的模型,对其进行OLS。 然后分别在每个个体上计算i,分块的含义体现于此。通过F统计量检验变截距假设,用Eviews估计固定影响变截距模型演示,利用北京、天津、河北、山西、内蒙5地区1997-2003年消费总额与GDP的数据,消费总额为被解释变量,以GDP为解释变量,建立一元线性

31、Panel Data模型。,打开Eviews,建立新工作文件,如何在Eviews中建立Panel Data文件?,输入Panel Data的起止时间(1997、2003),选择建立新的数据文件,数据类型选择(Pool)和文件命名(gdpcons),输入截面个体名称(BJ、TJ、HB、SX、NM),选择Sheet,输入变量名(GDP?、CONS?),出现数据表,输入数据、显示数据,在数据表界面上,选择Estimate命令,进行估计,如何在Eviews中估计Panel Data 模型?,估计,输出,结果,三、固定影响变系数模型,将i视为固定的不同的常数时,可写成:,将截距项也看作一个虚变量,显然,如果随机干扰项在不同横截面个体之间不相关,上述模型的参数估计极为简单,即以每个截面个体的时间序列数据为样本,采用经典单方程模型的估计方法分别估计其参数。即使采用GLS估计同时得到的GLS估计量,也是与在每个横截面个体上的经典单方程估计一样。 条件:,如果随机项在不同横截面个体之间的协方差不为零,GLS估计比每个横截面个体上的经典单方程估计更有效。 为什么?,问题的关键是然后求得V矩阵。各种文献中提出各种V矩阵的方法,形成了各种FGLS估计,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报