收藏 分享(赏)

上财系列 计量经济学2.ppt

上传人:天天快乐 文档编号:1467728 上传时间:2018-07-20 格式:PPT 页数:105 大小:1.95MB
下载 相关 举报
上财系列 计量经济学2.ppt_第1页
第1页 / 共105页
上财系列 计量经济学2.ppt_第2页
第2页 / 共105页
上财系列 计量经济学2.ppt_第3页
第3页 / 共105页
上财系列 计量经济学2.ppt_第4页
第4页 / 共105页
上财系列 计量经济学2.ppt_第5页
第5页 / 共105页
点击查看更多>>
资源描述

1、计量经济学,第四章异 方 差 性,引子:更为接近真实的结论是什么?,根据四川省2000年21个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下: (291.5778) (0.644284) t=(-1.931062) (8.340265) 式中Y表示卫生医疗机构数(个),X表示人口数量(万人)。,模型显示的结果和问题:,人口数量对应参数的标准误差较小 t 统计量远大于临界值可决系数和修正的可决系数结果较好 F检验结果明显显著 表明该模型的估计效果不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。然而,

2、这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。 有什么充分的理由说明这一回归结果不可靠呢? 更为接近真实的结论又是什么呢?,第一节 异方差性的实质与产生的原因,一、异方差性的实质(一)同方差性的含义,同方差性:对所有的i(i=1,2,n)有 (4.1) 因为方差是度量被解释变量Y的观测值围绕回归线 (4.2) 的分散程度,因此同方差性指的是所有观测值的分散程度相同。,(二)异方差性的含义,设模型为 如果对于模型中随机误差项 有: (4.3) 则称具有异方差性。进一步,把异方差看成是由于某个解 释变量的变化而引起的,则 (4.4)

3、,图形表示:,(一)模型中省略了某些重要的解释变量假设正确的计量模型是: 假如略去 ,而采用 (4.5) 当被略去的 与 有呈同方向或反方向变化的趋势时, 随 的有规律变化会体现在(4.5)式的 中。 (二)模型的设定误差 模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。,二、产生异方差的原因,(三)测量误差的变化 样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。(四)截面数据中总体

4、各单位的差异 通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。,第二节 异方差的后果,一、对参数估计统计特性的影响(一)参数估计的无偏性仍然成立 参数估计的无偏性仅依赖于基本假定中的零均值假定(即 )。所以异方差的存在对无偏性的成立没有影响。(二)参数估计的方差不再是最小的 同方差假定是OLS估计方差最小的前提条件,所以随机误差项是异方差时,将不能再保证最小二乘估计的方差最小。,二、对参数显著性检验的影响 由于异方差的影响,使得无法正确估计参数的

5、标准误差,导致参数估计的t统计量值不能正确确定,所以,如果仍用t统计量值进行参数的显著性检验将失去意义。三、对预测的影响 尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对Y的预测也将不是有效的。,第三节 异方差的检验,一、图形法(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量Y与随机误差项u有相同的方差,所以利用分析Y与X的相关图形,可以初略地看到Y的离散程度与X之间是否有相关关系。 如果随着x的增加,Y的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。,用1998年四川省各地市州

6、农村居民家庭消费支出与家庭纯收入的数据,绘制出消费支出对纯收入的散点图,其中用表示农村家庭消费支出, 表示家庭纯收入。,图形举例:,(二)残差图形分析,设一元线性回归模型为: (4.10) 运用OLS法估计,得样本回归模型为:(4.11) 由式(4.10)和式(4.11)得残差 (4.12) 绘制出 对 的散点图 : 如果 不随 而变化,则 表明 不存在异方差, 如果 随 而变化,则表 明 存在异方差。,二、Goldfeld-Quanadt检验,作用:检验递增性(或递减性)异方差。 基本思想:将样本分为两部分,然后分别对两个 样本进行回归,并计算两个子样的残差平方和所构成的比,以此为统计量来判

7、断是否存在异方差。(一) 检验的前提条件 1、要求检验使用的为大样本容量。 2、除了同方差假定不成立外,其它假定均满足。,(二)检验的具体做法,1、排序 将解释变量的取值按从小到大排序。2、数据分组 将排列在中间的约1/4的观察值删除掉,记为c,再将剩余的分为两个部分,每部分观察值的个数为(n-c)/2。3、提出假设。即 :,分别对上述两个部分的观察值求回归模型,由此得到的两个部分的残差平方为 和 。 为前一部分样本回归产生的残差平方和 , 为后一部分样本回归产生的残差平方和 。它们的自由度均为(n-c)/2-k,k为参数的个数。 在原假设成立的条件下,因 和 自由度均为(n-c)/2-k,

8、分布,可导出:(4.13),4、构造F统计量,5、判断 给定显著性水平 ,查F分布表得临界值 计算统计量F*,如果F* 则拒绝原假设,接受备择假设,即模型中的随机误差存在异方差。(三)检验的特点 要求大样本 异方差的表现既可为递增型,也可为递减型 检验结果与选择数据删除的个数c的大小有关 只能判断异方差是否存在,在多个解释变量的情况下,对哪一个变量引起异方差的判断存在局限。,三、White检验,(一 )基本思想: 不需要关于异方差的任何先验信息,只需要在大样本的情况下,将OLS估计后的残差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验统计量来判

9、断异方差性。 (二)检验的特点 要求变量的取值为大样本 不仅能够检验异方差的存在性,同时在多变量的 情况下,还能判断出是哪一个变量引起的异方差。,(三)检验的基本步骤:,以一个二元线性回归模型为例,设模型为:并且,设异方差与 的一般关系为 其中 为随机误差项。,1、求回归估计式并计算 用OLS估计式(4.14),计算残差 并求残差 的平方。2、求辅助函数用残差平方 作为异方差 的估计,并建立 的辅助回归,即3、计算 利用求回归估计式(4.15)得到辅助回归函数的可决系数 ,n为样本容量。,4、提出假设 中至少有一个不为零,5、检验 在零假设成立下,有 渐进服从自由度为5的 分布。给定显著性水平

10、 ,查 分布表得临界值,如果 ,则拒绝原假设,表明模型中随机误差存在异方差 。,(一)ARCH过程 设ARCH过程为 p为ARCH过程的阶数,并且 为随机误差。 (二)检验的基本思想 在时间序列数据中,可认为存在的异方差性为 ARCH过程,并通过检验这一过程是否成立去判断时间序列是否存在异方差。,四、ARCH检验,1、提出原假设: 中至少有一个不为零2、参数估计并计算 对原模型作OLS估计,求出残差 ,并计算残差平方序列 ,以分别作为对 的 估计。3、求辅助回归(4.17),(三)ARCH检验的基本步骤,4、检验 计算辅助回归的可决系数 ,并且在 成立时,基于大样本 , 渐进服从 给定显著性水

11、平 查 分布表得临界值 ,如果 ,则拒绝原假设,表明模型中得随机误差 存在异方差。 (四)检验的特点 变量的取值为大样本,并且是时间序列 只能判断模型中是否存在异方差,而不能诊断出哪一 个变量引起的异方差。,五、Glejser检验,(一)检验的基本思想 由OLS法得到残差,取得绝对值,然后将对某个解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。(二)检验的特点 不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。该检验要求变量的观测值为大样本。,(三)检验的步骤,1、建立模型并求 根据样本数据建立回归模型,并求残差序列 2、寻找 与 的最佳函数

12、形式 用残差绝对值 对 进行回归,用各种函数形式去试,寻找最佳的函数形式。3、判断 根据选择的函数形式作 对 的回归,用 作为 的替代变量,对所选函数形式回归。用回归所得到的 、t、F等信息判断,若表明参数 显著不为零,即认为存在异方差性。,模型变换法加权最小二乘法模型的对数变换,第四节 异方差的修正,一、模型变换法以一元线性回归模型为例:(4.17) 经检验 存在异方差,且 ,其中 是常数, 是 的某种函数。变换模型时,用 去除(4.17)式的两端,得 : 记 (4.18)则有:,(4.19)式的随机误差项 的方差为 (4.20) 经变换的(4.19)式的随机误差项 已是同方差。 常见的设定

13、形式 及对应的 情况,二、加权最小二乘法,以一元线性回归模型为例:(4.17)经检验 存在异方差且 ,其中 是常数, 是 的某种函数。(一)基本思路 区别对待不同的 。对较小的 给予较大的权数,对较大的 给予较小的权数,从而使 更好地反映 对残差平方和的影响。,(二)具体做法 1、选取权数并求出加权的残差平方和 通常取权数 ,当 越小时, 越大。当 越大时, 越小。将权数与残差平方相乘以后再求和,得到加权的残差平方和:2、求使满足 的 根据最小二乘原理,若使得加权残差平方和最小,则: 其中:,三、模型的对数变换,在经济意义成立的情况下,如果对模型: 作对数变换,其变量 和 分别用 和 代替,即

14、: 对数变换后的模型通常可以降低异方差性的影响:运用对数变换能使测定变量值的尺度缩小。经过对数变换后的线性模型,其残差表示相对误差往往比绝对误差有较小的差异。 注意:对变量取对数虽然能够减少异方差对模型的影响,但应注意取对数后变量的经济意义。,第五章 序列相关,引子 T检验和F检验一定就可靠吗?,研究居民储蓄存款Y与居民收入X的关系: 用普通最小二乘法估计其参数,结果为 (1.8690) (0.0055) t= (14.9343) (64.2069) F=4122.531检验结果:回归系数的标准误差非常小,t统计量较大,说明居民收入X对居民储蓄存款Y的影响非常显著。同时可决系数也非常高,F统计

15、量=4122.531,也表明模型异常的显著。 但此估计结果可能是虚假的,t统计量和F统计量都被虚假地夸大,因此所得结果是不可信的。为什么?,第一节 序列相关的定义,一、序列相关的概念 序列相关(serial correlation), 又称自相关(auto correlation),是指总体回归模型的随机误差项之间存在相关关系。即不同观测点上的误差项彼此相关。,序列相关系数的定义与普通相关系的公式形式相同,的取值范围 为-1 1。式(5.1)中ut-1是ut滞后一期的随机误差项,因此,将式(5.1)计算的序列相关系数称为一阶序列相关系数。,一阶序列相关系数,式 (5.1),二、序列相关产生的原

16、因,序列相关产生的原因,1、经济系统的惯性,2、经济活动的滞后效应,3、数据处理造成的相关,4、蛛网现象,5、模型设定偏误,如GDP、价格、就业等经济指标都会随经济系统的周期而波动。例如,在经济高涨时期,较高的经济增长率会持续一段时间,而在经济衰退期,较高的失业率也会持续一段时间,这种现象就会表现为经济指标的序列相关现象。,序列相关现象大多出现在时间序列数据中,而经济系统的经济行为都具有时间上的惯性。,原因1经济系统的惯性,滞后效应是指某一指标对另一指标的影响不仅限于当期而是延续若干期。由此带来变量的序列相关。,例如,居民当期可支配收入的增加,不会使居民的消费水平在当期就达到应有水平,而是要经

17、过若干期才能达到。因为人的消费观念的改变客观上存在自适应期。,原因2 经济活动的滞后效应,因为某些原因对数据进行了修整和内插处理,在这样的数据序列中就会有序列相关。,例如,将月度数据调整为季度数据,由于采用了加合处理,修匀了月度数据的波动,使季度数据具有平滑性,这种平滑性产生序列相关。对缺失的历史资料,采用特定统计方法进行内插处理,使得数据前后期相关,产生了序列相关。,原因3数据处理造成的相关,许多农产品的供给呈现为蛛网现象,供给对价格的反应要滞后一段时间,因为供给需要经过一定的时间才能实现。如果时期t的价格Pt低于上一期的价格Pt-1,农民就会减少时期t+1的生产量。如此则形成蛛网现象,此时

18、的供给模型为:,蛛网现象是微观经济学中的一个概念。它表示某种商品的供给量受前一期价格影响而表现出来的某种规律性,即呈蛛网状收敛或发散于供需的均衡点。,原因4蛛网现象,原因5模型设定偏误,而建立模型时,模型设定为:,例如,应该用两个解释变量解释Y,即:,则X3t对Yt的影响在式(5.4)中便归入随机误差项ut中,由于X3t在不同观测点上是相关的,这就造成了ut在不同观测点是相关的,呈现出系统模式,此时ut是序列相关的。,(5.3),(5.4),如果模型中省略了某些重要的解释变量或者模型函数形式不正确,都会产生系统误差,这种误差存在于随机误差项中,从而带来了序列相关。由于该现象是由于设定失误造成的

19、序列相关,因此,也称其为虚假序列相关。,模型形式设定偏误也会导致序列相关现象。如将U形成本曲线设定为线性成本曲线,则必定会导致序列相关。由设定偏误产生的序列相关是一种虚假序列相关,可通过改变模型设定予以消除。 序列相关关系主要存在于时间序列数据中,但是在横截面数据中,也可能会出现序列相关,通常称其为空间序列相关(Spatial auto correlation)。,三、序列相关的表现形式,序列相关的性质可以用序列相关系数的符号判断序列相关的方向,即 0为正相 关。当| |接近1时,表示相关的程度很高。但序列相关是u1,u2,un序列自身的相关,因n个随机误差项的关联形式不同而具有不同的序列相关

20、形式。序列相关大多出现在时间序列数据中。,对于样本观测期为n的时间序列数据,可得到总体回归模型(PRF)的随机误差项为u1,u2,un,如果序列相关形式为,ut =ut-1 + vt -1 1,其中 为序列相关系数,vt 为经典误差项,即E(vt) = 0,Var (vt) =2,Cov (vt,vt+s) = 0,s0。则式(5.5)称为一阶自回归模式,记为AR (1)。因为模型(5.5)中ut-1是ut 滞后一期的值,因此称为一阶。式(5.5)中的也称为一阶序列相关系数。,(5.5),如果式(5.5)中的随机误差项vt不是经典误差项,即vt中包含有ut的成份,如包含有ut-2则需将ut-2

21、显含在回归模型中,其为,ut = 1ut-1+2ut-2 +vt,(5.6),其中,1为一阶序列相关系数, 2为二阶序列相关系数, vt是经典误差项。式(5.6)称为二阶自回归模式,记为AR(2)。一般地,如果u1,u2,ut之间的关系为,(5.7),其中,vt 为经典误差项。则称式(5.7)为m阶自回归模式,记为AR(m)。 在经济计量分析中,通常采用一阶自回归形式,即假定自回归形式为一阶自回归AR(1)。,第二节 序列相关的后果,序列相关的后果,对参数估计的影响,对模型检验的影响,对模型预测的影响,一、对参数估计的影响,在有序列相关的条件下,仍然使用普通最小二乘法将低估估计量 的方差 。

22、将低估真实的 。,对于一元线性回归模型:,(5.8),(5.9),其中, 为现期随机误差, 为前期随机误差。 是经典误差项,满足零均值 ,同方差 ,无序列相关 的假定。,假定随机误差项u存在一阶序列相关:,(5.10),将随机误差项 的各期滞后值:,逐次代入式(5.9)可得:,式(5.10)表明随机误差项 可表示为独立同分布的随机误差序列 , , , 的加权和,权数分别为1, , ,当01时,这些权数是随时间推移而呈几何衰减的;而当-1 0),所以 与 不 相关,即有 。因此,由式(5.9)可得随机误差项 与其以前各期 的协方差分别为:,(5.14),(5.15),(5.16),这些协方差分别

23、称为随机误差项 的一阶自协方差、二阶自协方差和 k 阶自协方差。,对于一元线性回归模型(5.8),当 u 为经典误差项时,普通最小二乘估计量 的方差为:,以此类推,可得 :,当式(5.8)的随机误差项u有序列相关时, 依然是无偏的,即 ,这一点在普通最小二乘法无偏性证明中可以看到。因为,无偏性证明并不需要 u 满足无序列相关的假定。那么,最小二乘估计量 是否是有效的,即在所有线性无偏估计量中方差最小呢?下面我们将以说明。,式(5.8)中的最小二乘估计量为,(5.17),因此:,(5.18),当存在序列相关时,普通最小二乘估计量不再是最佳线性无估计量,即它在线性无偏估计量中不是方差最小的。在实际

24、经济系统中,通常存在正的序列相关,即0,同时X 序列自身也呈正相关,因此式(5.18)右边括号内的值通常大于0。因此,在有序列相关的条件下,仍然使用普通最小二乘法将低估估计量 的方差 。 将低估真实的 。,二、对模型检验的影响,对模型检验的影响,考虑序列相关时的检验,忽视序列相关时的检验,(一)考虑序列相关时的检验,由于 并不是所有线性无偏估计量中最小的,使用t 检验判断回归系数的显著性时就可能得到错误的结论。,t 检验的统计量为,由于 的错误夸大,得到的t 统计量就可能小于临界值 ,从而得到参数 不显著的结论。而这一结论可能是不正确的。,(二)忽视序列相关时的检验,如果我们忽视序列相关问题依

25、然假设经典假定成立,使用 ,将会导致错误结果。,当 0,即有正相关时,对所有的j 都有 0。另外回归模型中的解释变量在不同时期通常是正相关的,对于xt和xt+j来说 是大于0的。,因此,由式(5.18)可以看出,普通最小二乘法的方差 通常会低估 的真实方差。当 较大和t 有较强的正序列相关时,普通最小二乘估计量的方差会有很大偏差,我们会夸大估计量的估计精度,即得到较小的标准误。,因为 的标准误是 的标准差的估计值,在有序列相关时,普通最小二乘估计 的标准误就不可靠了。,一个被低估了的标准误意味着一个较大的t 统计量。因此,当0时,通常t 统计量都很 大。这种有偏的t 统计量是不能用来判断回归系

26、数的显著性的。 综上所述,在序列相关情形下,无论考虑序列相关,还是忽视序列相关,通常的回归系统显著性的t 检验都将是无效的。 类似地,由于序列相关的存在,参数的最小二乘估计量是无效的,使得F 检验和 检验也是不可靠的。,三、对模型预测的影响,模型预测的精度决定于抽样误差和总体误差项的方差 。抽样误差来自于对 的估计,在序列相关情形下, 的方差的最小二乘估计变得不可靠,由此必定加大抽样误差。同时,在序列相关情形下,对 的估计 也会不可靠。由此可看出,影响预测精度的两大因素都会因序列相关的存在而加大不确定性,使预测的置信区间不可靠,从而降低预测的精度。,一、图示检验法,图示法是一种直观的诊断方法,

27、它是把给定的回归模型直接用普通最小二乘法估计参数,求出残差项et ,et作为ut随机项的真实估计值,再描绘et 的散点图,根据散点图来判断et的相关性。残差et的散点图通常有两种绘制方式 。,第三节 序列相关的检验,绘制et-1 ,et 的散点图。用(et-1 ,et )(t = 1,2,n)作为散布点绘图,如果大部分点落在第、象限,表明随机误差项ut存在着正序列相关,如图5.1所示。,如果大部分点落在第、象限,那么随机误差项ut 存在着负序列相关,如图5.2所示。,按照时间顺序绘制回归残差项 et 的图形。如果et (t=1,2,n)随着t 的变化逐次有规律地变化,呈现锯齿形或循环形状的变化

28、,就可断言 et存在相关,表明存在着序列相关;如果et随着t的变化逐次变化并不断地改变符号,那么随机误差项ut存在负序列相关;如图5.3所示。,如果et随着t的变化逐次变化并不频繁地改变符号,而是几个正的et后面跟着几个负的,则表明随机误差项存ut 在正序列相关,如图5.4所示。,二、DW检验法,DW检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951年提出的一种适用于小样本的检验方法。DW检验只能用于检验随机误差项具有一阶自回归形式的序列相关问题。这种检验方法是建立经济计量模型中最常用的方法,一般的计算机软件都可以计算出DW值。,(5.20),(5.21),(5.22),

29、随机误差项的一阶自回归形式为:,为了检验序列的相关性,构造的原假设是:,为了检验上述假设,构造DW 统计量首先要求出回归估计式的残差et 定义DW统计量为 :,DW值的取值范围,在认为:,则:,(5.23),(5.24),由于,表 5.1,因此, 。所以,DW 值与 的对应关系如表5.1所示。,由上述讨论可知DW的取值范围为:DW,根据样本容量 n 和解释变量的数目k(不包括常数项)查DW分布表,得临界值 dL 和 dU ,然后依下列准则考察计算得到的DW值,以决定模型的序列相关状态。,表5.2 DW 检验决策规则,图5.5 DW 检验示意图,表5.2可以用坐标图更加直观地表示出来:,需要注意

30、的是,DW检验尽管有着广泛的应用,但也有明显的缺点和局限性。, DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。这时,只有增大样本容量或选取其他方法;, DW统计量的上、下界表要求n15,这是因为样本如果再小,利用残差就很难对序列相关的存在性做出比较正确的诊断; DW检验不适应随机误差项具有高阶序列相关的检验; 只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量。,第四节 序列相关的修正,对于虚假序列相关,由于是模型设定偏误造成的,只能通过改变模型的设定去消除。对于设定正确的模型,如随机误差项有序列相关,则为真实的序列相关。对于真实的序列相关可采用如下方法予以消

31、除。,广义差分法,Cochrane Orcutt迭代法,其它方法 :一阶差分法 德宾两步法,广义差分法,对于序列相关的结构已知的情形可采用广义差分法解决。,由于随机误差项ut是不可观测的,通常我们假定ut为一阶自回归形式,即 ut =ut-1 + vt(5.25) 其中,|1,vt为经典误差项。 当序列相关系数为已知时,使用广义差分法,序列相关问题就可彻底解决。我们以一元线性回归模型为例说明广义差分法的应用。,对于一元线性回归模型,(5.26),将模型(5.26)滞后一期可得,(5.27),用 乘式(5.27)两边,得,(5.28),用式(5.26)减去式(5.28)可得,(5.29),模型,

32、随机误差项无序列相关。式(5.29)中,utut-1 = vt 是经典误差项。因此,模型(5.29)已经是经典线性回归,令,则式(5.29) 可表示为:,(5.30),对模型(5.30)使用普通最小二乘估计就会得到参数估计的最佳线性无偏估计量。,式(5.29)称为广义差分方程,因为被解释变量与解释变量均为现期值减去前期值的一部分,由此而得名。,在进行广义差分时,解释变量X与被解释变量Y 均以差分形式出现,因而样本容量由n减少为n1,即丢失了第一个观测值。如果样本容量较大,减少一个观测值对估计结果影响不大。但是,如果样本容量较小,则对估计精度产生较大的影响。此时,可采用普莱斯温斯滕(Prais-

33、Winsten)变换,将第一个观测值变换为,补充到差分序列 中,再使用普通最小二乘法估计参数。,第六章多重共线性,第一节 多重共线性的定义,一、多重共线性的含义 在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括完全的多重共线性,还包括不完全的多重共线性。 如果存在不全为0的数 , 使得则称解释变量 之间存在着完全的多重共线性。当Rank(X)k时,表明在数据矩阵X中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。,对于解释变量,不完全的多重共线性,实际中,常见的情形是解释变量之间存在不完全的多重共线性。,对于解释变量,,存在不全为0的数

34、,,使得,为随机变量。这表明解释变量,只是一种近似的线性关系。,其中,回归模型中解释变量的关系,可能表现为三种情形:,(1),,解释变量间毫无线性关系,变量间相互正交。这时已不需要作多元回归,每个参数j都可以通过Y 对 Xj 的一元回归来估计。,,解释变量间完全共线性。此时模型参数将无法确定。,,解释变量间存在一定程度的线性关系。实际中常遇到的情形。,(2),(3),二、产生多重共线性的原因,多重共线性产生的经济原因主要有几种情形: 1、经济变量之间具有共同变化趋势。 2、模型中包含滞后变量。 3、利用截面数据建立模型也可能出现多重共线性。 4、样本数据自身的原因。,第二节 多重共线性产生的后

35、果,一、完全多重共线性产生的后果1、参数的估计值不确定当解释变量完全线性相关时 OLS 估计式不确定 从偏回归系数意义看:在 和 完全共线性时,无法 保持 不变,去单独考虑 对Y的影响(和 的影响不可区分) 从OLS估计式看:可以证明此时2、参数估计值的方差无限大OLS估计式的方差成为无穷大,二、不完全多重共线性下产生的后果,如果模型中存在不完全的多重共线性,可以得到参数的估计值,但是对计量经济分析可能会产生一系列的影响。 1、参数估计值的方差增大 当 增大时 也增大 2、对参数区间估计时,置信区间趋于变大 3、假设检验容易作出错误的判断 4、可能造成可决系数较高,但对各个参数单独的 t 检验

36、却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。,第三节 多重共线性的检验,一、简单相关系数检验法含义:简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种简便方法。判断规则:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,例如大于0.8,则可认为存在着较严重的多重共线性。注意事项:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。,二、方差扩大(膨胀)因子法,含义:,统计上可

37、以证明,解释变量,的参数估计值,的方差可表示为,其中的,是变量,(Variance Inflation Factor),即,的方差扩大因子,其中 是多个解释变量辅助回归的可决系数,经验规则,方差膨胀因子越大,表明解释变量之间的多重共线性越严重。反过来,方差膨胀因子越接近于1,多重共线性越弱。经验表明,方差膨胀因子10时,说明解释变量与其余解释变量之间有严重的多重共线性,且这种多重共线性可能会过度地影响最小二乘估计。,三、直观判断法,(1)当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归方程可能存在严重的多重共线性。 (2)从定性分析认为,一些重要的解释变量的回

38、归系数的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能存在严重的多重共线性。 (3)有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。 (4)解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。,四、逐步回归检测法,逐步回归的基本思想 将变量逐个的引入模型,每引入一个解释变量后,都要进行检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。 在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 经济财会 > 经济学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报