1、计量经济第四章回归模型中的随机误差项问题第四章 回归模型中的随机误差项问题第一节 概述第二节 异方差第三节 自相关山东财经大学统计学院计量经济教研室第一节 概 述一、古典假定假定 1:随机项 ui 具有零均值:E(ui|xi)=0 i=1,2, , n假定 2:随机项 ui 具有同方差:Var (ui|xi)=?u2 i=1,2, , n假定 3:随机项 ui 无序列相关性:Cov(ui , uj)=0 ij i,j= 1,2, , n假定 5:u 服从正态分布ui N(0, ?u2 ) i=1,2, , n山东财经大学统计学院计量经济教研室有了以上这些假定,根据高斯马尔可夫(Gauss-Ma
2、rkov)定理,我们知道古典回归模型的最小二乘估计量(OLSE)是线性最优无偏估计量(BLUE),而且服从正态分布。因此,就可以进行参数的区间估计,而且也可以检验真实总体回归系数的显著性。山东财经大学统计学院计量经济教研室二、古典假定的违背及造成的后果在实际经济问题中,上述的古典假定不一定都能得到满足。如果这些假定不完全满足,则 OLSE 的 BLUE 特性将不复存在。当然,每一个假定不满足所造成的后果是不同的。在本章中,我们将严格考察上述假定,找出如果有一个或多个假定得不到满足时,估计量的性质将会发生什么变化 ,并研究当出现这些情况时,应该如何处理,即古典模型假定违背的经济计量问题。 山东财
3、经大学统计学院计量经济教研室关于假定 1,一般地我们认为假定 E(ui|xi)=0 是合理的。因为随机项u 是多种因素的综合,而每种因素的影响都“均匀”地微小,它对因变量的影响不是系统的,且正负影响相互抵消,故所有可能取值平均起来为零。即使有轻度的违反,从实践的观点来看可能不会产生严重的后果,因为它可能只影响回归方程的截距项 。关于随机项正态性分布的假定,如果我们的目的仅仅是估计,这种假定并不是绝对必要的。事实上,无论是否是正态分布,OLSE 估计式都是 BLUE。剩下的四个假定将在下面的四节中分别加以讨论。山东财经大学统计学院计量经济教研室三、广义最小二乘法(GLS)给定线性回归模型Y =
4、X + u (4.7) 若古典假定完全满足,根据 Gauss-Markov 定理,其系数的最小二乘估计量B (XX) 1 XY (4.8)具有 BLUE 性质。若古典假定得不到完全满足,特别是假定 2(同方差性)和假定 3(无序列相关性)得不到满足时,对 OLSE 的影响更大。山东财经大学统计学院计量经济教研室使得其中的 重新满足假定 2(同方差性)和假定 3(无序列相关性)。这样就可以对上式使用 OLS 估计参数,从而使得上式的 OLSE 仍然为 BLUE。其中 I, 是一个 nn 的正定对称方阵。若因假定 2 和假定 3 不满足时,有广义最小二乘法(General Least Square
5、sGLS)就是为了解决上述问题提出的。其基本思路是:若假定 2 同方差性)和假定 3(无序列相关性)得不到满足时,我们可以采取适当的变换,使原模型变为以下的形式:山东财经大学统计学院计量经济教研室此时可以觅得一个 nn 的非奇异矩阵 P,使得:P P=I 即 P P = -1 然后用觅得的 P 乘以(4.7)的两边,有:PY=PX+Pu 记(4.7)就转换为:由于:(4.14)山东财经大学统计学院计量经济教研室所以,(4.14) 满足同方差性和无序列相关性,即可以采用 OLS 估计参数了。其参数的 OLSE 为:GLSE 的协方差矩阵为:上式中的 称为广义最小二乘估计量(GLSE) ,可以证明
6、,它具有线性、无偏性和最小方差性,即它是最优线性无偏估计量(BLUE)(4.16)山东财经大学统计学院计量经济教研室第二节 异 方 差 一、异方差及其产生的原因则称随机误差项 u 具有异方差性(Heteroscedasticity)。如果被解释变量观测值的分散程度是随解释变量的变化而变化的,如图4.1 所示,可以把异方差看成是由于某个解释变量的变化而引起的,则当不能满足同方差的假设,即 u 的条件方差在不同次的观测中不再是一个常数,而是取得不同的数值,即 山东财经大学统计学院计量经济教研室图 4.1 异方差示意图 xyf (y)山东财经大学统计学院计量经济教研室异方差举例例:截面资料下研究居民
7、家庭的储蓄行为yi = ?0 + ?1 xi + uiyi:第 i 个家庭的储蓄额 xi:第 i 个家庭的收入高收入家庭:储蓄的差异较大低收入家庭:储蓄则更有规律性,差异较小ui 的方差呈现单调递增型变化山东财经大学统计学院计量经济教研室yx图 4.2 收入-储蓄模型中的异方差 山东财经大学统计学院计量经济教研室例: 以某一行业的企业为样本建立企业生产函数模型Q = A KL? eu其中,Q 为产出量,K 为资本,L 为劳动力,u 为随机项。u 在该问题中表示了包括不同企业在设计上、生产工艺上的区别,技术熟练程度和管理上的差别以及其它因素。这些因素在小企业之间差别不大,而在大企业之间,这些因素
8、都相差甚远,即随机项的方差随着解释变量的增大而增大。 山东财经大学统计学院计量经济教研室异方差产生的原因1、模型中省略的解释变量如果将某些未在模型中出现的重要影响因素归入随机误差项,而且这些影响因素的变化具有差异性,则会对被解释变量产生不同的影响,从而导致误差项的方差随之变化,即产生异方差性。 2、测量误差一方面,解释变量取值越大测量误差会趋于增大;另一方面,测量误差可能随时间而变化。3、截面数据中总体各单位的差异如前面家庭储蓄行为中高低收入家庭的差异。 4. 模型函数形式设定错误如把变量间本来为非线性的关系设定为线性,也可能导致异方差。山东财经大学统计学院计量经济教研室注意:异方差问题多在于
9、截面数据中而非时间序列数据中。本教材只讨论横截面数据的异方差问题。山东财经大学统计学院计量经济教研室二、异方差产生的后果最小二乘估计量仍然是线性无偏的,但不再具有最小方差性。参数的显著性检验和置信区间的建立发生困难。 虽然最小二乘法参数的估计量是无偏的,但这些参数方差的估计量、是有偏的。 预测的精确度降低。 山东财经大学统计学院计量经济教研室三、异方差的检验由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式” 。(一)图示法随机项 u 的异方差与解释变量的变化有关。因此,可利用因变量y
10、 与解释变量 x 的散点图或残差 e2i 与 x 的散点图,对随机项 u 的异方差作近似的直观判断。 山东财经大学统计学院计量经济教研室yxyxyxyxA 同方差B 递增异方差C 递减异方差D 复杂异方差山东财经大学统计学院计量经济教研室山东财经大学统计学院计量经济教研室(二)Goldfeld-Quandt 检验该方法该检验方法是 Goldfeld 和 Quandt 于 1965 年提出的,用于检验是否存在递增或递减异方差,要求观测值为大样本。基本思想是将样本分为两部分,然后分别对两个样本进行回归,并计算比较两个回归的剩余平方和是否有明显差异,以此判断是否存在异方差。原假设为:H0:u 同方差
11、,即 721=2n备择假设为: H1:u 是递增异(或递减)方差,即 2i 随 xi 递增(或递减) (i=1,2,n) 山东财经大学统计学院计量经济教研室G-Q 检验的步骤:1.将 n 对样本观察值(xi , yi)按观察值 xi 的大小排队。2.将序列中间的 c 个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2。注意:对于 n30 时,c=n/4 最合适。3.对每个子样分别进行 OLS 回归,并计算各自的残差平方和。分别用 RSS1与 RSS2 表示较小与较大的残差平方和,它们的自由度均为(n-c)/2k1,k为模型中自变量个数。4.选择
12、统计量山东财经大学统计学院计量经济教研室如果检验递增方差: 如果检验递增方差:5.进行检验可以证明,在原假设下,如果具有等方差性,两个方差估计量应该相差不大,F 值就应接近于 1。如果存在异方差,那么 F 值就应该比 1 大出许多。在给定的显著性水平下,利用F 分布的临界值 F 进行显著性检验。当 FF 时,应拒绝 H0,认为存在异方差性,当 F 不大于 F 时,应接受 H0,认为存在同方差性。山东财经大学统计学院计量经济教研室例 4.1 根据随机抽取的21 个农村家庭年底储蓄余额与年内家庭纯货币收入的资料,按收入排序后的数据见下表。其中, x 为年内家庭纯货币收入(元), y 为年底家庭储蓄余额(元) 。10332499.58112095412500.84218712098.25101819611575.48206641890.5891583910448.21195221682.88117589076.85184011357.8778080