1、1计量经济学讲义 第三章:复回归分析1、K 变量线性回归模型一、K 变量线性回归模型的数学形式1、总体形式: uXYk21总体参数: k, ,问:E(Y|X 2,X k)?2、样本形式: iikii uY21n 个样本点, nknnkn uXY 2121121 矩阵形式: 11knuX二、古典假定1、 0)(iuE2、 )( 2jiji当当3、 ),0(Nui4、X 2,X k 非随机;5、X nk无多重共线性2、OLS 估计1、SRM:样本回归模型 uXY样本回归超平面 残差向量 2、OLS(1)问题的提出 uXYYuni ni ikiiiini )()(11 221212 (2)原理22m
2、in minii1XYXYuuni 3、正规方程组(1)求解形式: (2)残差形式: 0u(3)几何意义: 0,11 uXXkk特别地,由 得,01ui4、样本回归超平面的特性(1) XY(2)(3) 0u几何意义: uY5、 的统计特性(1)线性性:因为, =YX)(1所以, 是 的线性组合;in,1因为, = = =)(uX)(1 uX)(1所以, 是 线性组合。inu,1(2)无偏性: )(E(3)最佳性(最小方差): 12)()(XVar(4)正态性: ,(12N注: 是 E(Y)的 BLUE,而不是 Y 的 BLUE。Y3、 的估计23一、 的估计量22,其中 k 为变量个数,n 为
3、样本个数。 是可计算的。nu u二、 是 的无偏估计量2即,E( ) ,或 E( )= 。2knu2三、Var( )的估计值Var( )的估计值 ;12)(XVar( )的估计值i i的标准差的估计值为,S( )i ii1)(4、拟合优度检验一、平方和公式1、公式:检验样本回归超平面 对观测点的拟合程度XY= +yu其中, = - ; = - , 是元素为 1 的 n 维列向量。yYiyi2、方差分析表SS 自由度 MSS回归平方和 解释变差, yk-1 /(k-1)y残差平方和 未解释变差, un-k /(n-k)u总回归平方和 总变差, n-1二、可决系数 2R1、取定样本,则 固定;取定
4、方法(OLS) ,则 ( )固定。y y=2R为解释变量与变差的百分比。2R2、 范围 10当 1 时, =0, = ,样本回归超平面通过所有观测点;2uY当 0 时, =0, ,为最差的情况。Ry3、 检验4以上程度通过;3.02R一般要求 9三、调整可决系数 2R1、定义:=121/nyku计算公式:=1-(1- )2R2k2、 引入调整可决系数 的目的:2添加解释变量,则 增加。调整可决系数 考虑了自由度,其并不简单地随着解释变量2个数的增加而增大,当变量个数增加到一定程度时,它将开始下降,如图所示。(1)k 增加使得 增加,从而 增加;2R2(2)k 增加,使得 减少。3、 范围: ,
5、当 , 。2n2R5、单参数显著性检验一、检验的假设H0: 0;H 1: 0。ii当拒绝 H0,接受 H1,这时 显著地异于 0, 在统计上可靠,表明 Xi对 Y 的影响显ii著,X i引入正确。二、检验统计量1、t 变量:由 知,)(,12XN)(,12iii XN因此, N(0,1)ii1)(但 不知,故用其统计量 代替,这时上述统计量服从自由度为 n-k 的 t 分布:2R1K 变量个数2R1K 变量个数5t(n-k)iiiXt1)()(2、检验统计量当 H0: 0 为真,it(n-k)iiiXt1)()((无偏估计量除以无偏估计量标准差的估计量)三、检验步骤1、设定显著性水平: 0.0
6、5 或 0.01 等;2、取样本,计算检验统计量3、查 t 分布表,得临界值 )(2knt4、判断:如果| | (双尾检验) ,则拒绝;)(it)(2t(当| | ,表明小概率事件发生,即“H 0为真”是小概率,因此拒绝iknH0)如果| | F (q,n-k),则拒绝 H0。五、特例1、单参数 t 检验:(1)假定H0: =0;H 1: 0。ii令 R(0,0,1,0,0),r=0, (2)检验统计量 ikr 0)10( 1 111 )(0)()( iXXRX )()(/)( 2121 iiiiii tknuF7注:对单参数检验,F 检验与 t 检验等价。(3)总显著性检验:(1)假定H0:
7、 02kH1:至少一个不等。令 R(0,I k-1),r=(0),(2)检验统计量 ),1(1/2knFknRknuyF7 置信区域一、问题的估计值是 的点估计值,现在要问 的区间估计。ii i1、区间 rii|2、置信区间:样本随机,=0.05,由 构造的置信区间(随机)以 95的概率包含 。意思是说,如i i果有 100 个这样的随机置信区间,则有 95 个区间包含 。i3、根据同时讨论的参数个数,置信区域分为以下几种情况:的个数 置信区域的名称一个 区间两个 椭圆三个 椭球N 个(N3) 超椭球二、单参数 的置信区间i中心: (无偏估计量)i半径: ,)()2/kntse其中 ,1iiX
8、knu2三、总体参数的置信区域由于, ),(/)()()(1 knqFuRRF 将 F 改写为, )()(/)()()(1 ZknX8其中, 为正定阵。knuRXRZ/)(1由 得到的置信区域:),(qFPk这是一个以 为中心的超椭球。8 预测一、时间轴的分段1、样本期:已知 X、Y(观测值) ,由 OLS 可以得到 (拟合值)XY2、事后期:预测能力检验;3、事前期:进行预测。二、预测假定F事前期1、Y F 1XF1 2XF2+kXFku F (PRM 在 F 点成立)2、古典假定在 F 处成立。3、SRM: k14、已知 XF1,X F2,X Fk,预测 YF。三、均值预测(E(Y F))1、点预测: 1FkXY2、区间预测:中心: FY半径: )()(2/1kntF四、个值预测(Y F)1、点预测: X2、区间预测:中心: FY半径: )()(12/1kntXF1952 97 98 99 2000 2002事后期样本期当期事前期(未来)9五、预测能力检验1、t 检验:f事后期 )(kntSYtff fff X11当 ,预测能力差;|ft)(2/kn当 ,预测能力好。|f/2、相对误差:, f事后期ffY当 10%,可以接受。|f