1、1 回归分析是研究一个变量关于另一个(些)变量的统计依赖关系的计算方法和理论。其用意在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。6 建立模型:理论模型的设计 样本数据收集模型参数的估计模型的检验模型应用7 线性回归模型的基本假设: 解释变量 X1,X2,Xk 是确定性变量,不是随机变量,并且解释变量之间互不相关 随机误差项具有 0 均值和同方差 随机误差项在不同样本点之间是独立的,不存在序列相关。即: 随机误差项与解释变量之间不相关。 随机误差项服从 0 均值、同方差的正态分布8 一元线性回归模型221 220)(iiii iiXnYXYxyi10219 一元样本回归线的
2、性质 样本回归线通过 Y 和 X 的样本均值。01011|)i iiiiiiiiiiiYXueXye一 、 计 量 模 型 与 函 数总 体 回 归 函 数 : E(总 体 回 归 模 型 :样 本 回 归 函 数 :样 本 回 归 模 型 :离 差 形 式 :样 本 回 归 函 数 :样 本 回 归 模 型 : 011222201 2200 1iiii i iiii iYXxyxYyxxYXeyexnyESRSRT i二 、 ( )正 则 方 程残 差 的 组 ( )最 小 二 乘 估 计最 小 二 乘 估量 :可 决 系 质 量性 计数 21ieTy证明:因为 XY10,即 X10 估计的
3、 Y 的均值等于实测的 Y 的均值)(110XYiiii由于 0iYnXiii1)(1(3)残差的均值为零。由正则方程 0)(110iiniXY得0)(110iniXY即 ie所以 iien(4)残差和预测的 Yi 不相关 0iy(5)残差与 Xi 不相关。有正则方程可知0)(110iini XY所以 0ie10 一元线性回归中线性性、无偏性、有效性证明令 2iixk则 iiiiiYkxYy22221 )(令 iiXnw1则iiiiYwkXnXkY)1(0估计量的均值(期望值)等于总体回归参数真值,即 01)(E易知02iiixk1iXki11 1111 )()()( iiii EkkEE同样
4、地能够得出 0000 )()()()( iii wEw有效性(最小方差性在所有线性无偏估计量中,最小二乘估计量具有最小方差。 21)var(ix20)var(ixnX)var()r(ar( 21021 iiiiii kkYk 22iix 21020 )/1()var()var()var( iiiii kXnXwY2222 11 iiii xkXnkXn11),(21ixN),(200ixnXN2nei12 回归平方和 22YyESii残差平方和 )(iieR总离差平方和22yTii13 SE1214 一元线线回归模型中 1)( 22 ii ststPiii15 要缩小置信区间,需(1)增大样本容量 n,因为在同样的置信水平下,n 越大,t 分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小。(t 统计量和标准差 S 都随 n 的增大而减小)(2)提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。16 多元线性回归模型的基本假定假设 1:解释变量是非随机的,且各 X 之间相互独立假设 2:随机误差项具有零均值、同方差及不序列相关性假设 3:解释变量与随机项不相关 假设 4:随机项满足正态分布17正则方程组18 YXB1)(19线性性 C无偏性 BNEXXYB)()()()11有效性(最小方差性