1、2.2 什么是总体回归函数和样本回归函数?它们之间的区别是什么?定义:总体回归函数:将总体被解释变量 Y 的条件均值表示为解释变量 X 的某种函数,这个函数称为总体回归函数。样本回归函数:把被解释变量 Y 的样本观测值的条件均值表示为解释变量 X 的某种函数,这个函数称为样本回归函数。区别:总体回归函数:函数的参数虽未知,但是是确定的常数;是不可直接观测的i样本回归函数:随抽样波动而变化,可以有很多条;只是未知总体回归线的近似表现;函数的参数可估计,但是是随着抽样波动而变化的随机变量;是只要估计出样本回归函数的参数就可以计算的数值ie2.3 什么是随机扰动项和剩余项(残差)?它们之间的区别是什
2、么?定义:随机扰动项:总体回归函数 E(Y X i)表述的是被解释变量 Y 随着解释变量 X 的变化而呈现的平均变动。但是对于确定的 Xi,其对应的 Yi 值并不一定唯一,即 Yi 不一定全部等于 E(YX i) ,而是落于 Y=Xi 这条直线上。这个时候 Yi 与 E(YX i)之间会产生一定的偏差,我们把这个偏差称为随机扰动项剩余项(残差):由于总体的 Y 的均值 E(Y X i)未知,通常我们关心的是估计量 与实际量 Yi 之间的差异,记 =Yi- ,则称 为残差,残差又i ieiie称作为对总体中随机扰动项 的估计i区别:随机扰动项: 是观察值 Yi 围绕它的期望值 E 的离差,是一个
3、不可观测的随机变i量;是残差项,代表了其他影响 Yi 的随机因素的集合。ie是相对整体而言的,是整体模型的随机扰动项;是相对样本而言的,是样本的残差项。i3.2 什么是偏回归系数?它与简单线性回归的回归系数有什么不同?偏回归系数:在多元线性回归模型中,回归系数 (j=1,2,k)表示的是当控制其他解释j变量不变条件下,第 j 个解释变量的单位变动对被解释变量平均值的影响,这样的回归系数称为偏回归系数。区别:1.偏回归系数是多元线性回归2.偏回归系数由一个增加到了多个3.考察其中某个解释变量对 Y 的影响,必须使其他解释变量保持不变。3.3 多元线性回归中的古典假定与简单线性回归时有什么不同?多
4、元线性回归与简单线性回归的模型和随机扰动项均要满足:1.零均值假定2.同方差和无自相关性假定3.随机扰动项与解释变量不相关假定4.正态性假定但多元线性回归同时还要满足无多重共线性假定,是说各解释变量之间不存在线性关系。4.1 多重共线性的实质是什么?为什么会出现多重共线性?多重共线性的实质:就是解释变量之间存在高度的线性相关性。产生多重共线性的原因(背景):1. 经济变量之间具有共同变化趋势2. 模型中包含滞后变量3. 利用截面数据建立模型也可能出现多重共线性4. 样本数据自身的原因4.3 多重共线性的典型表现是什么?判断是否存在多重共线性的方法有哪些?多重共线性的典型表现:1.运用普通最小二
5、乘法得到的回归参数估计值很不稳定,回归系数的方差随着多重共线性强度的增加而加速增长,对参数难以做出精确的估计2.当解释变量之间高度相关时,回归方程中的解释变量就会相互削弱各自对 Y 的编辑影响,使本身的回归系数的数值下降而其标准误差扩大,于是就会出现回归方程整体显著,但各个解释变量都不显著的现象3.回归系数反号多重共线性的判定方法:1.简单相关系数检验法2.方差扩大(膨胀)因子法3.直观判断法4.逐步回归检测法5.4 产生异方差的原因是什么?产生异方差的原因:1.模型设定误差2.样本数据测量误差的变化3.截面数据中总体各单位的差异4.随机因素的影响6.1 如何使用 DW 统计量来进行自相关检验?该检验方法的前提条件和局限性有哪些?(1)DW 检验的主要步骤:提出假设 ,即不存在(一阶)自相关性; ,即存在(一阶)0:H0:1H自相关性。构造检验统计量:DW= 。nttte121)(检验自相关性。(2)应用条件:解释变量 X 为非随机的;随机项 满足一阶自回归形式,即 , 为误差项,且itttu1t满足古典假定;线性回归模型中不含滞后的被解释变量;只适用于有常数项的回归模型;数据序列无缺失项(3)局限性: 方法的应用有前提条件;统计量的上、下界表一般要求 n15;不适应随机误差项具有高阶序列相关的检验;有两个不能确定的区域。