1、第三节 回归模型的统计检验,对于样本回归模型拟合总体模型,我们通常要进行经济检验、统计检验、计量检验等。 统计检验则是在一定概率下求出参数,检验样本对总体的代表性、影响关系是否显著等问题。主要通过一些统计检验方法来保证模型在统计意义上(即以样本推断总体)的可靠性。 我们所要进行的统计检验包括两方面,一方面检验回归方程对样本数据的拟合程度,通过可决系数;另一方面检验回归方程的显著性,通过假设检验对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出判断,包括对回归方程线性关系的检验和对回归系数显著性的检验。,一、模型的拟合优度检验,所谓拟合优度,即模型对样本数据的近似程度。由于实际观
2、察得到的样本数据是对客观事实的一种真实反映,因此,模型至少应该能较好的描述这一部分客观实际情况。为了考察模型的拟合优度,需要构造一个指标判定系数(可决系数)。 认识判定系数之前让我们回顾一下关于样本与总体回归函数,了解总离差分解。,总变差的分解,设估计的多元线性回归模型为:分析Y的观测值、估计值和平均值的关系因为 ,将上式两边平方加总,可证得,SRF,TSS为总体平方和(Total Sum of Squares),反映样本观测值总体离差的大小;ESS为回归平方和(Explained Sum of Squares),反映由模型中解释变量所解释的那部分离差的大小;RSS为残差平方和(Residua
3、l Sum of Squares),反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。TSS=RSS+ESS,2、拟合优度检验统计量:可决系数(判定系数)R2和校正可决系数,判定系数不仅反映了模型拟合程度的优劣,而且有直观的经济含义:它定量地描述了y的变化中可以用回归模型来说明的部分,即在被解释变量的变动中,由模型中解释变量所引起的比例。 见前一节例题,解释意义 判定系数的特点: 判定系数取值范围0,1。 随抽样波动,样本判定系数是随抽样而变动的随机变量。 判定系数是非负的统计量。,判定系数与相关系数的关系,联系:数值上判定系数是相关系数的平方。 区别: 前者就模型
4、而言,后者就两个变量而言。 前者说明解释变量对被解释变量的解释程度,后者说明两变量线性依存程度。 前者度量的不对称的因果关系,后者度量的不含因果关系的对称相关关系。 前者取值0,1非负,后者取值-1,1,可正可负。,注意的问题,判定系数只是说明列入模型的所有解释变量对被解释变量的联合的影响程度,不说明模型中每个解释变量的影响程度(在多元中) 回归的主要目的如果是经济结构分析,不能只追求高的判定系数,而是要得到总体回归系数可信的估计量。判定系数高并不一定每个回归系数都可信。 如果建模的目的只是为了预测被解释变量值,不是为了正确估计回归系数,一般可考虑有较高的判定系数。,补充:关于假设检验(在进行
5、F/T统计检验之前),假设检验是统计推断的一个主要内容,它的基本任务是根据样本所提供的信息,对未知总体分布的某些方面的假设作出合理的判断。 假设检验的程序是,先根据实际问题的要求提出一个论断,称为统计假设;然后根据样本的有关信息,对假设的真伪进行判断,作出拒绝或接受假设的决策。 假设检验的前提是知道所估计的样本回归系数概率分布性质,即对总体回归系数某种原假设成立时。 假设检验的基本思想是概率性质的反证法。 概率性质的反证法的根据是小概率事件原理,该原理认为“小概率事件在一次试验中几乎是不可能发生的,如果该小概率事件竟然发生了,就认为原假设不正确,而拒绝原假设,不拒绝备则假设”。 下面讲授的模型
6、的显著性检验及解释变量的显著性检验都基于此基础。,二、模型的显著性检验,所谓模型的显著性检验,就是检验模型对总体的近似程度,而且最常用的检验方法是F检验。 1.F检验的思想 F检验的思想来自于总离差平方和的分解式:TSS=ESS+RSS 由于回归平方和ESS是解释变量X联合体对被解释变量Y的线性作用的结果,所以,如果ESS/RSS的比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。 因此,可通过该比值的大小对总体线性关系进行推断。,进一步根据数理统计学中的定义,如果构造一个统计量,则该统计量服从自由度为(k,n-k-1)的F分布。,F检验与R2的关系
7、,根据二者关系,有需注意的几个问题: F检验实际上也是判定系数的显著性检验。 如果模型对样本有较高的拟合优度,F检验一般都能通过。 实际应用中不必过分苛求R2值的大小,重要的是考察模型的经济意义是否合理。,见书例题,三、解释变量的显著性检验,解释变量显著性检验即对回归系数的显著性进行检验,如果变量是显著的,那么回归系数应该显著地不为0。于是,在变量显著性检验中设计的原假设为: H0:i=0 而备择假设为: H1: i0 其中 的下角标i,在一元回归模型中取值1: 在二元回归模型中取值1、2。,然后根据样本观测值和估计值,构造计算统计量:,用P值判定参数的显著性,假设检验的p值p值是根据既定的样本数据所计算的统计量,拒绝原假设的最小显著性水平。统计软件中(EViews,SPSS,SAS)通常都给出了检验的p值。 方法:将给定的的显著性水平与p值比较: 若p, 则在显著性水平下拒绝原假设H0,即认为X对Y有显著影响。 若=p, 则在显著性水平下接受原假设H0,即认为X对Y没有显著影响。 规则:当p 时,p值越小,越能拒绝原假设H0。,案例2.4,p45,