1、统计学,叶 思 荣,东 南 大 学 经济管理学院,第 五 章,第六章 相关与回归分析,51 概述,一 经济现象之间的关系,二 相关关系的种类,三 相关与回归分析的程序,52 一元线性回归与相关分析,一 回归方程的由来,二 一元线性回归方程,三 相关系数及其显著性检验,四 一元线性回归的方差分析,五 一元线性回归预测,53 多元线性回归与相关分析,经济现象之间的关系,确定型关系,非确定型关系,相关关系,回归关系,Y=f (X),S=PX,(互为因果关系),(因果关系),S = f (I、C),C = g (I、S),C = f ( I ),程度,完全相关,不完全相关,不相关,方向,正相关,负相关
2、,形式,线性相关,非线性相关,变量的多少,单相关,复相关,偏相关,相关与回归分析的程序:,1、定性分析两个经济变量的相互关系。,2、从一组观察数据出发, 确定这些变量之间的回归关系,即确定回归方程的数学模型。,3、判断影响因变量的自变量的显著性。,4、运用回归方程对客观过程进行分析、预测和模拟控制。,当两个变量有统计相关关系时,对应自变量的每一个值x,因变量Y有许多可能的取值。,(x0,y01),(x0,y02),(x0,y03),(x1,y11),(x1,y12),(x1,y13),为找出X和Y之间的定量关系,一个自然的想法是取X=x0时的所有Y值的平均值(记作 )作为对应X=x0时Y的代表
3、值,即取:,其中 表示在X=x0条件下,Y的条件期望。同理,对应于X=x1,有 =E(Y|X=x1), 。当x变化时, 是x的函数:,人们的消费行为主要取绝与他的收入水平。根据经济学中消费理论,对人们的收入与消费有三种假设:,1、,绝对收入假设,2、,相对收入假设,3、,恒常收入假设,条件,=0,=min,=0,=0,经整理可得:,若记:,则b的计算公式为:,参数b称为样本回归系数,它的符号取决于lxy。显然,当b0时,y随x增大而增大,表明y与x的变化方向相同:当b0时,则y随x增大而变小,表明y与x的变化方向相反。,一般求回归方程是通过列表进行,根据上表统计数据,计算列表如下:,n=31,
4、估计标准误差,人们通常用估计标准误差来说明 与 的差异程度,在大样本时,其公式为:,若 较大,则说明 与 的离差较大,回归直线 的代表性低,若 较小,则说明 与 的离差较小,回归直线 的代表性高,若 =0,则说明 与 的没有离差, 完全落在回归直线上,人们常用相关系数来反映两个变量间线性相关的密切程度,公式为:,相关系数,若 =0,则有| |=1,,若 = ,则有| |=1,,若 ,则有| | 1,,表明两个变量完全相关,表明两个变量完全不相关,表明两个变量不完全相关,Syx=0.247,=1.422,n=31,变量之间相关程度的判断:,弱相关,低度相关,中度相关,高度相关,显然,相关系数和回
5、归系数的符号是一致的。,有 ,,表明两个变量呈正相关关系,有 ,,表明两个变量呈负相关关系,要说明两个变量是否具有线性相关,一般还需要作假设检验,设:,H0:,总体相关系数为0,H1:,总体相关系数不为0,检验统计量为:,可以证明,当H0成立时统计量是服从具有自由度为(1,n-2)的F分布,因而给出显著性水平 (通常 =0.01 或0.05),当FF(1,n-2)时,则拒绝H0,说明两变量之间线性关系是显著的。,当FF(1,n-2)时,则接受H0,说明两变量之间线性关系不显著。,查表得:,FF,所以,拒绝H0,接受H1。说明两个变量之间的线性关系是显著的。,总偏差平方和:,误差平方和:,回归平
6、方和:,可以证明 SST=SSR+SSE 即有:,SSR与SST的比值有以下结果:,方差自由度,方差,自由度,n-1,n-2,1,所以:,显著性检验统计量,以68.27%的概率保证 的预测区间为,以95.45%的概率保证 的预测区间为,以99.73%的概率保证 的预测区间为,一般若 为正态分布,当n较大,并且 不远离 时,可以证明:,X,Y,x0,当n较小,通常n30时,则若给定置信概率(即可靠程度)1-,可以证明y0的预测区间为:,X,x0,Y,当我国城镇居民人均可支配收入为6千元时,则:,=4.7212(千元),上限为:,5.2152千元,按95.45%的可靠程度,下限为:,4.2272千
7、元,当我国城镇居民人均可支配收入为15千元时,则:,按95%的可靠程度,查t分布表t0.025=2.05,=11.1625(千元),则城镇居民的消费性支出的预测区间为:,10.631411.6936(千元),多元线性回归模型的总体回归函数的一般形式如下:,式中:,Y变量Y的第t次观察值,Xjt变量X的第t次观察值,0,1,2,k总体回归系数,j偏回归系数。,Ut随机误差项,假设:次观察值,同时, 为总体回归系数的估计,则多元线性回归模型的样本回归函数如下:,式中:etY与其估计值 之间的离差,多元线性回归模型最小二乘法:,对0,1,2,k求Q的偏导数,并使之等于零,则有以下的正规方程组:, ,用矩阵表示:,总体回归函数:,样本回归函数:,