1、3.2回归分析,1.能通过收集现实问题中两个有关联的变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.2.能根据给出的线性回归方程系数公式建立线性回归方程.3.能通过相关性检验,了解回归分析的基本思想与方法.4.了解非线性回归问题,并能找出解决问题的一般思路.,1.回归直线方程对于一组具有线性相关关系的数据(xi,yi)(i=1,2,n),回归直线方程为 = a + ,其中 = =1 =1 2 2 , = .,名师点拨(1)回归直线方程只适用于所研究的样本总体.(2)建立的回归直线方程一般都有时间性,如不能用20世纪80年代的身高、体重数据所建立的回归直线方程来描述现在的身高和体重的
2、关系.(3)样本取值的范围会影响回归直线方程的适用范围.(4)回归直线方程得到的预报值不一定就是预报变量的精确值,事实上,它是预报变量的可能取值的平均值.,2.相关性检验对于变量x与Y随机抽取到的n对数据(x1,y1),(x2,y2),(xn,yn),检验统计量是样本相关系数r= =1 ( x i x )( y i y ) i=1 n ( ) 2 =1 ( ) 2 = =1 ( =1 2 2 )( =1 2 2 ) .,r具有以下性质:|r|1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.对变量x与Y进行相关性检验分四步:(1)作统计假设:x与Y不具有线性相关关系;
3、(2)根据小概率0.05与n-2在教材附表中查出r的一个临界值r0.05;(3)根据样本相关系数计算公式算出r的值;(4)作统计推断.如果|r|r0.05,表明有95%的把握认为x与Y之间具有线性相关关系.如果|r|r0.05,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.,【做一做】 下列有关样本相关系数的说法不正确的是 ()A.相关系数用来衡量变量x与Y之间的线性相关程度B.|r|1,且|r|越接近1,相关程度越强C.|r|1,且|r|越接近0,相关程度越弱D.|r|1,且|r|越接近1,相关程度越强答案:D,两个变量具有相关关系和具有函数关系有何区别?剖析:相关关系与函数
4、关系不同,因为函数关系是一种确定性的关系;而相关关系是一种非确定性的关系,它包括两种情况:一是两个变量中,一个变量为可控制变量,另一个变量为随机变量;二是两个变量均为随机变量.而函数关系可以看成是两个非随机变量之间的关系.另一方面,函数关系是一种因果关系,而相关关系不一定是因果关系,也可以是伴随关系.对两个变量的关系来说,在相关关系中,例如,在水稻产量与施肥量的关系中,施肥量是可控制变量,而水稻的产量是随机变量;在研究一个学生的数学成绩与物理成绩的关系时,这两个变量都是不可控制的随机变量.而正方形的面积S与边长x之间的关系是一种函数关系,这两个变量就不是随机变量.由于相关关系的不确定性,我们经
5、常运用统计分析的方法,即回归分析法来进行研究.,我们可以知道,相关关系中,由部分观测值得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性问题转化成确定性问题来研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用,从某种意义上看,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可使我们处理更为广泛的数学应用问题,还能使我们对函数关系的认识上升到一个新的高度.,题型一,题型二,题型三,已知 =1 5 x i 2 =90, i=1 5 2 140.8, =1 5 =112.3, 79 8.9,
6、 2 1.4,n-2=3时,r0.05=0.878.(1)求 , ;(2)对x,y进行线性相关性检验;(3)如果x与y具有线性相关关系,求出回归直线方程;(4)假设使用年限为10年时,维修费用约是多少万元?,题型一,题型二,题型三,解:(1) = 2+3+4+5+6 5 =4, = 2.2+3.8+5.5+6.5+7.0 5 =5.(2)步骤如下:作统计假设:x与y不具有线性相关关系; =1 5 5 x y =112.3-545=12.3, i=1 5 2 5 2 =90-542=10, =1 5 2 5 2 =140.8-125=15.8,所以r= 12.3 1015.8 = 12.3 15
7、8 = 12.3 2 79 12.3 1.48.9 0.987;,题型一,题型二,题型三,|r|=0.9870.878,即|r|r0.05,所以有95%的把握认为x与y之间具有线性相关关系,去求回归直线方程是有意义的.(3) = =1 5 5 =1 5 2 5 2 = 112.3545 905 4 2 =1.23. = =5-1.234=0.08.所以回归直线方程为 =1.23x+0.08.(4)当x=10时, =1.2310+0.08=12.38(万元),即假设使用10年时,维修费用约为12.38万元.,题型一,题型二,题型三,反思作相关性检验,有时也用作散点图的方法,观察所给的数据列成的点
8、是否在一条直线的附近,这样做既直观又方便,因而对解决相关性检验问题比较常用,但在作图中,由于存在误差,有时又很难说这些点是不是分布在一条直线的附近,这时就很难判断两个变量之间是否具有相关关系,这时就必须利用样本相关系数对其进行相关性检验,计算中应该特别细心,不能出现计算的错误.,题型一,题型二,题型三,分析:作出散点图,根据样本点分布情况,选择适当的曲线模型拟合.,题型一,题型二,题型三,题型一,题型二,题型三,题型一,题型二,题型三,反思非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与幂函数、指数函数、对数函数等的图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.,题型一,题型二,题型三,题型一,题型二,题型三,题型一,题型二,题型三,题型一,题型二,题型三,