1、2.3变量间的相关关系2.3.1变量之间的相关关系2.3.2两个变量的线性相关,【自主预习】主题1:变量间的相关关系1.某同学物理成绩的好坏与他对物理的学习兴趣、学习时间以及数学成绩有关吗?提示:物理成绩确实与三者有着一定的关系.,2.对于问题1中的关系中,能用他的数学成绩确定他的物理成绩吗?是一个确定的函数关系吗?提示:不能.它们不是一个确定的函数关系.,结合以上探究过程,试着写出两个变量的相关关系的定义:相关关系:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的_,那么这两个变量之间的关系,叫做相关关系.,随机性,主题2:散点图与线性相关观察图形,回答问题:,1.年龄和人体脂
2、肪含量的样本数据中点的分布有什么特点?提示:它们散布在从左下角到右上角的区域.,2.当年龄增长时,脂肪含量的变化是什么?提示:脂肪含量随着年龄的增长而增高.,通过以上探究,阐述你对线性相关的理解用文字语言描述:若散点大致分布在一条直线附近,则两变量间呈现线性相关.,散点图及两个变量正相关与负相关的定义:(1)散点图:将样本中n个数据点(xi,yi)(i=1,2,n)描在平面直角坐标系中得到的图形.(2)正相关:点散布的方向:从_到_.(3)负相关:点散布的方向:从_到_.,左下角,右上角,左上角,右下角,主题3:回归直线方程1.样本点落在怎样的区域内,说明变量之间具有线性相关关系?提示:如果所
3、有的样本点都落在某一直线附近,变量之间就有线性相关关系.,2.回归直线与散点图中各点的位置应具有怎样的关系?提示:从整体上看,各点与此直线的距离最小.,3.教材中通过计算哪个解析式的最小值而得到回归直线方程的?提示:其解析式为Q=(y1-bx1-a)2+(y2-bx2-a)2+(yn-bxn-a)2.,总结以上探究,试着写出最小二乘法、回归直线方程的有关概念最小二乘法:求回归直线使得样本数据的点到回归直线的_的方法叫做最小二乘法.,距离的平方和最小,回归方程:方程 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归方程, , 是待定参数.,其中 是回归方
4、程的_, 是_.,斜率,截距,【深度思考】结合教材P90例题你认为应怎样求回归直线方程?第一步:_.,作出散点图,判断两变量是否具有线性相关关,系,若具有,求其回归直线方程,第二步:_.第三步:_.第四步:_.,列表求出 , , , 的值,利用公式计算回归系数 ,写出回归直线方程,【预习小测】1.下列语句所表示的事件中的因素不具有相关关系的是()A.瑞雪兆丰年 B.上梁不正下梁歪C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧,【解析】选D.选项A,B,C中描述的变量间都具有相关关系,而选项D是迷信说法,没有科学依据.,2.对于回归分析,下列说法错误的是()A.变量间的关系若是非确定性关系,那么因变量
5、不能由自变量唯一确定B.线性相关系数,可以是正的,也可以是负的C.回归分析是对具有相关关系的两个变量进行统计分析的方法D.任何一组数据都可以得到一个回归直线方程,【解析】选D.易知A对;B中,相关系数的正负体现两变量之间是正相关还是负相关,故B对;两变量具有线性相关关系时,才进行回归分析,若不具有线性相关关系求得的方程无意义,故D错,C对.,3.一位母亲记录了儿子39岁的身高,由身高的数据建立的身高与年龄的回归模型为 =7.19x+73.93,若用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm左右D.
6、身高在145.83cm以下,【解析】选C.用回归模型 =7.19x+73.93,只能预测,其结果不一定是确实发生的值,故将x=10,代入=7.19x+73.93=145.83cm,即身高在145.83cm左右.,4.观察下列散点图,正相关;负相关;不相关.与下列图形相对应的是(),A. B.C. D.【解析】选D.第一个图由左向右随x的增大,y也增大,是正相关;第二个图分布比较分散,x与y不相关;第三个图随x的增大,y反而减小,是负相关,故与图形对应的顺序是.,【补偿训练】1.在下列各图中,每个图的两个变量具有相关关系的图是_.,【解析】图(1)是函数关系,图(2)和图(3)是相关关系,图(4
7、)没有相关关系.答案:(2)(3),2.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:,求回归方程 ,其中 =-20.(仿照教材P90例题的解析过程)【解析】由于 =8.5, =80.所以 =80+208.5=250,从而回归方程为 =-20x+250.,【互动探究】1.函数关系是相关关系吗?提示:不是.函数关系是一种确定的关系,它不是相关关系.,2.函数关系可看为是一种因果关系,相关关系是什么关系?提示:相关关系不一定是因果关系,也可能是伴随关系.,3.画散点图时,坐标系中的横、纵坐标的长度单位必须相同吗?提示:可以不同,应考虑两种的数据分布特征,
8、确定其单位长度.,4.成正相关和负相关的两个相关变量的散点图分别有什么特点?提示:正相关的散点图中的点散布在从左下角到右上角的区域,负相关的散点图中的点散布在从左上角到右下角的区域.,5.如何利用散点图判断两个变量之间是否具备相关关系?提示:如果散点图中变量的对应点分布在某条直线周围,我们就可以得出这两个变量具有相关关系;如果变量的对应点分布没有规律,我们就说这两个变量不具有相关关系.,6.对一组具有线性相关关系的样本数据,你认为其回归直线是一条还是几条?提示:对一组具有线性相关关系的样本数据,如果能够求出它的回归直线方程,按照求回归直线方程的过程求出,回归直线方程只有一条.,7.在回归方程中
9、, 的几何意义分别是什么?提示: 是回归直线方程在y轴上的截距, 是回归直线方程的斜率.,【拓展延伸】对线性回归模型的认识(1)如果两个变量之间的依赖关系近似一条直线,那么这两个变量就是线性相关的.,(2)如果两个变量之间的依赖关系近似一条曲线,那么这两个变量就是非线性相关的.(3)如果两个变量之间不存在明显的依赖关系,那么这两个变量就是不相关的.,【探究总结】知识归纳:,注意事项:(1)利用散点图判定两个变量是否具有线性相关关系,注意不要受个别点的位置的影响.,(2)求回归方程,关键在于正确求出系数 , ,由于 , 的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误.(注意回归方程
10、中一次项系数为 ,常数项为 ,这与一次函数的习惯表示不同).,【题型探究】类型一:变量间相关关系的判断【典例1】(1)下列变量之间的关系不是相关关系的是()A.二次函数y=ax2+bx+c中,a,c是已知常数,取b为自变量,因变量是判别式=b2-4ac,B.光照时间和果树亩产量C.降雪量和交通事故发生率D.每亩田施肥量和粮食亩产量,(2)以下是某地搜集到的新房屋的销售价格和房屋面积的数据:,画出数据对应的散点图,并指出销售价格与房屋面积这两个变量是正相关还是负相关.,【解题指南】(1)可判定是否有关,若有关则看关系是否确定;(2)先画出散点图,观测判断即可得出结论.,【解析】(1)选A.在A中
11、,若b确定,则a,b,c都是常数,=b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系.,(2)销售价格与房屋面积的散点图如图:,由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系.因此,销售价格与房屋面积具有正相关关系.,【规律总结】两个变量x与y相关关系的判断方法(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断;如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响
12、.,(2)表格、关系式法:结合表格或关系式进行判断.(3)经验法:借助积累的经验进行分析判断.提醒:如果所有的样本点都落在某一函数曲线附近,那么变量之间就有相关关系.,【巩固训练】1.在下列两个变量的关系中,哪些是相关关系?正方形边长与面积之间的关系;作文水平与课外阅读量之间的关系;人的身高与年龄之间的关系.,【解析】两变量之间的关系有两种:函数关系与带有随机性的相关关系.正方形的边长与面积之间的关系是函数关系.作文水平与课外阅读量之间的关系不是严格的函数关系,但是具有相关性,因而是相关关系.人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了
13、,因而他们不具备相关关系.,2.如图是两个变量统计数据的散点图,判断两个变量之间是否具有相关关系?,【解析】不具有相关关系,因为散点图散乱地分布在坐标平面内,不呈线形.,类型二:求回归直线方程【典例2】(2016惠州高一检测)某工厂对某产品的产量与成本的资料分析后有如下数据:,(1)画出散点图.(2)求成本y与产量x之间的线性回归方程.(结果保留两位小数),【解题指南】(1)在平面直角坐标系中根据已知数据描点即可得散点图.(2)利用公式 求出 即可得出回归直线方程.,【解析】(1)散点图如图所示.,(2)设y与产量x的线性回归方程为,=9-1.104=4.60.所以回归方程为: =1.10x+
14、4.60.,【规律总结】求回归方程的步骤第一步,计算平均数第二步,求和,第三步,计算第四步,写出回归方程,【巩固训练】一台机器由于使用时间较长,生产的零件有一些缺损.按不同转速生产出来的零件有缺损的统计数据如下表所示:,(1)作出散点图.(2)如果y与x线性相关,求出回归方程.(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围内?,【解题指南】先作出散点图,再根据散点图判断y与x呈线性相关,从而建立回归方程求解.,【解析】(1)作散点图如图所示.,(2)由散点图可知y与x线性相关.故可设回归方程为依题意,用计算器可算得:所以 所以所求回归方程为
15、 =0.73x-0.875.,(3)令y=10,得0.73x-0.875=10,解得x14.9.即机器的运转速度应控制在14转/秒内.,类型三:利用回归方程估计总体【典例3】(2016聊城高一检测)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:,(1)请画出上表数据的散点图.(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程y=,(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5+43+54+64.5=
16、66.5),【解题指南】(1)在直角坐标系中根据已知数据描点即可得散点图.(2)利用公式求 ,即可得出回归方程.(3)可将x=100代入回归方程即可得出结论.,【解析】(1)散点图如图所示:,所以所求回归方程为 =0.7x+0.35.,(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7100+0.35=70.35(吨标准煤),故能耗减少了90-70.35=19.65(吨标准煤).,【延伸探究】1.(改变问法)在本例中依据(2)的回归方程及(3)的条件,试估计技术革新后消耗90吨的煤比技术革新前多生产多少吨甲产品?,【解析】由(2)可知: =0.7x+0.35.当 =90时
17、,有90=0.7x+0.35,解得:x128(吨),因此,技术革新后消耗90吨的煤比技术革新前多生产甲产品128-100=28(吨).,2.(改变问法)本例(3)中得出的值是实际能耗减少的量吗?【解析】不一定.利用回归直线方程估计,只是一个近似值,受其他因素影响,估计值与实际值会有一定的误差.,【规律总结】回归分析的三个步骤(1)判断两个变量是否线性相关:可以利用经验,也可以画散点图.(2)求回归方程,注意运算的正确性.(3)根据回归直线进行预测估计:估计值不是实际值,两者会有一定的误差.,【巩固训练】工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为 =50+80x,下列判断正确的是()A.劳动生产率为1 000元时,工人工资为130元B.劳动生产率提高1 000元时,工人工资平均提高80元,C.劳动生产率提高1 000元时,工人工资平均提高130元D.当月工资为3 000元时,劳动生产率为240 050元,【解析】选B.回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.,