1、12.3 变量间的相关关系与线性回归方程1会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆)在高考中,本节以考查相关关系、线性回归方程的相关概念和简单应用为主在学习时,应明确各概念的含义及其联系,并能在此基础上进行简单应用1变量间的相关关系常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是_;与函数关系不同,相关关系是一种_关系,带有随机性2两个变量的线性相关(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有_,这条直线叫_(2)
2、从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为_;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为_. (3)相关系数r ,当 r0 时,表示njjniiniii yx12121)()(两个变量正相关;当 r0 时,表示两个变量负相关r 的绝对值越接近_,表示两个变量的线性相关性越强;r 的绝对值越接近_,表示两个变量的线性相关性越弱通常当 r 的绝对值大于 0.75 时,认为两个变量具有很强的线性相关关系3回归直线方程(1)通过求 Q 的最小值而得出ni iixy12)(回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方
3、法叫做_该式取最小值时的 , 的值即分别为 , .ab(2)两个具有线性相关关系的变量的一组数据:(x1,y 1),( x2,y 2),(x n,y n),其回归方程为,则ab. ,)(1212xbyaxnyyxiniiniiiii【自查自纠】1相关关系 非确定性2(1)线性相关关系 回归直线 (2)正相关 负相关(3)1 0 3最小二乘法在下列量与量的关系中,是相关关系的是( )正方体的体积与棱长间的关系;一块农田的水稻产量与施肥量的关系;人的身高与年龄的关系;家庭的支出与收入的关系A B C D解:是函数关系,皆为相关关系故选 D.观察下列各图形:其中两个变量 x,y 具有很强相关关系的图
4、是( )A B C D解:相关关系有两种情况:所有点看上去都在一条直线附近波动,是线性相关;若所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关的相关性较弱,中两变量几乎没有什么关系而相关性很强故选 C.( )设某大学的女生体重 y(单位:kg)2012湖 南与身高 x(单位: cm)具有线性相关关系,根据一组样本数据( xi,y i)(i1,2, n),用最小二乘法建立的回归方程为 0.85x85.71,则下列结论中不正确的是( )Ay 与 x 具有正的线性相关关系B回归直线过样本点的中心( , )xyC若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kgD若该大学某
5、女生身高为 170 cm,则可断定其体重必为 58.79 kg解:由回归方程为 0.85x85.71 知 y 随 x 的y增大而增大,所以 y 与 x 具有正的线性相关关系,由最小二乘法建立的回归方程的过程知 bxabxb (a b ),所以回归直线过样本点的中心yx( , ),利用回归方程可以预测估计总体,但不能为准确值,所以 D 不正确 .故选 D.下列命题:线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;通过回归直线 ,可以估计和预测变axby量的取值和变化趋势其中正确命题的序号是_解:易知均正确,故填
6、.某产品的广告费用 x 与销售额 y 的统计数据如下表:广告费用 x(万元) 4 2 3 5销售额 y(万元) 49 26 39 54根据上表可得回归方程 x 中的 为 9.4,据y b a b 此模型预报广告费用为 6 万元时销售额为_万元解:由统计数据计算得 3.5, 42,代入xy9.4 ,得 9.1.当 x6 时,yxa a 9.469.1 65.5( 万元) 故填 65.5.y 类型一 相关关系的判断下列变量之间的关系不是相关关系的是( )A已知二次函数 yax 2bxc,其中 a,c 是已知常数,取 b 为自变量,因变量是这个函数的判别式 b 24acB光照时间和果树亩产量C降雪量
7、和交通事故发生率D每亩施用肥料量和粮食亩产量解:由函数关系和相关关系的定义可知,A 中b 2 4ac,因为 a,c 是已知常数,b 为自变量,所以给定一个 b 的值,就有唯一确定的 与之对应,所以 与 b 之间是一种确定的关系,是函数关系B , C,D 中两个变量之间的关系都是相关关系故选 A.【评析】要 注 意 函 数 关 系 与 相 关 关 系 的 区 别 : 函数 关 系 是 确 定 性 关 系 , 而 相 关 关 系 是 随 机 的 、 不 确定 的 下列说法中正确的是( )A任何两个变量之间都有相关关系B球的体积与该球的半径具有相关关系C农作物的产量与施化肥量之间是一种确定性的关系D
8、某商品的生产量与该商品的销售价格之间是一种非确定性的关系解:A 概念错误,B 是函数关系,C 中“确定性”说法错误故选 D.类型二 线性回归方程的有关概念为了考查两个变量 x 和 y 之间的线性关系,甲、乙两位同学各自独立做了 10 次和 15 次试验,并且利用线性回归方法,求得回归直线分别为 l1,l 2,已知两人得到的试验数据中,变量 x 的平均值都等于s,变量 y 的平均值都等于 t,那么下列说法正确的是( )A直线 l1 和 l2 一定有公共点 (s,t)B直线 l1 和 l2 相交,但交点不一定是(s,t)C必有直线 l1l 2D直线 l1 和 l2 必定重合解:线性回归直线方程为
9、x,而yab ,即 t s.t s.( s,t )在回aybxa归直线上,即直线 l1 和 l2 必有公共点(s ,t )故选 A.【评析】回归方程一定通过样本点的中心( , );xy中心相同的样本点的回归方程不一定相同由一组样本数据(x 1,y 1),(x 2,y 2),( xn,y n)得到回归直线方程 ,那么下面ab说法错误的是( )A直线 必经过点 ( , )axbxyB直线 至少经过点 (x1,y 1),(x 2,y 2),y,( xn,y n)中的一个点C直线 的斜率 axbbniiix12D直线 和各点(x 1,y 1),(x 2,y 2),y,( xn,y n)的偏差 是该坐标
10、平面niiiab1上所有直线与这些点的偏差中最小的解:回归直线方程 经过样本点的中心(xy, ),可能不经过(x 1,y 1),( x2,y 2),(x n,y n)y中的任何一点,这些点都分布在这条直线附近.故选 B.类型三 散点图(1)对变量 x,y 有观测数据( xi,y i)(i1,2,10),得散点图 1;对变量 u,v 有观测数据(u i,v i)(i1,2,10) ,得散点图 2.由这两个散点图可以判断( )图 1 图 2A变量 x 与 y 正相关,u 与 v 正相关B变量 x 与 y 正相关,u 与 v 负相关C变量 x 与 y 负相关,u 与 v 正相关D变量 x 与 y 负
11、相关,u 与 v 负相关解:由这两个散点图可以判断,变量 x 与 y 负相关,u 与 v 正相关,故选 C.【评析】点分布在从左下角到右上角的区域时,两个变量的相关关系为正相关;点分布在从左上角到右下角的区域时,两个变量的相关关系为负相关(2)下面是一块田的水稻产量与施化肥量的一组观测数据( 单位:kg):施化肥量 15 20 25 30 35 40 45水稻产量 320 330 360 410 460 470 480()将上述数据制成散点图;()你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解:() 散点图如下:()从图中可以发现施化肥量与水稻
12、产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长,不会一直随化肥施用量的增加而增长【评析】任何一组数据(二元数据 )都可以作出散点图,散点图可以直观地观察两个变量间的关系(1)从左至右,观察下列三个散点图,变量 x 与 y 的关系依次为_ (正相关记作;负相关记作;不相关记作)解:散点图在左上角至右下角区域则负相关,反之,则正相关,散乱则不相关故填.(2)科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(
13、 单位分别是 mm,),并作了统计:年平均气温 12.51 12.84 12.84 13.69 13.33 12.74 13.05年降雨量 748 542 507 813 574 701 432()试画出散点图;()判断两个变量是否具有线性相关关系解:() 作出散点图如图所示()由散点图可知,各点并不在一条直线附近,所以两个变量不具有线性相关关系类型四 求回归方程及用回归方程进行估计下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨) 与相应的生产能耗y(吨标准煤 )的几组对照数据:x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的
14、数据,用最小二乘法求出 y关于 x 的线性回归方程;(3)已知该厂技术改造前 100 吨甲产品能耗为 90吨标准煤,试根据(2)求出的线性回归方程,预测生产100 吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考值 32.54354 64.566.5)解:(1)散点图如下:(2)由系数公式可知, 4.5, 3.5,xy 0.7,b66.5 44.53.586 44.523.50.74.50.35,a所以线性回归方程为 0.7x0.35.y(3)x100 时, 0.7x0.3570.35,所以预测生产 100 吨甲产品的生产能耗比技术改造前降低19.65 吨标准煤【评析】牢记求线性回归方程
15、的步骤:(1)列表;(2)计算 , , , ;(3)代入公式求 ,xynii1nix12b再利用 求 , (4)写出回归方程.ba(2013重庆)从某居民区随机抽取 10个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储蓄 yi(单位:千元)的数据资料,算得=80, =20, =184, =720.10ix10i10iiy102i(1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 ybxa;(2)判断变量 x 与 y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄附:线性回归方程 ybx a 中,b , ,niiix12xb其中 , 为样本平
16、均值,线性回归方程也可写y为 x .y b a 解:(1)由题意知 n10, 8,x1ni8010 2,又 - n 2 =720 -y1ni2010 i121082=80,-n 184108224,iiyx1由此得 b 0.3,2480a b 20.380.4,yx故所求回归方程为 y0.3x 0.4.(2)由于变量 y 的值随 x 的值增加而增加(b0.30),故 x 与 y 之间是正相关(3)将 x7 代入回归方程可以预测该家庭的月储蓄为 y0.37 0.41.7( 千元) 1在研究两个变量之间是否存在某种关系时,必须从散点图入手对于散点图,可以做出如下判断:(1)如果所有的样本点都落在某
17、一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系(2)如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系2分析两个变量相关关系的常用方法:(1)利用散点图进行判断;(2)利用相关系数 r 进行判断3在复习本节内容时应注意:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则无意义(2)根据回归方程进行的估计仅是一个预测值,而不是真实发生的值(3)用最小二乘法求回归方程,关键在于正确求出系数 , ,由于 , 的计算量大,计算时应仔细ab小心,分层进行(最好列出表格 ),避免因计算而产生错误