1、第二章 2.3 2.3.1、2.3.2基础巩固一、选择题1由一组样本数据(x 1,y 1),( x2,y 2),(x n,y n)得到的回归直线方程 bxa,那y 么下面说法不正确的是( )A直线 bxa 必经过点( , )y x y B直线 bxa 至少经过点( x1,y 1),(x 2,y 2),(x n,y n)中的一个点y C直线 bxa 的斜率为y ni 1xiyi n x y ni 1x2i n x 2D直线 bxa 和各点(x 1,y 1),( x2,y 2),(x n,y n)的偏差 yi( bxia) 2 是该y ni 1坐标平面上所有直线与这些点的偏差中最小的直线答案 B解
2、析 由 a b 知 b bx ,必定过( , )点y x y y x x y回归直线方程对应的直线是与样本数据距离最小的,但不一定过原始数据点,只须和这些点很接近即可2下列说法正确的是( )A对于相关系数 r 来说,| r|1,|r| 越接近 0,相关程度越大;| r|越接近 1,相关程度越小B对于相关系数 r 来说,| r|1,|r|越接近 1,相关程度越大;|r| 越大,相关程度越小C对于相关系数 r 来说,| r|1,|r|越接近 1,相关程度越大;|r| 越接近 0,相关程度越小D对于相关系数 r 来说,| r|1,|r| 越接近 1,相关程度越小;| r|越大,相关程度越大答案 C3
3、(2015辽宁鞍山调研)两个变量成负相关关系时,散点图的特征是( )A点从左下角到右上角区域散布B点散布在某带形区域内C点散布在某圆形区域内D点从左上角到右下角区域散布答案 D4(2014重庆)已知变量 x 与 y 正相关,且由观测数据算得样本的平均数2.5, 3.5,则由观测的数据得线性回归方程可能为( )x yA. 0.4 x2.3 B. 2x2.4y y C. 2x9.5 D. 0.3x4.4y y 答案 A解析 x ,正相关则 b0,排除 C,D. 过中点心( , )(3,3.5),选y b a x yA.5某化工厂为预测某产品的回收率 y,需要研究它的原料有效成分含量 x 之间的相关
4、关素,现取了 8 对观测值,计算得: i52, i228 , 478, iyi1849,8i 1x8i 1y8i 1x2i8i 1x则 y 对 x 的回归直线的方程是 ( )A. 11.47 2.62 x B. 11.472.62xy y C. 2.6211.47x D. 11.472.62xy y 答案 A解析 由已知得 i 52 , i 228 ,所以 x188i 1x 18 132 y 188i 1y 18 572 b 2.62, 2.62 11.47,所以8i 1xiyi 8x y8i 1x2i 8x21849 8132 572478 81322 a y b x 572 1322.62
5、 x11.47.y 6为了考查两个变量 x 和 y 之间的线性关系,甲、乙两位同学各自独立做了 10 次和15 次试验,并且利用线性回归方法,求得回归直线分别为 l1、l 2,已知两人所得的试验数据中,变量 x 和 y 的数据的平均值都相等,且分别是 s 和 t,那么下列说法中正确的是( )A直线 l1、l 2 一定有公共点 (s,t)B直线 l1、l 2 相交,但交点不一定是(s,t)C必有直线 l1l 2Dl 1、l 2 必定重合答案 A解析 线性回归直线方程为 bx a,而 ,即 atbs,t bsa,所以y a y b x(s,t )在回归直线上,直线 l1、l 2 一定有公共点( s
6、,t )二、填空题7(2011辽宁高考)调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出 y(单位:万元) ,调查显示年收入 x 与年饮食支出 y 具有线性相关关系,并由调查数据得到 y 对x 的回归直线方程: 0.254 x0.321.由回归直线方程可知,家庭年收入每增加 1 万元,年y 饮食支出平均增加_万元答案 0.254解析 由于 0.254x 0.321 知,当 x 增加 1 万元时,年饮食支出 y 增加 0.254 万y 元8某单位为了解用电量 y(度) 与气温 x()之间的关系,随机抽查了某 4 天的用电量与当天气温,并制作了对照表:气温() 18 13 10 1用电量
7、(度) 24 34 38 64由表中数据得线性回归方程 x 中 2,预测当气温为4时,用电量约为y b a b _度答案 68解析 10, 40,因为回归方程一定过点x18 13 10 14 y 24 34 38 644( , ),x y所以 ,则 4021060.y b x a a y b x则 2x60 ,当 x4 时, 2( 4)6068.y y 三、解答题9某种产品的广告费支出 x 与销售额 y 之间有如下对应数据( 单位:百万元)x 2 4 5 6 8y 30 40 60 50 70(1)画出散点图;(2)从散点图中判断销售金额与广告费支出成什么样的关系?解析 (1)以 x 对应的数
8、据为横坐标,以 y 对应的数据为纵坐标,所作的散点图如下图所示:(2)从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即 x 与 y 成正相关关系10一台机器由于使用时间较长,生产的零件有一些缺损按不同转速生产出来的零件有缺损的统计数据如下表所示:转速 x(转/秒) 16 14 12 8每小时生产有缺损零件数 y(个) 11 9 8 5(1)作出散点图;(2)如果 y 与 x 线性相关,求出回归直线方程;(3)若实际生产中,允许每小时的产品中有缺损的零件最多为 10 个,那么,机器的运转速度应控制在什么
9、范围内?解析 先作出散点图,再根据散点图判断 y 与 x 呈线性相关,从而建立回归直线方程求解解:(1)作散点图如图所示(2)由散点图可知 y 与 x 线性相关故可设回归直线方程为 bxa.y 依题意,用计算器可算得:12.5, 8.25, 660, iyi438.x y4i 1x2i4i 1xb 0.73,a b 8.250.7312.50.875.438 412.58.25660 412.52 y x所求回归直线方程为 0.73x0.875.y (3)令 10,得 0.73x0.87510,解得 x15.y 即机器的运转速度应控制在 15 转/秒内能力提升一、选择题1(2014湖北)根据如
10、下样本数据得到的回归方程为 bxa,则( )y x 3 4 5 6 7 8y 4.0 2.5 0.5 0.5 2.0 3.0A.a0,b0 Ba0,b0Ca0,b0 Da0,b0答案 A解析 由于 x 增大 y 减小知 b0,又 x3 时 y0,a0,故选 A.2某产品的广告费用 x 与销售额 y 的统计数据如下表:广告费用 x(万元) 4 2 3 5销售额 y(万元) 49 26 39 54根据上表可得回归方程 x 中的 为 9.4,据此模型预报广告费用为 6 万元时销售y b a b 额为( )A63.6 万元 B65.5 万元C67.7 万元 D72.0 万元答案 B探究 由线性回归方程
11、的图象过样本点的中心,可求得线性回归方程,然后结合该方程对 x6 时的销售额作出估计解析 样本点的中心是(3.5,42),则 429.43.59.1,所以线性回归方程a y b x是 9.4 x9.1 ,把 x6 代入得 65.5.y y 3已知 x 与 y 之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4假设根据上表数据所得线性回归直线方程为 x .若某同学根据上表中的前两组数y b a 据(1,0)和(2,2)求得的直线方程为 ybxa,则以下结论正确的是( )A. b, a B. b, ab a b a C. b, a D. b, ab a b a 答案 C探究
12、 先由已知条件分别求出 b,a的值,再由 , 的计算公式分别求解 , 的b a b a 值,即可作出比较解析 由两组数据(1,0)和(2,2)可求得直线方程为 y2x2,从而 b2,a2.而利用线性回归方程的公式与已知表格中的数据,可求得 b 6i 1xiyi 6xy6i 1x2i 6x 2 , ,所以 b, a.58 67213691 6722 57 a y b x 136 57 72 13 b a 4某学生课外活动兴趣小组对两个相关变量收集到 5 组数据如下表:x 10 20 30 40 50y 62 75 81 89由最小二乘法求得回归方程为 0.67x54.9,现发现表中有一个数据模糊
13、不清,请推y 断该数据的值为( )A60 B62C68 D68.3答案 C解析 由题意可得 30,x代入回归方程得 75.y设看不清处的数为 a,则 62a758189755,a68.点评 表中所给的数据只反映 x 与 y 的线性关系,并非函数关系,因而不能直接代入线性方程求预报值 ,应根据线性回归方程性质,即线性回归方程经过中心点( , )求y x y解二、填空题52010 年 4 月初,广东部分地区流行手足口病,党和政府采取果断措施,防治结合,很快使病情得到控制下表是某同学记载的 2010 年 4 月 1 日到 2010 年 4 月 12 日每天广州手足口病治愈出院者数据,根据这些数据绘制
14、散点图如图.日期 1 2 3 4 5 6人数 100 109 115 118 121 134日期 7 8 9 10 11 12人数 141 152 168 175 186 203下列说法:根据此散点图,可以判断日期与人数具有线性相关关系;根据此散点图,可以判断日期与人数且有一次函数关系;后三天治愈出院的人数占这 12 天治愈出院人数的 30%多;后三天治愈出院的人数均超过这 12 天内北京市治愈出院人数的 20%.其中正确的个数是_答案 26改革开放 30 年以来,我国高等教育事业迅速发展,对某省 19902000 年考大学升学百分比按城市、县镇、农村进行统计,将 19902000 年依次编号
15、为 010,回归分析之后得到每年考入大学的百分比 y 与年份 x 的关系为:城市: 2.84x 9.50;y 县镇: 2.32x 6.67;y 农村: 0.42x 1.80.y 根据以上回归直线方程,城市、县镇、农村三个组中,_的大学入学率增长最快按同样的增长速度,可预测 2010 年,农村考入大学的百分比为_%.答案 城市 10.2探究 增长速度可根据回归直线的斜率来判断,斜率大的增长速度快,斜率小的增长速度慢解析 通过题目中所提供的回归方程可判断,城市的大学入学率增长最快;2010 年农村考入大学的百分比为 0.42201.8010.2.三、解答题7(2014新课标全国高考) 某地区 20
16、07 年至 2013 年农村居民家庭人均纯收入 y(单位:千元) 的数据如下表年份 2007 2008 2009 2010 2011 2012 2013年份代号 1 2 3 4 5 6 7人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,分析 2007 年至 2013 年该地区农村居民家庭人均纯收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入,附:回归直线的斜率和截距的最小二乘估计公式分别为: , .b ni 1ti tyi yni 1ti t2 a y b t解析 (1)由所给数据计算得
17、 (1234567)4,t17 (2.93.33.64.44.85.25.9) 4.3,y17(ti )2941014928,7i 1 t(ti )(yi )(3) (1.4)( 2)( 1)(1)( 0.7)7i 1 t y00.110.520.931.614, 0.5 ,b ni 1ti tyi yni 1ti t2 1428 4.3 0.542.3,a y b t所求回归方程为 0.5t2.3.y (2)由(1)知,b0.50 ,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加,平均每年增加 0.5 千元,将 2015 年的年份代号 t9 代入 (1)中的回归方程,得
18、0.5 92.3 6.8,y 故预测该地区 2015 年农村居民家庭人均纯收人为 6.8 千元8(2013重庆)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入 xi(单位:千元)与月储蓄 yi(单位:千元)的数据资料,算得i80 , i20, iyi184, 720.10i 1x10i 1y10i 1x10i 1x2i(1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 x ;y b a (2)判断变量 x 与 y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄附:线性回归方程 x 中, , ,其中 , 为样本平均y b a b ni 1x
19、iyi nx yni 1x2i nx 2 ay b x x y值探究 (1)根据线性回归方程求相关的量后,代入公式即可求得回归方程;(2)观察线性回归方程的系数 可判断是正相关还是负相关;(3)将 x7 代入线性回归方程即可求得b 预报变量,即该家庭的月储蓄解析 (1)由题意知 n10, i 8, i 2,x1nni 1x 8010 y 1nni 1y 2010又 n 2720108 280, iyin 184 108224,ni 1x2i x ni 1x x y由此得 0.3, 20.380.4,b ni 1xiyi nx yni 1x2i nx 2 2480 a y b x故所求回归方程为 0.3x 0.4.y (2)由于变量 y 的值随 x 的值增加而增加( 0.30) ,故 x 与 y 之间是正相关b (3)将 x7 代入回归方程可以预测该家庭的月储蓄为 0.3 70.41.7(千元)y