1、- 1 -课时跟踪检测(六十六) 变量间的相关关系、统计案例一、题点全面练1.根据如下样本数据:x 3 4 5 6 7 8y 4.0 2.5 0.5 0.5 0.4 0.1得到的线性回归方程为 x ,则( )y b a A. 0, 0 B. 0, 0a b a b C. 0, 0 D. 0, 0a b a b 解析:选 B 根据给出的数据可发现:整体上 y与 x呈现负相关,所以 0,由样本点b (3,4.0)及(4,2.5)可知 0,故选 B.a 2.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了 100位育龄妇女,结果如下表.
2、非一线 一线 总计愿生 45 20 65不愿生 13 22 35总计 58 42 100由 K2 ,n ad bc 2 a b c d a c b d得 K2 9.616.100 4522 2013 265355842参照下表,P(K2 k0) 0.050 0.010 0.001k0 3.841 6.635 10.828正确的结论是( )A.在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过 0.1%的前提下,认为“生育意愿与城市级别无关”C.有 99%以上的把握认为“生育意愿与城市级别有关”D.有 99%以上的把握认为“生育意愿与城市级别无关”解析
3、:选 C K29.6166.635,有 99%以上的把握认为“生育意愿与城市级别有关”,故选 C.3.(2018哈尔滨一模)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实- 2 -现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:年份/届 2014 2015 2016 2017学科竞赛获省级一等奖及以上的学生人数 x 51 49 55 57被清华、北大等世界名校录取的学生人数 y 103 96 108 107根据上表可得回归方程 x 中的 为 1.35,该校 2018届同学在学科竞赛中获省级一y b a b 等奖及以上的学生人数为
4、 63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为( )A.111 B.117C.118 D.123解析:选 B 因为 53, 103.5,所以 103.51.355331.95,所以回x y a y b x归直线方程为 1.35 x31.95.当 x63 时,代入解得 117,故选 B.y y 4.某考察团对 10个城市的职工人均工资 x(千元)与居民人均消费 y(千元)进行调查统计,得出 y与 x具有线性相关关系,且线性回归方程为 0.6 x1.2.若某城市职工人均工资为y 5千元,估计该城市人均消费额占人均工资收入的百分比为( )A.66% B.67%C.79% D.84
5、%解析:选 D y与 x具有线性相关关系,且满足回归方程 0.6 x1.2,该城市居民y 人均工资为 5,可以估计该城市的职工人均消费水平 0.651.24.2,可以估x y计该城市人均消费额占人均工资收入的百分比为 84%.4.255.某炼钢厂废品率 x(%)与成本 y(元/吨)的线性回归直线方程为 105.49242.569 x.y 当成本控制在 176.5元/吨时,可以预计生产的 1 000吨钢中,约有_吨钢是废品(结果保留两位小数).解析:因为 176.5105.49242.569 x,解得 x1.668,即当成本控制在 176.5元/吨时,废品率约为 1.668%,所以生产的 1 0
6、00吨钢中,约有 1 0001.668%16.68 吨是废品.答案:16.686.在一次考试中,5 名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)- 3 -学生的编号 i 1 2 3 4 5数学成绩 x 80 75 70 65 60物理成绩 y 70 66 68 64 62现已知其线性回归方程为 0.36 x ,则根据此线性回归方程估计数学得 90分的同学y a 的物理成绩为_.(四舍五入到整数)解析: 70,x60 65 70 75 805 66,y62 64 66 68 705所以 660.3670 ,即 40.8,a a 即线性回归方程为 0.36 x40.8
7、.y 当 x90 时, 0.369040.873.273.y 答案:737.经调查某地若干户家庭的年收入 x(万元)和年饮食支出 y(万元)具有线性相关关系,并得到 y关于 x的线性回归直线方程: 0.245 x0.321,由回归直线方程可知,家庭年收y 入每增加 1万元,年饮食支出平均增加_万元.解析: x变为 x1, 0.245( x1)0.3210.245 x0.3210.245,因此家庭年收y 入每增加 1万元,年饮食支出平均增加 0.245万元.答案:0.2458.已知某次考试之后,班主任从全班同学中随机抽取一个容量为 8的样本,他们的数学、物理成绩(单位:分)对应如下表:学生编号
8、1 2 3 4 5 6 7 8数学成绩 60 65 70 75 80 85 90 95物理成绩 72 77 80 84 88 90 93 95给出散点图如下:- 4 -根据以上信息,判断下列结论:根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;从全班随机抽取甲、乙两名同学,若甲同学数学成绩为 80分,乙同学数学成绩为 60分,则甲同学的物理成绩一定比乙同学的物理成绩高.其中正确的个数为_.解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故正确,
9、错误;若甲同学数学成绩为 80分,乙同学数学成绩为 60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故错误.综上,正确的个数为 1.答案:19.(2019泉州一模)某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取100名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试,测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子停下所需要的距离),无酒状态与酒后状态下的试验数据分别列于下表.表 1停车距离 d(米) (10,20 (20,30 (30,40 (40,50 (50,60频数 26 a b 8 2表 2平均每毫升血液酒精含量 x
10、(毫克) 10 30 50 70 90平均停车距离 y(米) 30 50 60 70 90已知表 1数据的中位数估计值为 26,回答以下问题.(1)求 a, b的值,并估计驾驶员无酒状态下停车距离的平均数;(2)根据最小二乘法,由表 2的数据计算 y关于 x的回归方程 x ;y b a (3)该测试团队认为:若驾驶员酒后驾车的平均“停车距离” y大于(1)中无酒状态下的停车距离平均数的 3倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?附:回归方程 x 中, , .y b a b ni 1xiyi nx yni 1x2i nx 2 a y
11、 b x解:(1)依题意,得 a5026,解得 a40.610- 5 -又 a b36100,解得 b24,故停车距离的平均数为15 25 35 45 55 27.26100 40100 24100 8100 2100(2)依题意,可知 50, 60,x yiyi1030305050607070909017 800,5i 1x10 230 250 270 290 216 500,5i 1x2i所以 0.7, 600.75025,b 17 800 5506016 500 5502 a 所以回归直线方程为 0.7 x25.y (3)由(1)知当 y81 时,认定驾驶员是“醉驾”.令 81,得 0.
12、7x2581,解得 x80,y 则当每毫升血液酒精含量大于 80毫克时认定为“醉驾”.10.(2018豫南九校联考)下表为 2015年至 2018年某百货零售企业的线下销售额(单位:万元),其中年份代码 x年份2014.年份代码 x 1 2 3 4线下销售额 y 95 165 230 310(1)已知 y与 x具有线性相关关系,求 y关于 x的线性回归方程,并预测 2019年该百货零售企业的线下销售额;(2)随着网络购物的飞速发展,有不少顾客对该百货零售企业的线下销售额持续增长表示怀疑,某调查平台为了解顾客对该百货零售企业的线下销售额持续增长的看法,随机调查了 55位男顾客、50 位女顾客(每
13、位顾客从“持乐观态度”和“持不乐观态度”中任选一种),其中对该百货零售企业的线下销售额持续增长持乐观态度的男顾客有 10人、女顾客有 20人,能否在犯错误的概率不超过 0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关?参考公式及数据: , ,b ni 1xiyi nx yni 1x2i nx 2 a y b xK2 , n a b c d.n ad bc 2 a b c d a c b d- 6 -P(K2 k0) 0.10 0.05 0.025 0.010 0.005k0 2.706 3.841 5.024 6.635 7.879解:(1)由题意得 2.5, 2
14、00, 30, iyi2 355,所以 x y4i 1x2i4i 1x b 71,4i 1xiyi 4x y4i 1x2i 4x2 2 355 42.520030 42.52所以 200712.522.5,a y b x所以 y关于 x的线性回归方程为 71 x22.5.y 由于 2 0192 0145,所以当 x5 时, 71522.5377.5,所以预测 2019年该y 百货零售企业的线下销售额为 377.5万元.(2)由题可得 22列联表如下:持乐观态度 持不乐观态度 总计男顾客 10 45 55女顾客 20 30 50总计 30 75 105故 K2 6.109.105 1030 45
15、20 255503075由于 6.1095.024,所以可以在犯错误的概率不超过 0.025的前提下认为对该百货零售企业的线下销售额持续增长所持的态度与性别有关.二、专项培优练(一)易错专练不丢怨枉分1.(2019济南诊断)某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问 110名性别不同的高中生是否爱好游泳运动,得到如下的列联表.由 K2并参照附表,得到的正确结论是( )n ad bc 2 a b c d a c b d男 女 总计爱好 40 20 60- 7 -不爱好 20 30 50总计 60 50 110附表:P(K2 k0) 0.050 0.010 0.001k0 3.8
16、41 6.635 10.828A.在犯错误的概率不超过 1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过 1%的前提下,认为“爱好游泳运动与性别无关”C.有 99.9%的把握认为“爱好游泳运动与性别有关”D.有 99.9%的把握认为“爱好游泳运动与性别无关”解析:选 A 因为 K2 7.8226.635,所以有 99%110 4030 2020 260506050的把握认为“爱好游泳运动与性别有关” ,所以在犯错误的概率不超过 1%的前提下,认为“爱好游泳运动与性别有关”.2.已知 x与 y之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4假设根据上
17、表数据所得的线性回归方程为 x .若某同学根据上表中的前两组数据y b a (1,0)和(2,2)求得的直线方程为 y b x a,则以下结论正确的是( )A. b, a B. b, ab a b a C. b, a D. b, ab a b a 解析:选 C 由两组数据(1,0)和(2,2)可求得直线方程为 y2 x2, b2, a2.而利用线性回归方程的公式与已知表格中的数据,可求得 b 6i 1xiyi 6xy6i 1x2i 6x2 , ,所以 b, a.58 67213691 6(72)2 57 a y b x 136 57 72 13 b a 3.为了研究某班学生的脚长 x(单位:c
18、m)和身高 y(单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出 y与 x之间有线性相关关系,设其线性回归方程- 8 -为 x .已知 i225, i1 600, 4.该班某学生的脚长为 24,据此估计其身y b a 10i 1x 10i 1y b 高为( )A.160 B.163C.166 D.170解析:选 C i225, i22.5.10i 1x x 11010i 1x i1 600, i160.10i 1y y 11010i 1y又 4, 160422.570.b a y b x线性回归方程为 4 x70.y 将 x24 代入上式,得 42470166.y (
19、二)素养专练学会更学通4.数学运算某高中学校对全体学生进行体育达标测试,每人测试 A, B两个项目,每个项目满分均为 60分.从全体学生中随机抽取了 100人,分别统计他们 A, B两个项目的测试成绩,得到 A项目测试成绩的频率分布直方图和 B项目测试成绩的频数分布表如下:B项目测试成绩频数分布表分数区间 频数0,10) 210,20) 320,30) 530,40) 1540,50) 4050,60 35将学生的成绩划分为三个等级,如下表:- 9 -分数 0,30) 30,50) 50,60等级 一般 良好 优秀(1)在抽取的 100人中,求 A项目等级为优秀的人数;(2)已知 A项目等级为
20、优秀的学生中女生有 14人, A项目等级为一般或良好的学生中女生有 34人,试完成下列 22列联表,并分析是否有 95%以上的把握认为“ A项目等级为优秀”与性别有关?优秀 一般或良好 总计男生女生总计(3)将样本的概率作为总体的概率,并假设 A项目和 B项目测试成绩互不影响,现从该校学生中随机抽取 1人进行调查,试估计其 A项目等级比 B项目等级高的概率.参考数据:P(K2 k0) 0.10 0.050 0.025 0.010 0.001k0 2.706 3.841 5.024 6.635 10.828参考公式 K2 ,其中 n a b c d.n ad bc 2 a b c d a c b
21、 d解:(1)由 A项目测试成绩频率分布直方图,得 A项目等级为优秀的频率为0.04100.4,所以 A项目等级为优秀的人数为 0.410040.(2)由(1)知 A项目等级为优秀的学生中,女生数为 14人,男生数为 26人. A项目等级为一般或良好的学生中,女生数为 34人,男生数为 26人.作出如下 22列联表:优秀 一般或良好 总计男生 26 26 52女生 14 34 48总计 40 60 100则 K2 4.514.100 2634 2614 240604852由于 4.5143.841,所以有 95%以上的把握认为“ A项目等级为优秀”与性别有关.- 10 -(3)设“ A项目等级
22、比 B项目等级高”为事件 C.记“ A项目等级为良好”为事件 A1, “A项目等级为优秀”为事件 A2, “B项目等级为一般”为事件 B0, “B项目等级为良好”为事件 B1.于是 P(A1)(0.020.02)100.4, P(A2)0.4.由频率估计概率得 P(B0) 0.1, P(B1) 0.55.2 3 5100 15 40100因为事件 Ai与 Bj相互独立,其中 i1,2, j0,1,所以 P(C) P(A1B0 A2B0 A2B1)0.40.10.40.10.40.550.3.所以随机抽取一名学生,其 A项目等级比 B项目等级高的概率为 0.3.5.数据分析下图是某地区 2000
23、年至 2016年环境基础设施投资额 y(单位:亿元)的折线图.为了预测该地区 2018年的环境基础设施投资额,建立了 y与时间变量 t的两个线性回归模型.根据 2000年至 2016年的数据(时间变量 t的值依次为 1,2,17)建立模型: 30.413.5 t;根据 2010年至 2016年的数据(时间变量 t的值依次为 1,2,7)y 建立模型: 9917.5 t.y (1)分别利用这两个模型,求该地区 2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型,可得该地区 2018年的环境基础设施投资额的预测值为30.413.5192
24、26.1(亿元).y 利用模型,可得该地区 2018年的环境基础设施投资额的预测值为9917.59256.5(亿元).y (2)利用模型得到的预测值更可靠.理由如下:()从折线图可以看出,2000 年至 2016年的数据对应的点没有随机散布在直线y30.413.5 t上下,这说明利用 2000年至 2016年的数据建立的线性模型不能很好地- 11 -描述环境基础设施投资额的变化趋势.2010 年相对 2009年的环境基础设施投资额有明显增加,2010年至 2016年的数据对应的点位于一条直线的附近,这说明从 2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用 2010年至 2016年的数据建立的线性模型9917.5 t可以较好地描述 2010年以后的环境基础设施投资额的变化趋势,因此利用模y 型得到的预测值更可靠.()从计算结果看,相对于 2016年的环境基础设施投资额 220亿元,由模型得到的预测值 226.1亿元的增幅明显偏低,而利用模型得到的预测值的增幅比较合理,说明利用模型得到的预测值更可靠.(以上给出了 2种理由,学生答出其中任意一种或其他合理理由均可得分)