1、第 4 课时 线性回归分析与统计案例1甲、乙、丙、丁四位同学各自对 A,B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85则哪位同学的试验结果体现 A,B 两变量有更强的线性相关性( )A甲 B乙C丙 D丁答案 D2(2018湖北七市联考)广告投入对商品的销售额有较大影响某电商对连续 5 个年度的广告费 x 和销售额 y进行统计,得到统计数据如下表(单位:万元) :广告费 x 2 3 4 5 6销售额 y 29 41 50 59 71由上表可得回归方程为 10.2x ,据此模型,预测广告费为 10 万元时销售额约为
2、( )y a A101.2 万元 B108.8 万元C111.2 万元 D118.2 万元答案 C解析 根据统计数据表,可得 (23456) 4, (2941505971)50,而回归直线x 15 y 1510.2x 经过样本点的中心(4,50) ,5010.24 ,解得 9.2,回归方程为 10.2x9.2,当y a a a b x10 时, 10.2109.2111.2,故选 C.y 3(2018赣州一模)以下四个命题:从匀速传递的产品生产流水线上,质检员每 20 分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;两个随机变量相关性越强,则相关系数的绝对值越接近于 1;在回归直线
3、方程 0.2x12 中,当解释变量 x 每增加 1 个单位时,预报变量平均增加 0.2 个单位;y 分类变量 X 与 Y,对它们的随机变量 K2 的观测值 k 来说,k 越小, “X 与 Y 有关系”的把握程度越大其中真命题为( )A BC D答案 D解析 为系统抽样;分类变量 X 与 Y,对它们的随机变量 K2 的观测值 k 来说,k 越大, “X 与 Y 有关系”的把握程度越大4下面是一个 22 列联表y1 y2 总计x1 a 21 73x2 22 25 47合计 b 46 120其中 a,b 处填的值分别为( )A94 72 B52 50C52 74 D74 52答案 C解析 由 a21
4、73,得 a52,a 22b,得 b74.故选 C.5(2018湖南衡阳联考)甲、乙、丙、丁四位同学各自对 A,B 两个变量的线性相关性做试验,并用回归分析方法分别求得相关系数 r 与残差平方和 m,如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85m 106 115 124 103则哪位同学的试验结果体现 A,B 两变量有更强的线性相关性( )A甲 B乙C丙 D丁答案 D解析 r 越大,m 越小,线性相关性越强故选 D.6(2018衡水中学调研)以下四个命题中,真命题是 ( )A对分类变量 x 与 y 的随机变量 K2 的观测值 k 来说,k 越小,判断“x 与 y 有关系”的
5、把握程度越大B两个随机变量的线性相关性越强,相关系数的绝对值越接近于 0C若数据 x1,x 2,x 3, xn 的方差为 1,则 2x1,2x 2,2x 3,2x n 的方差为 2D在回归分析中,可用相关指数 R2 的值判断模型的拟合效果,R 2 越大,模型的拟合效果越好答案 D解析 对于 A,对分类变量 x 与 y 的随机变量 K2 的观测值 k 来说,k 越大,判断“x 与 y 有关系”的把握程度越大,故 A 错误;对于 B,两个随机变量的线性相关性越强,相关系数的绝对值越接近于 1,故 B 错误;对于 C,若数据 x1,x 2,x 3, ,x n 的方差为 1,则 2x1,2x 2,2x
6、 3,2x n 的方差为 4,故 C 错误;对于D,根据离散变量的线性相关及相关指数的有关知识可知 D 正确72015 年年度史诗大剧芈月传风靡大江南北,影响力不亚于以前的甄嬛传 某记者调查了大量芈月传的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在10,14 ,15,19,20 ,24,25,2930 ,34的爱看比例分别为 10%,18% ,20%,30%,t%.现用这 5 个年龄段的中间值代表年龄段,如 12 代表10,14,17 代表15,19 ,根据前四个数据求得爱看比例 y 关于 x 的线性回归方程为y(kx4.68)% ,由此可推测 t 的值为( )A33 B35C3
7、7 D39答案 B解析 依题意,x (12 172227) 19.5,14y (10%18%20%30%)19.5% ,14又回归直线必过点(x,y), 19.5%(k19.54.68)%,解得 k ,当 x32 时,( 324.68)%2 4181 950 2 4181 95035%,t35.8(2018广西南宁月考)某同学寒假期间对其 30 位亲属的饮食习惯进行了一次调查,列出了如下列联表:偏爱蔬菜 偏爱肉类 合计50 岁以下 4 8 1250 岁以上 16 2 18合计 20 10 30则可以说其亲属的饮食习惯与年龄有关的把握为( )附:K 2 .n(ad bc)2(a b)(c d)(
8、a c)(b d)P(K2k 0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k0 2.072 2.706 3.841 5.024 6.635 7.879 10.828A.90% B95%C99% D99.9%答案 C解析 由 22 列联表知,K 2 10.K 26.635,K 27.879,故有 99.5%的把握认为“心率小于 60 次/50(828 212)220301040分与常年进行系统的身体锻炼有关” 14(2018山东日照一模)某学校高三年级有学生 500 人,其中男生 300 人,女生 200 人为了研究学生的数学成绩是否与性别有关,现采用分层抽
9、样的方法,从中抽取了 100 名学生,先统计了他们期中考试的数学分数,然后按性别分为男、女两组,再将两组学生的分数分成 5 组:100,110) ,110,120),120 ,130),130,140),140,150分别加以统计,得到如图所示的频率分布直方图(1)从样本中分数低于 110 分的学生中随机抽取两人,求这两人恰好为一男一女的概率;(2)若规定分数不低于 130 分的学生为“数学尖子生” ,请你根据已知条件完成 22 列联表,并判断是否有 90%的把握认为“数学尖子生与性别有关” 附:K 2n(ad bc)2(a b)(c d)(a c)(b d)P(K2k 0) 0.10 0.0
10、5 0.010 0.005 0.001k0 2.706 3.841 6.635 7.879 10.828答案 (1) (2)有关35解析 (1)由已知得,抽取的 100 名学生中,男生 60 名,女生 40 名分数低于 110 分的学生中,男生有 600.053(人) ,记为 A1,A 2,A 3;女生有 400.052( 人),记为B1,B 2.从中随机抽取两名学生,所有的可能结果共有 10 种,它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2)(B1, B2)
11、;其中两名学生恰好为一男一女的可能结果共有 6 种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A3,B 1),(A 3,B 2)所求概率为 P .610 35(2)由频率分布直方图可知,在抽取的 100 名学生中,分数不低于 130 分的男生人数为 600.2515,分数不低于 130 分的女生人数为 400.416,据此可得 22 列联表如下:数学尖子生 非数学尖子生 合计男生 15 45 60女生 16 24 40合计 31 69 100K 2 2.5250.75,所以 x 与 y 之间具有很强的线性相关关系(4)当 x10 时, 1.2310
12、0.0812.38,即估计使用年限为 10 年时,维修费用约为 12.38 万元y 5(2018广东韶关期末)某商店为了更好地规划某种商品的进货量,从某一年的销售数据中,随机抽取了 8 组数据作为研究对象,如下表所示(x 为该商品的进货量,y 为销售天数) x/吨 2 3 4 5 6 8 9 11y/天 1 2 3 3 4 5 6 8(1)根据上表数据在下图所示的网格中绘制散点图;(2)根据上表提供的数据,求出 y 关于 x 的线性回归方程 x ;y b a (3)根据(2)中的计算结果,若该商店准备一次性进货 24 吨,预测需要销售的天数参考公式和数据: , y x;b n i 1xiyi
13、nxy n i 1xi2 nx2 a b xi2356, xiyi241.8 i 1 8 i 1答案 (1)略 (2) x (3)17 天y 4968 1134解析 (1)散点图如图所示:(2)依题意,得 x (23 4568911)6,18y (123345 68) 4,18又 xi2356, xiyi241,8 i 1 8 i 1所以 , 4 6 ,b 8 i 1xiyi 8xy 8 i 1xi2 8x2 241 864356 862 4968 a 4968 1134故线性回归方程为 x .y 4968 1134(3)由(2)知,当 x24 时, 24 17,y 4968 1134故若该商店一次性进货 24 吨,则预计需要销售 17 天