1、1第三章 统计案例滚动训练五(3.13.2)一、选择题1下列语句表示的事件中的因素不具有相关关系的是( )A瑞雪兆丰年 B名师出高徒C吸烟有害健康 D喜鹊叫喜,乌鸦叫丧考点 回归分析题点 回归分析的概念和意义答案 D解析 “喜鹊叫喜,乌鸦叫丧”是一种迷信说法,它们之间无任何关系,故选 D.2对两个变量 y 与 x 进行回归分析,分别选择不同的模型,它们的相关系数 r 如下,其中拟合效果最好的模型是( )模型的相关系数 r 为0.98;模型的相关系数 r 为 0.80;模型的相关系数 r为0.50;模型的相关系数 r 为 0.25.A B C D考点 线性相关系数题点 线性相关系数的应用答案 A
2、解析 相关系数的绝对值越大,其相关性越强,模型相关系数为0.98,其绝对值最大,相关性也最强,模型的拟合效果最好,故选 A.3下列关于 K2的说法正确的是( )A K2在任何相互独立的问题中都可以用来检验有关系还是无关系2B K2的值越大,两个事件的相关性就越大C K2是用来判断两个分类变量是否有关系的随机变量,只对两个分类变量适用D K2的观测值的计算公式为 knad bca bc da cb d考点 独立性检验及其基本思想题点 独立性检验的方法答案 C解析 本题主要考查对 K2的理解, K2是用来判断两个分类变量是否有关系的随机变量,所以 A 错; K2的值越大,说明我们能以更大的把握认为
3、两个分类变量有关系,不能判断相关性的大小,所以 B 错;D 中( ad bc)应为( ad bc)2.4已知变量 x 与 y 具有相关关系,且由观测数据得到的样本数据散点图如图所示,则由该观测数据求得的回归方程可能是( )A. 1.314 x1.520y B. 1.314 x1.520y C. 1.314 x1.520y D. 1.314 x1.520y 考点 线性回归方程题点 求线性回归方程答案 B解析 由样本数据散点图可知,回归方程中 0, 0,故选 B.a b 5下列说法中,错误说法的个数是( )将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;回归方程 37 x,变量 x 增
4、加 1 个单位时, 平均增加 7 个单位;y y 在一个 22 列联表中,若 K2的观测值 k13.079,则有 99.9%以上的把握认为两个变量之间有关系A0 B1 C2 D33答案 B考点 线性回归分析题点 线性回归方程的应用解析 数据的方差与加了什么样的常数无关,故正确;对于回归方程 37 x,变量 x 增y 加 1 个单位时, 平均减少了 7 个单位,故错误;若 k13.07910.828,则有 99.9%以上y 的把握认为这两个变量之间有关系,故正确6某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了 3 000 人,计算发现 K2的观测值 k6.023,则市政府认为
5、市民收入增减与旅游愿望有关系的可信度是( )A90% B95%C97.5% D99.5%考点 独立性检验及其基本思想题点 独立性检验的方法答案 C解析 由临界值表得 P(K25.024)0.025,而 6.0235.024,所以认为市民收入增减与旅游愿望有关系的可信度为 97.5%.7高三某班学生每周用于数学学习的时间 x(单位:小时)与数学成绩 y(单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13y 92 79 97 89 64 47 83 68 71 59根据上表可得回归方程的系数 3.53.若某学生每周用于数学学习的时间为 18 小时,则可b 预测
6、该学生的数学成绩(结果保留整数)是( )A71 分 B80 分 C74 分 D77 分考点 线性回归分析题点 线性回归方程的应用答案 D解析 学生每周用于数学学习的时间的平均值 17.4(小时),数学成绩的平均值x24 15 23 19 16 11 20 16 17 1310 74.9(分),所以y92 79 97 89 64 47 83 68 71 5910 74.93.5317.413.478.a y b x4当 x18 时, 3.531813.47877.01877,所以预测该学生的数学成绩为 77 分y 8某市通过随机询问 100 位市民能否做到“光盘” ,得到如下的 22 的列联表:
7、不能做到“光盘” 能做到“光盘” 总计男 45 10 55女 30 15 45总计 75 25 100下列说法正确的是( )A在犯错误的概率不超过 1%的前提下,认为“该市居民能做到光盘与性别有关”B在犯错误的概率不超过 1%的前提下,认为“该市居民能做到光盘与性别无关”C有 90%的把握认为“该市居民能做到光盘与性别有关”D有 90%的把握认为“该市居民能做到光盘与性别无关”考点 独立性检验及其基本思想题点 独立性检验的方法答案 C解析 由题设知, K2 3.0302.706 ,有 90%的把握认为1004515 3010255457525“该市居民能做到光盘与性别有关” 二、填空题9某车间
8、为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验根据收集到的数据(如下表),由最小二乘法求得回归方程 0.67 x54.9.y 零件数 x(个) 10 20 30 40 50加工时间 y(min) 62 75 81 89现发现表中有一个数据模糊看不清,请你推断出该数据的值为_考点 线性回归方程题点 样本点中心的应用答案 68解析 由表知 30,设模糊不清的数据为 m,x则 (62 m758189) ,y15 307 m5因为 0.67 54.9,y x即 0.673054.9,307 m55解得 m68.10面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场以降低
9、生产成本,某白酒酿造企业市场部对该企业 9 月份的产品销量(千箱)与单位成本(元)的资料进行线性回归分析,结果如下: , 71, 79, iyi1 x72 y 6i 1x2i 6i 1x481, 1.818 2, 71(1.818 2) 77.36,则销量每增b 1 481 6727179 6(72)2 a 72加 1 千箱,单位成本下降_元考点 线性回归分析题点 线性回归方程的应用答案 1.818 2解析 由已知得 1.818 2x77.36,销售量每增加 1 千箱,则单位成本下降 1.818 2y 元11为了调查患慢性气气管炎是否与吸烟有关,调查了 100 名 50 岁以下的人,调查结构如
10、下表:患慢性气管炎 未患慢性气管炎 总计吸烟 20 20 40不吸烟 5 55 60总计 25 75 100根据列联表数据,求得 K2_(保留 3 位有效数字),根据下表,在犯错误的概率不超过_的前提下认为患慢性气管炎与吸烟有关附:P(K2 k0) 0.050 0.010 0.001k0 3.841 6.635 10.828K2 .nad bc2a bc da cb d考点 独立性检验及其基本思想题点 独立性检验的方法6答案 22.2 0.001解析 K2的观测值 k1002055 20524060257522.210.828.所以在犯错误的概率不超过 0.001 的前提下认为患慢性气管炎与吸
11、烟有关三、解答题12某高校共有学生 15 000 人,其中男生 10 500 人,女生 4 500 人为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集 300 位学生每周平均体育运动时间(单位:时)的样本数据(1)应收集多少位女生样本数据?(2)根据这 300 个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为0,2),2,4),4,6),6,8),8,10),10,12估计该校学生每周平均体育运动时间超过 4 小时的概率(3)在样本数据中,有 60 位女生的每周平均体育运动时间超过 4 个小时,请完成每周平均体育运动时间与性别的列
12、联表,并判断在犯错误的概率不超过 0.05 的前提下是否认为“该校学生的每周平均体育运动时间与性别有关” 附:P(K2 k0) 0.100 0.050 0.010 0.005k0 2.706 3.841 6.635 7.879K2 .nad bc2a bc da cb d考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 (1)由分层抽样可得 300 90,所以应收集 90 位女生的样本数据4 50015 000(2)由频率分布直方图得学生每周平均体育运动超过 4 小时的频率为 12(0.1000.025)0.75,所以该校学生每周平均体育运动时间超过 4 小时的概率的估计值为
13、 0.75.(3)由(2)知,300 位学生中有 3000.75225(人)的每周平均体育运动时间超过 4 小时,75人的每周平均体育运动时间不超过 4 小时样本数据中有 210 份是关于男生的,90 份是关7于女生的,可得每周平均体育运动时间与性别列联表:男生 女生 总计每周平均体育运动时间不超过 4 小时 45 30 75每周平均体育运动时间超过 4 小时 165 60 225总计 210 90 300结合列联表可算得 K2的观测值k 4.7623.841.3004560 3016527522521090所以有 95%的把握认为“该校学生的每周平均体育运动时间与性别有关” 四、探究与拓展1
14、3已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数 y3e 2x1 的图象附近,则可通过转换得到的线性回归方程为_考点 非线性回归分析题点 非线性回归分析答案 y1ln 32 x解析 由 y3e 2x1 ,得 ln yln(3e 2x1 ),即 ln y2 x1ln 3,令 uln y, v x,则线性回归方程为 u1ln 32 v.14甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸 x(单位:cm)及个数y,如下表:零件尺寸 x 1.01 1.02 1.03 1.04 1.05甲 3 7 8 9 3零件个数 y 乙 7 4 4 4 a由表中数据得 y 关于 x 的线性
15、回归方程为 91100 x(1.01 x1.05),其中合格零件尺y 寸为 1.030.01(cm)完成下面列联表,并判断是否有 99%的把握认为加工零件的质量与甲、乙有关?合格零件数 不合格零件数 总计甲乙总计考点 独立性检验思想的应用8题点 独立性检验与线性回归方程的综合应用解 1.03, ,由 91100 x 知, 911001.03,x ya 495 y a 495所以 a11,由于合格零件尺寸为 1.030.01 cm,故甲、乙加工的合格与不合格零件的数据表为:合格零件数 不合格零件数 总计甲 24 6 30乙 12 18 30总计 36 24 60所以 K2nad bc2a bc da cb d 10,602418 612230303624因为 K2106.635,故有 99%的把握认为加工零件的质量与甲、乙有关