1、2013 湖南高考数学一轮复习-统计案例I 卷一、选择题1 为了考察两个变量 x、y 的线性相关关系,李明与李达分别独立做了 30 次、50 次试验. 已知两人试验中 x、y 的平均值恰好相等,均为 ,xmyn,两人分别求得回归直线 12,l, 那么 ( )A 12l与 相交于点(m,n) B 12l和 重合C 12l与 平行 D 12l与 垂直【答案】A2 .如果有 95%的把握说事件 A 和 B 有关系,那么具体计算出的数据 ( )AK 23.841 BK 26.635 DK 25.024,所以有理由认为休闲方式与性别有关是合理的,即我们有 97.5%的把握认为休闲方式与性别有关.14某农
2、科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温度与实验室每天每 100 颗种子中的发芽数,得到如下资料:该农科所确定的研究方案是:先从这五组数据中选取 2 组,用剩下的 3 组数据求线性回归方程,再对被选取 2 组数据进行检验.(1)求选取的 2 组数据恰好是不相邻 2 天数据的概率;(2)若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 2 日至 12 月 4 日的数据,求出 y 关于 x 的线性回归方程 ybxa;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误
3、差均不超过 2 颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?【答案】 (1)设抽到不相邻的两组数据为事件 A,因为从 5 组数据中选取 2 组数据共有 10 种情况:休 闲 方式性 别(1,2) , (1,3) , (1,4) , (1,5) , (2,3) , (2,4) , (2,5) , (3,4) , (3,5) , (4,5) ,其中数据为 12 月份的日期数.每种情况都是可能出现的,事件 A 包括的基本事件有 6 种.所以 P(A) 6105.所以选取的 2 组数据恰好是不相邻 2 天数据的概率是 5.15一台机器使用的时间较长,但还可以使用,它
4、按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转速度的变化而变化,下表为抽样试验的结果:转速 x(转秒) 16 14 12 8每小时生产有缺点的零件数 y(件) 11 9 8 5(1)利用散点图或相关系数 r 的大小判断变量 y 对 x 是否线性相关?为什么?(2)如果 y 对 x 有线性相关关系,求线性回归方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为 10 个,那么机器的运转速度应控制在什么范围内?(最后结果精确到 0.001,参考数据:25.617,161114912885438,16 214 212 28 2660,11 29 28
5、 2656.255 2291)【答案】(1) 12.5, 8.25, (xi )(yi )25.5,x y 4 i 1 x y r0.050.995,由检验水平 0.05 及 n22,在附录 1 中查得 r0.050.950,因为 0.9950.950, y 与 x 具有线性相关关系(2) (xi )235,4 i 1 x0.729, 0.863.y x线性回归方程为0.729 x0.863.(3)0.729x0.86310,解得 x14.901,故机器运转速度应在每秒 14 转之内16下表为某百货公司 16 月份销售量与利润之间的数量关系:月份 1 月 2 月 3 月 4 月 5 月 6 月
6、销售量 x 万件 10 11 13 12 8 6利润 y 万元 22 25 29 26 16 12现从具有线性相关关系这六组数据中选取 4 组数据求线性回归方程,再用剩下的 2 组数据进行检验(1)根据 2 至 5 月份的数据,求出 y 关于 x 的线性回归方程 x;(2)若由线性回归方程得到的估计数据与剩下的检验数据的误差均不超过 2 万元,则认为得到的线性回归方程是理想的,试问所得线性回归方程是否理想?【答案】(1)由表中数据求得 11, 24,x y所以 y 关于 x 的线性回归方程为 x 187 307(2)当 x10 时, y 10 ,187 307 1507此时| 22|2.706
7、,由 P( 22.706)0.10,所以有 90%的把握认为药物有效19有人发现了一个有趣的现象,中国人的邮箱名称里含有数字的比较多,而外国人邮箱名称里含有数字的比较少为了研究国籍和邮箱名称里是否含有数字的关系,他收集了 124 个邮箱名称,其中中国人的有 70 个,外国人的有 54 个,中国人的邮箱中有 43 个含数字,外国人的邮箱中有 21 个含数字(1)根据以上数据建立一个 22 列联表;(2)他发现在这组数据中,外国人邮箱名称里含数字的也不少,他不能断定国籍和邮箱名称里是否含有数字有无关系,你能帮他判断一下吗?【答案】(1)22 列联表如下:有数字 无数字 合计中国人 43 27 70
8、外国人 21 33 54合计 64 60 124(2)假设“国籍和邮箱名称里是否含有数字无关” 由表中数据得 2 6.201,1244333 2721270546460因为 23.841,所以有理由认为“国籍和邮箱名称里是否含有数字无关”是不合理的,即有 95%的把握认为“国籍和邮箱名称里是否含有数字有关” 20下表是某地区的一种传染病与饮用水卫生程度的调查表:得病 未得病 合计干净水 52 466 518不干净水 94 218 312合计 146 684 830(1)得这种传染病(简称得病)是否与饮用不干净水有关?请说明理由;(2)若饮用干净水得病的有 5 人,未得病的有 50 人;饮用不干
9、净水得病的有 9 人,未得病的有22 人按此样本数据分析:得这种传染病是否与饮用不干净水有关?并比较两种样本在反映总体时的差异【答案】(1)提出假设 H0:得这种传染病与饮用不干净水无关由表中数据可得 2 54.212.83052218 466942518312146684因为当 H0成立时, 210.828 的概率约为 0.001,所以我们有 99.9%的把握认为:得这种传染病与饮用不干净水有关(2)依题意得 22 列联表:得病 未得病 合计干净水 5 50 55不干净水 9 22 31合计 14 72 86此时, 2 5.785.86522 509255311472因为当 H0成立时, 25.024 的概率约为 0.025,所以我们有 97.5%的把握认为:得这种传染病与饮用不干净水有关两个样本都能得到“得这种传染病与饮用不干净水有关”这一结论,但(1)中我们有 99.9%的把握肯定结论,(2)中我们只有 97.5%的把握肯定结论