1、限时规范训练十八 统计与统计案例限时 45 分钟,实际用时_分值 81 分,实际得分_ 一、选择题(本题共 6 小题,每小题 5 分,共 30 分)1(2017山东烟台模拟)将参加夏令营的 600 名学生编号为:001,002,600.采用系统抽样方法抽取一个容量为 50 的样本,且随机抽得的号码为 003.这 600 名学生分住在三个营区,从 001 到 300 在第营区,从 301 到 495 在第营区,从 496 到 600 在第营区,三个营区被抽中的人数依次为( )A26,16,8 B25,17,8C25,16,9 D24,17,9解析:选 B.由题意知间隔为 12,故抽到的号码为 1
2、2k3( k0,1,49),列出不60050等式可解得:第营区抽 25 人,第营区抽 17 人,第营区抽 8 人2(2017山东济宁模拟)某班主任对全班 50 名学生进行了作业量的调查,数据如下表:认为作业量大 认为作业量不大 总计男生 18 9 27女生 8 15 23总计 26 24 50若推断“学生的性别与认为作业量大有关” ,则这种推断犯错误的概率不超过( )A0.01 B0.025C0.10 D0.05解析:选 B.K2 5.0595.024,因为 P(K25.024)50 1815 89 2262427230.025,所以这种推断犯错误的概率不超过 0.025.3一组数据共有 7
3、个数,记得其中有 10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为( )A9 B3C17 D11解析:选 A.设这个数为 x,则平均数为 ,25 x7众数为 2,若 x2,则中位数为 2,此时 4 2,25 x7x11;若 2 x4,则中位数为 x,此时 2x 2, x3;25 x7若 x4,则中位数为 4,24 2, x17,25 x7所有可能值为11,3,17,故其和为113179.4(2017广东广州模拟)如图是民航部门统计的 2017 年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表
4、,根据图表,下面叙述不正确的是( )A深圳的变化幅度最小,北京的平均价格最高B深圳和厦门的春运期间往返机票价格同去年相比有所下降C平均价格从高到低居于前三位的城市为北京、深圳、广州D平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门解析:选 D.由图可知深圳对应的小黑点最接近 0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故 A 正确;由图可知深圳和厦门对应的小黑点在 0%以下,故深圳和厦门的价格同去年相比有所下降,故 B 正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故 C 正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故 D 错误选
5、 D.5某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价 x(元) 4 5 6 7 8 9销量 y(件) 90 84 83 80 75 68由表中数据,求得线性回归方程 4 x ,若在这些样本点中任取一点,则它在回归直y a 线左下方的概率为( )A. B.16 13C. D.12 23解析:选 B.由表中数据得 6.5, 80.x y由( , )在直线 4 x 上,得 106.x y y a a 即线性回归方程为 4 x106.y 经过计算只有(5,84)和(9,68)在直线的下方,故所求概率为 .26 136(2016高考全国卷)某旅游城市为向
6、游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图图中 A 点表示十月的平均最高气温约为 15, B 点表示四月的平均最低气温约为 5.下面叙述不正确的是( )A各月的平均最低气温都在 0以上B七月的平均温差比一月的平均温差大C三月和十一月的平均最高气温基本相同D平均最高气温高于 20的月份有 5 个解析:选 D.依据给出的雷达图,逐项验证对于选项 A,由图易知各月平均最低气温都在0以上,A 正确;对于选项 B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,B 正确;对于选项 C,三月
7、和十一月的平均最高气温均为 10,所以 C 正确;对于选项 D,平均最高气温高于 20的月份有七月、八月,共 2 个月份,故 D 错误二、填空题(本题共 3 小题,每小题 5 分,共 15 分)7(2017山西太原模拟)为了研究雾霾天气的治理,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为 4, y, z,依次构成等差数列,且 4, y, z4 成等比数列,若用分层抽样抽取 6 个城市,则乙组中应抽取的城市个数为_解析:由题意可得Error!即Error!解得 z12,或 z4(舍去),故 y8.所以甲、乙、丙三组城市的个数分别为 4,8,
8、12.因为一共要抽取 6 个城市,所以抽样比为 .64 8 12 14故乙组城市应抽取的个数为 8 2.14答案:28如图是我市某小区 100 户居民 2016 年月平均用水量(单位:t)的频率分布直方图的一部分,则该小区 2016 年的月平均用水量的中位数的估计值为_解析:由图可知,前五组的频率依次为 0.04,0.08,0.15,0.22,0.25,因此前五组的频数依次为 4,8,15,22,25,由中位数的定义,应是第 50 个数与第 51 个数的算术平均数,而前四组的频数和:48152249,是第五组中第 1 个数与第 2 个数的算术平均数,中位数是2(2.52) 2.02.125答案
9、:2.029(2017山东潍坊模拟)2016 年 11 月某校高三 2000 名同学参加了一次数学调研测试,利用简单随机抽样从中抽取了部分同学的成绩进行统计分析,由于工作人员的失误,学生成绩分析的茎叶图和频率分布直方图均受到不同程序的破坏,但可见部分信息如图所示,则总体中分数在80,90)内的人数为_解析:由茎叶图可知分数在50,60)内的频数为 2,由频率分布直方图可知,分数在50,60)内的频率为 100.0080.08,所以样本容量为 n 25.由茎叶图可得,分数在60,70)内20.08的频数为 7,分数在70,80)内的频数为 10.由频率分布直方图可知,分数在90,100)和50,
10、60)内的频率相等,所以频数也相等,故分数在90,100)内的频数为 2.所以分数在80,90)内的频数为 25(27102)4,对应的频率为 0.16.所以总体中分数在80,90)内的人数为 2 4250000.16320.答案:320三、解答题(本题共 3 小题,每小题 12 分,共 36 分)10(2016高考四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成 9 组,制成了如图所示的频率分布直方图(1)求直方图中 a 的值;(2)
11、设该市有 30 万居民,估计全市居民中月均用水量不低于 3 吨的人数说明理由;(3)估计居民月均用水量的中位数解:(1)由频率分布直方图,可知:月均用水量在0,0.5)的频率为 0.080.50.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由 1(0.040.080.210.250.060.040.02)0.5 a0.5 a,解得 a0.30.(2)由(1)知,100 位居民月均用水量不低于 3 吨的频率为 0.060.040.020.12.由以上样本的频率分布,可以
12、估计 30 万居民中月均用水量不低于 3 吨的人数为 300 0000.1236 000.(3)设中位数为 x 吨因为前 5 组的频率之和为 0.040.080.150.210.250.730.5.而前 4 组的频率之和为 0.040.080.150.210.480.5.所以 2 x2.5.由 0.50(x2)0.50.48,解得 x2.04.故可估计居民月均用水量的中位数为 2.04 吨11某网络广告 A 公司计划从甲、乙两个网站选择一个网站拓展广告业务,为此 A 公司随机抽取了甲、乙两个网站某月中 10 天的日访问量 n(单位:万次),整理后得到如下茎叶图,已知 A 公司要从网站日访问量的
13、平均值和稳定性两方面进行考量选择.(1)请说明 A 公司应选择哪个网站;(2)现将抽取的样本分布近似看作总体分布, A 公司根据所选网站的日访问量 n 进行付费,其付费标准如下:选定网站的日访问量 n(单位:万次)A 公司的付费(单位:元/日)n25 50025 n35 700n35 1 000求 A 公司每月(按 30 天计)应付给选定网站的费用 S.解:(1)由茎叶图可知甲 (15242825303630323545)1030,xs (1530) 2(2430) 2(2830) 2(2530) 2(3030) 2(3630)2甲1102(3030) 2(3230) 2(3530) 2(45
14、30) 258,乙 (18252224323830363540)1030,xs (1830) 2(2530) 2(2230) 2(2430) 2(3230) 2(3830)2乙1102(3030) 2(3630) 2(3530) 2(4030) 249.8, 甲 乙 , s s , A 公司应选择乙网站x x 2甲 2乙(2)由(1)得 A 公司应选择乙网站,由题意可得乙网站日访问量 n25 的概率为 0.3,日访问量 25 n35 的概率为 0.4,日访问量 n35 的概率为 0.3, A 公司每月应付给乙网站的费用 S30(5000.37000.41 0000.3)21 900元12(20
15、17高考全国卷)为了监控某种零件的一条生产线的生产过程,检验员每隔 30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm)下面是检验员在一天内依次抽取的 16 个零件的尺寸:抽取次序 1 2 3 4 5 6 7 8零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04抽取次序 9 10 11 12 13 14 15 16零件尺寸 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得 xi9.97, s 0.212, x11616 i 1 11616 i 1 xi x 2 116 16 i 1x2
16、i 16x218.439,16 i 1 i 8.5 2(xi )(i8.5)2.78,其中 xi为抽取的第 i 个零件的尺寸, i1,2,16.16 i 1 x(1)求( xi, i)(i1,2,16)的相关系数 r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若| r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小)(2)一天内抽检零件中,如果出现了尺寸在( 3 s, 3 s)之外的零件,就认为这条生产线x x在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查()从这一天抽检的结果看,是否需对当天的生产过程进行检查?()在(
17、3 s, 3 s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产x x的零件尺寸的均值与标准差(精确到 0.01)附:样本( xi, yi)(i1,2, n)的相关系数 r ,ni 1 xi x yi yni 1 xi x 2ni 1 yi y 20.09.0.008解:(1)由样本数据得( xi, i)(i1,2,16)的相关系数r 0.18.16i 1 xi x i 8.516i 1 xi x 216i 1 i 8.5 2 2.780.2121618.439由于| r|0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(2)()由于 9.97, s0.212,因此由样本数据可以看出抽取的第 13 个零件的尺寸在x( 3 s, 3 s)以外,因此需对当天的生产过程进行检查x x()剔除离群值,即第 13 个数据,剩下数据的平均数为 (169.979.22)10.02,115这条生产线当天生产的零件尺寸的均值的估计值为 10.02.160.212 2169.97 21 591.134,16i 1x2i剔除第 13 个数据,剩下数据的样本方差为(1 591.1349.22 21510.02 2)0.008,115这条生产线当天生产的零件尺寸的标准差的估计值为 0.09.0.008