1、“统计与统计案例”双基过关检测一、选择题1(2017邯郸摸底)某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一 600 人、高二 780 人、高三 n 人中,抽取 35 人进行问卷调查已知高二被抽取的人数为 13,则 n( )A660 B720C780 D800解析:选 B 由已知条件,抽样比为 ,13780 160从而 ,解得 n720.35600 780 n 1602已知变量 x 与 y 正相关,且由观测数据算得样本平均数 3, 3.5,则由该观测x y数据算得的线性回归方程可能为( )A. 0.4x2.3 B. 2x2.4y y C. 2x9.5 D. 0.3x4.4y
2、y 解析:选 A 依题意知,相应的回归直线的斜率应为正,排除 C,D.且直线必过点(3,3.5),代入 A,B 得 A 正确3采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9,抽到的 32 人中,编号落入区间1,450的人做问卷 A,编号落入区间451,750 的人做问卷 B,其余的人做问卷 C,则抽到的人中,做问卷 B 的人数为( )A7 B9C10 D15解析:选 C 由题意知应将 960 人分成 32 组,每组 30 人设每组选出的人的号码为30k9( k0,1,31)由 45130k975
3、0,解得 k ,又 kN,故44230 74130k15,16,24,共 10 人4根据如下样本数据得到的回归方程为 x ,则( )y b a x 3 4 5 6 7 8y 4.0 2.5 0.5 0.5 2.0 3.0 A. 0, 0 B. 0, 0 D. 0.故选 B.b a 5.如图是某学校举行的运动会上七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )7 98 4 4 6 4 79 3A84,4.84 B84,1.6C85,1.6 D85,4解析:选 C 依题意,所剩数据的平均数是 80 (4367)85,所剩数据的方15差是
4、3(8485) 2(86 85)2(8785) 21.6.156.如图是依据某城市年龄在 20 岁到 45 岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在30,35)、35,40)、40,45 的网民人数成递减的等差数列,则年龄在35,40)的网民出现的频率为( )A0.04 B0.06C0.2 D0.3解析:选 C 由题意得,年龄在 20,25)的网民出现的频率为 0.0150.05,25,30)的网民出现的频率为 0.0750.35,又30,35)、35,40)、40,45的网民人数成递减的等差数列,则其频率也成等差数列,又30,45的频率为 10.05 0.350.6,则年龄在
5、35,40) 的网民出现的频率为 0.2.7通过随机询问 110 名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如表所示的 22 列联表:男 女 总计走天桥 40 20 60走斑马线 20 30 50总计 60 50 110由 K2 ,nad bc2a bc da cb d算得 K2 7.8.1104030 2020260506050附表:P(K2k 0) 0.050 0.010 0.001k0 3.841 6.635 10.828参照附表,得到的正确结论是( )A有 99%以上的把握认为“ 选择过马路的方式与性别有关”B有 99%以上的把握认为“ 选择过马路的方
6、式与性别无关”C在犯错误的概率不超过 0.1%的前提下,认为“选择过马路的方式与性别有关”D在犯错误的概率不超过 0.1%的前提下,认为“选择过马路的方式与性别无关”解析:选 A 由 K27.8,得 P(K26.635)0.01199%,有 99%以上的把握认为“选择过马路的方式与性别有关” 8(2017长沙一模)下面的茎叶图是某班学生在一次数学测试时的成绩:根据茎叶图,得出该班男、女生数学成绩的四个统计结论,其中错误的一项是( )A15 名女生成绩的平均分为 78B17 名男生成绩的平均分为 77C女生成绩和男生成绩的中位数分别为 82,80D男生中的高分段和低分段均比女生多,相比较男生两极
7、分化比较严重解析:选 C 对于 A,15 名女生成绩的平均分为(9093808082 82838385707173 756657) 78,A 正确;115对于 B,17 名男生成绩的平均分为(9393968082 83868688717475 6262685357) 77,117故 B 正确;对于 D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分化比较严重,D 正确;对于 C,根据女生和男生成绩数据分析可得,两组数据的中位数均为 80,C错误二、填空题9某中学采用系统抽样方法,从该校高一年级全体 800 名学生中抽 50 名学生做牙齿健康检查现将 800 名学生从 1 到 800 进行
8、编号已知从 3348 这 16 个数中取的数是39,则在第 1 小组 116 中随机抽到的数是_解析:间隔数 k 16,即每 16 人抽取一个人由于 392167,所以第 1 小80050组中抽取的数为 7.答案:710(2017南昌一模)若 1,2,3,4,m 这五个数的平均数为 3,则这五个数的方差为_解析:由 3 得 m5,所以这五个数的方差为 (13) 2(23) 2 1 2 3 4 m5 15(33) 2(4 3) 2(53) 2 2.答案:211(2016抚顺模拟)某学院的 A,B,C 三个专业共有 1 200 名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容
9、量为 120 的样本,已知该学院的 A专业有 380 名学生,B 专业有 420 名学生,则在该学院的 C 专业应抽取学生_名解析:抽样比为 ,A ,B 专业共抽取 384280 名,故 C 专业抽取1201 200 1101208040 名答案:4012某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外500 名未使用血清的人一年中的感冒记录作比较,提出假设 H0:“这种血清不能起到预防感冒的作用” ,利用 22 列联表计算得 K23.918,经查临界值表知 P(K23.841)0.05.则下列结论中,正确结论的序号是_有 95%的把握认为“这种血清能起到预防感冒的
10、作用” ;若某人未使用该血清,那么他在一年中有 95%的可能性得感冒;这种血清预防感冒的有效率为 95%;这种血清预防感冒的有效率为 5%.解析:K 23.9183.841,而 P(K23.814)0.05,所以有 95%的把握认为“这种血清能起到预防感冒的作用” 要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆答案:三、解答题13某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份 2006 2008 2010 2012 2014需求量(万吨) 236 246 257 276 286(1)利用所给数据求年需求量与年份之间的回归直线方程 x ;y
11、 b a (2)利用(1)中所求出的回归直线方程预测该地 2016 年的粮食需求量解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:年份2010 4 2 0 2 4需求量257 21 11 0 19 29对预处理后的数据,容易算得, 0, 3.2,x y b 4 21 2 11 219 429 503.2 42 22 22 42 5026.5,26040 3.2.a y b x由上述计算结果,知所求回归直线方程为257 (x 2010) 6.5( x2010)3.2,即 6.5( x2010) 260.2.(*)y b a y (2)利用回
12、归直线方程(*) ,可预测 2016 年的粮食需求量为 6.5(20162010)260.26.56260.2299.2( 万吨) 14(2017唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了 m 名学生进行体育测试根据体育测试得到了这 m 名学生的各项平均成绩( 满足 100 分) ,按照以下区间分为七组: 30,40),40,50),50,60),60,70) ,70,80),80,90) ,90,100,并得到频率分布直方图( 如图)已知测试平均成绩在区间30,60)内有 20 人(1)求 m 的值及中位数 n;(2)若该校学生测试平均成绩小于 n,则学校应
13、适当增加体育活动时间根据以上抽样调查数据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第 1 组,第 2 组和第 3 组的频率分别是 0.02,0.02 和 0.06,则 m(0.020.020.06)20 ,解得 m200.由直方图可知,中位数 n 位于70,80)内,则 0.020.020.060.220.04( n70)0.5,解得 n 74.5.(2)设第 i(i1,2,3,4,5,6,7)组的频率和频数分别为 pi和 xi,由图知,p10.02,p 20.02,p 30.06,p 40.22,p 50.40,p 60.18,p 70.10,则由xi200p i,可得x14,x 24,x 312,x 444,x 580,x 636,x 720,故该校学生测试平均成绩是 7474.5,x35x1 45x2 55x3 65x4 75x5 85x6 95x7200所以学校应该适当增加体育活动时间