1、 第二章 统 计(A)(时间:120 分钟 满分:150 分)一、选择题(本大题共 12 小题,每小题 5 分,共 60 分)1从某年级 1 000 名学生中抽取 125 名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( )A1 000 名学生是总体B每个被抽查的学生是个体C抽查的 125 名学生的体重是一个样本D抽取的 125 名学生的体重是样本容量2由小到大排列的一组数据 x1,x 2,x 3,x 4,x 5,其中每个数据都小于1,那么对于样本 1,x 1,x 2,x 3,x 4,x 5 的中位数可以表示为( )A. (1x 2) B. (x2x 1)12 12C. (1x 5
2、) D. (x3x 4)12 123某单位有老年人 27 人,中年人 54 人,青年人 81 人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为 36 的样本,则老年人、中年人、青年人分别应抽取的人数是( )A7,11,19 B6,12,18C6,13,17 D7,12,174对变量 x,y 有观测数据(x i,y i)(i1,2,10) ,得散点图 1;对变量 u,v 有观测数据(u i,v i)(i1,2,10) ,得散点图 2.由这两个散点图可以判断( )A变量 x 与 y 正相关,u 与 v 正相关B变量 x 与 y 正相关,u 与 v 负相关C变量 x 与 y 负相关,
3、u 与 v 正相关D变量 x 与 y 负相关,u 与 v 负相关5已知一组数据 x1,x 2,x 3,x 4,x 5 的平均数是 2,方差是 ,那么另一组数133x12,3x 22,3x 32,3x 42,3x 52 的平均数,方差分别是( )A2, B2,113C4, D4,3236某学院有 4 个饲养房,分别养有 18,54,24,48 只白鼠供实验用某项实验需抽取 24只白鼠,你认为最合适的抽样方法是( )A在每个饲养房各抽取 6 只B把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定 24 只C从 4 个饲养房分别抽取 3,9,4,8 只D先确定这 4 个饲养房应分别抽取 3,9,4
4、,8 只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定7下列有关线性回归的说法,不正确的是( )A相关关系的两个变量不一定是因果关系B散点图能直观地反映数据的相关程度C回归直线最能代表线性相关的两个变量之间的关系D任一组数据都有回归直线方程8已知施肥量与水稻产量之间的回归直线方程为 4.75x257,则施肥量 x30 时,y 对产量 y 的估计值为( )A398.5 B399.5C400 D400.59在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续 10 天,每天新增疑似病例不超过 7 人” 根据过去 10 天甲、乙、丙、丁四地新增疑似病
5、例数据,一定符合该标志的是( )A甲地:总体均值为 3,中位数为 4B乙地:总体均值为 1,总体方差大于 0C丙地:中位数为 2,众数为 3D丁地:总体均值为 2,总体方差为 310某高中在校学生 2 000 人,高一与高二人数相同并都比高三多 1 人为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动每人都参加而且只参与了其中一项比赛,各年级参与比赛人数情况如下表:高一 高二 高三跑步 a b c登山 x y z其中 abc235,全校参与登山的人数占总人数的 .为了了解学生对本次活动25的满意程度,从中抽取一个 200 人的样本进行调查,则高二参与跑步的学生中应抽取( )A3
6、6 人 B60 人 C24 人 D30人11某赛季,甲、乙两名篮球运动员都参加了 11 场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为( )A19,13 B13,19C20,18 D18,2012从一堆苹果中任取了 20 个,并得到它们的质量(单位:克) 数据分布表如下:分组 90,100) 100,110) 110,120) 120,130) 130,140) 140,150频数 1 2 3 10 3 1则这堆苹果中,质量不小于 120 克的苹果数约占苹果总数的( )A30% B70%C60% D50%题号 1 2 3 4 5 6 7 8 9 1
7、0 11 12答案二、填空题(本大题共 4 小题,每小题 5 分,共 20 分)13甲、乙、丙、丁四名射击手在选拔赛中的平均环数 及其标准差 s 如下表所示,则x选送决赛的最佳人选应是_甲 乙 丙 丁x 7 8 8 7s 2.5 2.5 2.8 314.一组数据 23,27,20,18,x,12,它们的中位数是 21,即 x 是_15某市居民 20052009 年家庭年平均收入 x(单位:万元) 与年平均支出 Y(单位:万元)的统计资料如下表所示:年份 2005 2006 2007 2008 2009收入 x 11.5 12.1 13 13.3 15支出 Y 6.8 8.8 9.8 10 12
8、根据统计资料,居民家庭年平均收入的中位数是_,家庭年平均收入与年平均支出有_线性相关关系16某单位为了了解用电量 y 度与气温 x之间的关系,随机统计了某 4 天的用电量与当天气温.气温() 14 12 8 6用电量(度) 22 26 34 38由表中数据得回归直线方程 x 中 2,据此预测当气温为 5时,用电量y b a b 的度数约为_三、解答题(本大题共 6 小题,共 70 分)17(10)一批产品中,有一级品 100 个,二级品 60 个,三级品 40 个,用分层抽样的方法,从这批产品中抽取一个容量为 20 的样本,写出抽样过程18(12 分) 为了了解学生的体能情况,某校抽取部分学生
9、进行一分钟跳绳次数测试,所得数据整理后,画出频率分布直方图(如下) ,图中从左到右各小长方形面积之比为24171593,第二小组频数为 12.(1)学生跳绳次数的中位数落在哪个小组内?(2)第二小组的频率是多少?样本容量是多少?(3)若次数在 110 以上(含 110 次)为良好,试估计该学校全体高一学生的良好率是多少?19(12 分) 为了研究三月下旬的平均气温(x)与四月棉花害虫化蛹高峰日(y)的关系,某地区观察了 2003 年至 2008 年的情况,得到下面数据:年份 2003 2004 2005 2006 2007 2008x() 24.4 29.6 32.9 28.7 30.3 28
10、.9y 19 6 1 10 1 8已知 x 与 y 之间具有线性相关关系,据气象预测该地区在 2010 年三月下旬平均气温为27,试估计 2010 年四月化蛹高峰日为哪天?20(12 分) 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据.x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的回归直线方程 x ;y b a (3)已知该厂技改前 100 吨甲产品的生产能耗为 90 吨标准煤试根据 (2)求出回归直线方程,预测生产 100 吨甲产品的
11、生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435 464.566.5)21(12 分) 农科院的专家为了了解新培育的甲、乙两种麦苗的长势情况,从甲、乙两种麦苗的试验田中各抽取 6 株麦苗测量麦苗的株高,数据如下:(单位:cm )甲:9,10,11,12,10,20乙:8,14,13,10,12,21.(1)在右面给出的方框内绘出所抽取的甲、乙两种麦苗株高的茎叶图;(2)分别计算所抽取的甲、乙两种麦苗株高的平均数与方差,并由此判断甲、乙两种麦苗的长势情况22(12 分) 从高三抽出 50 名学生参加数学竞赛,由成绩得到如下的频率分布直方图试利用频率分布直方图求:(1)这 50 名学生
12、成绩的众数与中位数(2)这 50 名学生的平均成绩第二章 统 计(A)1C 在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量 ”因此题中所指的对象应是体重,故 A、B 错误,样本容量应为125,故 D 错误2C 由题意把样本从小到大排序为 x1,x 3,x 5,1,x 4,x 2,因此得中位数为(1x 5)123B 因 27 54811 23, 366, 3612, 3618.16 26 364C 由点的分布知 x 与 y 负相关,u 与 v 正相关5D 因为数据 x1,x 2,x 3
13、,x 4,x 5 的平均数是 2,方差是 ,所以 2, (xi2)13 x 15 5 i 12 ,13因此数据 3x12,3x 22,3x 32,3x 42,3x 52 的平均数为: (3xi2)15 5 i 13 xi24,15 5 i 1方差为: (3xi2 )2 (3xi6) 29 (xi2) 29 3.15 5 i 1 x 15 5 i 1 15 5 i 1 136D 因为这 24 只白鼠要从 4 个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠C 虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时
14、,没有表明是否具有随机性,故选 D.7D 根据两个变量具有相关关系的概念,可知 A 正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B、C 正确只有线性相关的数据才有回归直线方程,所以 D 不正确8B 成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当 x30时, 4.7530257399.5.y 9D 由于甲地总体均值为 3,中位数为 4,即中间两个数 (第 5、6 天)人数的平均数为 4,因此后面的人数可以大于 7,故甲地不符合乙地中总体均值为 1,因此这 10天的感染人数总和为 10,又由于方差大于 0,故这 10 天中不可能
15、每天都是 1,可以有一天大于 7,故乙地不符合丙地中中位数为 2,众数为 3,3 出现的最多,并且可以出现 8,故丙地不符合故丁地符合10A 由题意知高一、高二、高三的人数分别为 667,667,666.设 a2k,b3k,c 5k,则 abc 2 000,即 k120.35b3120360.又 2 000 人中抽取 200 人的样本,即每 10 人中抽取一人,则 360 人中应抽取 36 人,故选 A.11A 分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数12B 由数据分布表可知,质量不小于 120 克的苹果有 103114( 个),占苹果总数的 100%70%.1420
16、13乙解析 平均数反映平均水平大小,标准差表明稳定性标准差越小,稳定性越好14221513 正1640解析 (141286)10,x14 (22263438)30,y14 3021050.a y b x当 x5 时, 255040.y 17解 分层抽样方法:先将总体按其级别分为三层,一级品有 100 个,产品按 00,01,99 编号,二级品有 60 个,产品按 00,01,59 编号,三级品有 40 个,产品按 00,01,39 编号因总体个数样本容量为 101,故用简单随机抽样的方法,在一级品中抽 10 个,二级品中抽 6 个,三级品中抽 4 个这样就可得到一个容量为 20 的样本18解
17、(1)前三组的频率和为 ,2 4 17 1550 385012中位数落在第四小组内(2)频率为: 0.08,42 4 17 15 9 3又频率 ,第 二 小 组 频 数样 本 容 量样本容量 150.频 数频 率 120.08(3)由图可估计所求良好率约为:100%88%.17 15 9 32 4 17 15 9 319解 由题意知:29.13, 7.5, x 5 130.92,x y 6 i 12ixiyi1 222.6,6 i 1 2.2,b 6 i 1xiyi 6x y 6 i 1x2i 6x2 71.6,a y b x回归直线方程为 2.2x71.6.y 当 x27 时, 2.2277
18、1.612.2,据此,可估计该地区 2010 年 4 月 12 日或y 13 日为化蛹高峰日20解 (1)散点图如下:(2) 4.5,x3 4 5 64 3.5,y2.5 3 4 4.54xiyi32.5435464.566.5,4 i 1x 3 24 25 26 286,4 i 12i 0.7,b 4 i 1xiyi 4x y 4 i 1x2i 4x2 66.5 43.54.586 44.52 3.50.74.50.35.a y b x 0.7x0.35.y 所求的回归直线方程为 0.7x0.35.y (3)现在生产 100 吨甲产品用煤0.71000.3570.35,y 9070.3519
19、.65.生产能耗比技改前降低约 19.65 吨标准煤21解 (1)茎叶图如图所示:(2) 甲 12,x9 10 11 12 10 206乙 13,x8 14 13 10 12 216s (912) 2(1012) 2(1112) 2(12 12) 2(1012) 2(2012) 213.67,2甲16s (813) 2(1413) 2(1313) 2(10 13) 2(1213) 2(2113) 216.67.2乙16因为 甲 0.5,中位数应位于第四个小矩形内设其底边为 x,高为 0.03,令 0.03x0.2 得 x6.7,故中位数约为 706.776.7.(2)样本平均值应是频率分布直方图的“重心” ,即所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可平均成绩为 45(0.00410)55(0.00610) 65(0.02 10)75(0.0310)85(0.02110)95(0.01610) 74.