压缩包目录
-
全部
- 2016071302152.ppt--点击预览
- 2016071302153.ppt--点击预览
- 2016071302154.ppt--点击预览
- 201607130268.doc--点击预览
- 201607130269.doc--点击预览
- 201607130270.doc--点击预览
- 201607130271.doc--点击预览
文件预览区
|
|
资源描述
主干回 顾 夯基固源 考点研析 题组 冲关 课时规 范 训练素能提升 学科培 优 一部分 抽样调查 总体 样本 都相等 抽签法 随机数法 差异明显的几个部分 相同的间隔 等距抽样 机械抽样 编号 确定分段间隔 k 简单随机抽样 加上间隔 k 加 k 主干回 顾 夯基固源 考点研析 题组 冲关 课时规 范 训练素能提升 学科培 优 频率分布直方图 茎叶图 最多 最中间 中位数 相等 样本数据的第 n项 样本容量 平均数 标准差 平方 总体的分布 总体的数字特征 等于 1 样本容量 组数 组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]频 数 12 13 24 15 16 13 7寿命 (h) [100, 200) [200,300)[300,400)[400,500)[500,600]个 数 20 30 80 40 30寿命 (h) 频 数 频 率[100,200) 20 0.10[200,300) 30 0.15[300,400) 80 0.40[400,500) 40 0.20[500,600] 30 0.15合 计 200 1 主干回 顾 夯基固源 考点研析 题组 冲关 课时规 范 训练素能提升 学科培 优 左下角 右上角 左上角 右下角 一条直线附近 距离的平方和最小 相关系数 r 正相关 负相关 不存在 0.75 强 ≤2.706 3.841 y1 y2 合 计x1 a 21 73x2 22 25 47合 计 b 46 120施化肥量 15 20 25 30 35 40 45水稻 产 量 320 330 360 410 460 470 480单 价 x(元 ) 8 8.2 8.4 8.6 8.8 9销 量 y(件 ) 90 84 83 80 75 681【高考领航】2017 届高考数学大一轮复习 第十章 统计、统计案例 10.1 抽样方法课时规范训练 理 北师大版[A 级 基础演练]1.(2015·高考四川卷)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A.抽签法 B.系统抽样法C.分层抽样法 D.随机数法解析:根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.答案:C2.(2016·浙江杭州模拟)某校 150 名教职员工中,有老年人 20 名,中年人 50 名,青年人 80 名,从中抽取 30 名作为样本.①采用随机抽样法:抽签取出 30 个样本;②采用系统抽样法:将教职工编号为 00,01,…,149,然后平均分组抽取 30 个样本;③采用分层抽样法:从老年人、中年人、青年人中抽取 30 个样本.下列说法中正确的是( )A.无论采用哪种方法,这 150 名教职工中每个人被抽到的概率都相等B.①②两种抽样方法,这 150 名教职工中每个人被抽到的概率都相等;③并非如此C.①③两种抽样方法,这 150 名教职工中每个人被抽到的概率都相等;②并非如此D.采用不同的抽样方法,这 150 名教职工中每个人被抽到的概率是各不相同的解析:三种抽样方法中,每个人被抽到的概率都等于 = ,故选 A.30150 15答案:A3.(2014·高考湖南卷)对一个容量为 N 的总体抽取容量为 n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为 p1, p2, p3,则( )A. p1= p2p3 B. p2= p3p1C. p1= p3p2 D. p1= p2= p3解析:根据三种抽样方法的特征求解.由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此 p1= p2= p3.答案:D4.课题组进行城市空气质量调查,按地域把 24 个城市分成甲、乙、丙三组,对应的2城市数分别为 4,12,8,若用分层抽样抽取 6 个城市,则丙组中应抽取的城市数为________.解析:设两组中应抽取的城市数为 x,由分层抽样的性质可知 = ,∴ x=2.824 x6答案:25.(2014·高考天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为 300 的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为 4∶5∶5∶6,则应从一年级本科生中抽取________名学生.解析:根据题意,应从一年级本科生中抽取的人数为 ×300=60.44+ 5+ 5+ 6答案:606.(2016·兰州模拟)最近网络上流行一种“ QQ 农场游戏” ,这种游戏通过虚拟软件模拟种植与收获的过程.为了了解本班学生对此游戏的态度,高三(6)班计划在全班 60 人中展开调查,根据调查结果,班主任计划采用系统抽样的方法抽取若干名学生进行座谈,对此先对 60 名学生进行编号为:01,02,03,…,60,已知抽取的学生中最小的两个编号为03,09,则抽取的学生中最大的编号为________.解析:由最小的两个编号为 03,09 可知,抽取人数的比例为 ,即抽取 10 名同学,其16编号构成首项为 3,公差为 6 的等差数列,故最大编号为 3+9×6=57.答案:577.(2016·沈阳质检)某学校的三个学生社团的人数分布如下表(每名学生只能参加一个社团):围棋社 舞蹈社 拳击社男生 5 10 28女生 15 30 m学校要对这三个社团的活动效果进行抽样调查,按分层抽样的方法从三个社团成员中抽取 18 人,结果拳击社被抽出了 6 人.(1)求拳击社女生有多少人;(2)从围棋社指定的 3 名男生和 2 名女生中随机选出 2 人参加围棋比赛,求这 2 名同学是一名男生和一名女生的概率.解:(1)由于按分层抽样的方法从三个社团成员中抽取 18 人,拳击社被抽出了 6 人,∴ = ,∴ m=2.628+ m 1820+ 40+ 28+ m(2)指定 3 男生记为 A1, A2, A3,2 女生记为 B1, B2,选取 2 人有3A1A2, A1A3, A2A3, B1B2, A1B1, A1B2, A2B1, A2B2, A3B1, A3B2共 10 种选法,其中一男一女有6 种选法,故设 A 为“这 2 名同学是一名男生和一名女生” ,则 P(A)= = .610 358.海关对同时从 A, B, C 三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6 件样品进行检测.地区 A B C数量 50 150 100(1)求这 6 件样品中来自 A, B, C 各地区商品的数量;(2)若在这 6 件样品中随机抽取 2 件送往甲机构进行进一步检测,求这 2 件商品来自相同地区的概率.解:(1)因为样本容量与总体中的个体数的比是= ,650+ 150+ 100 150所以样本中包含三个地区的个体数量分别是:50× =1,150× =3,100× =2.150 150 150所以 A, B, C 三个地区的商品被选取的件数分别为 1,3,2.(2)设 6 件来自 A, B, C 三个地区的样品分别为: A; B1, B2, B3; C1, C2.则从 6 件样品中抽取的这 2 件商品构成的所有基本事件为:{ A, B1},{ A, B2},{ A, B3},{A, C1},{ A, C2},{ B1, B2},{ B1, B3},{ B1, C1},{ B1, C2},{ B2, B3},{ B2, C1},{B2, C2},{ B3, C1},{ B3, C2},{ C1, C2},共 15 个.每个样品被抽到的机会均等,因此这些基本事件的出现是等可能的.记事件 D:“抽取的这 2 件商品来自相同地区” ,则事件 D 包含的基本事件有:{ B1, B2},{B1, B3},{ B2, B3},{ C1, C2},共 4 个.所以 P(D)= ,即这 2 件商品来自相同地区的概率为 .415 415[B 级 能力突破]1.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A.简单随机抽样 B.按性别分层抽样C.按学段分层抽样 D.系统抽样解析:由于三个学段学生的视力情况差别较大,故需按学段分层抽样.答案:C42.某单位有 840 名职工,现采用系统抽样方法抽取 42 人做问卷调查,将 840 人按1,2,…,840 随机编号,则抽取的 42 人中,编号落入区间[481,720]的人数为( )A.11 B.12C.13 D.14解析:抽样间隔为 =20.设在 1,2,…,20 中抽取号码 x0(x0∈[1,20]),在84042[481,720]之间抽取的号码记为 20k+ x0,则481≤20 k+ x0≤720, k∈N + .∴24 ≤ k+ ≤36.120 x020∵ ∈ ,∴ k=24,25,26,…,35,x020 [120, 1]∴ k 值共有 35-24+1=12(个),即所求人数为 12.答案:B3.(2016·鄂州模拟)一个总体共有 600 个个体,随机编号为 001,002,…,600.现采用系统抽样的方法抽取一个容量为 50 的样本,且随机抽得的号码为 003.这 600 个个体分三组,从 001 到 300 在第一组,从 301 到 495 在第 2 组,从 496 到 600 在第 3 组,则这三组抽中的个数依次为( )A.25,16,9 B.25,18,7C.25,17,8 D.25,19,6解析:按照系统抽样,间隔为 =12.60050∵随机号码为 003,∴被抽出的个体编号为 12k+3,所以在 001~300 间抽出 25 个个体,从 301 到 495 间抽出 17 个个体,在 496~600 间抽出 8 个个体.答案:C4.甲、乙两套设备生产的同类型产品共 4 800 件,采用分层抽样的方法从中抽取一个容量为 80 的样本进行质量检测.若样本中有 50 件产品由甲设备生产,则乙设备生产的产品总数为________件.解析:设乙设备生产的产品总数为 x 件,则甲设备生产的产品总数为(4 800- x)件.由分层抽样特点,结合题意可得 = ,解得 x=1 800(件).5080 4 800- x4 800答案:1 8005.(2016·黄冈模拟)一个社会调查机构就某地居民的月收入调查了 10 000 人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这 10 000 人中再用分层抽样方法抽出 100 人进一步调查,则在[2 500,3 000)元/月收入段应抽出________人.5解析:收入在[2 500,3 000)元/月的人占总数的频率为(3 000-2 500)×0.0005=0.25,故应抽出 100×0.25=25(人).答案:256.某校初一、初二、初三三班各有 300 人,400 人,302 人,取系统抽样从中抽取一个容量为 100 的样本检查学生的视力情况,则初三年级每人被抽到的概率为( )A. B.3021 002 1001 002C. D.3001 000 30302解析:利用系统抽样,虽然剔除 2 人,但每人能抽到的概率为 = .nN 1001002答案:B7.(2016·衡水中学一模)已知某中学高三文科班学生共有 800 人参加了数学与地理的水平测试,学校决定利用随机数表法从中抽取 100 人进行成绩抽样调查,先将 800 人按001,002,…,800 进行编号.(1)如果从第 8 行第 7 列的数开始向右读,请你依次写出最先检查的 3 个人的编号;(下面摘取了第 7 行到第 9 行)84 42 17 53 31 57 24 55 06 88 77 0474 47 67 21 76 33 50 25 83 92 12 0676(第 7 行)63 01 63 78 59 16 95 56 67 19 98 1050 71 75 12 86 73 58 07 44 39 52 3879(第 8 行)33 21 12 34 29 78 64 56 07 82 52 4207 44 38 15 51 00 13 42 99 66 02 7954(第 9 行)(2)抽取的 100 人的数学与地理的水平测试成绩如下表:数学人数优秀 良好 及格6优秀 7 20 5良好 9 18 6地理及格 a 4 b成绩分为优秀、良好、及格三个等级.横向、纵向分别表示地理成绩与数学成绩的等级人数,例如:表中数学成绩为良好的共有 20+18+4=42 人.①若在该样本中,数学成绩优秀率是 30%,求 a, b 的值;②在地理成绩及格的学生中,已知 a≥10, b≥8,求数学成绩优秀的人数比及格的人数少的概率.解:(1)从第 8 行第 7 列的数开始向右读,依次检查的编号分别为 785,916(舍),955(舍),667,199,….故最先检查的 3 个人的编号为 785,667,199.(2)① =30%,7+ 9+ a100∴ a=14, b=100-30-(20+18+4)-(5+6)=17.② a+ b=100-(7+20+5)-(9+18+6)-4=31.∵ a≥10, b≥8,∴ a, b 的搭配为(10,21),(11,20),(12,19),(13,18),(14,17),(15,16),(16,15),(17,14),(18,13),(19,12),(20,11),(21,10),(22,9),(23,8),共 14 种.记 a≥10, b≥8,数学成绩优秀的人数比及格的人数少为事件 A.则事件 A 包括(10,21),(11,20),(12,19),(13,18),(14,17),(15,16),共 6 个基本事件.∴ P(A)= = ,614 37∴数学成绩优秀的人数比及格的人数少的概率为 .371第十章 统计、统计案例 10.2 统计图表、数据的数字特征及用样本估计总体课时规范训练 理 北师大版[A 级 基础演练]1.(2014·高考广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.200,20 B.100,20C.200,10 D.100,10解析:该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为 10 000×2%=200,其中抽取的高中生近视人数为 2 000×2%×50%=20,故选 A.答案:A2.(2015·高考陕西卷)某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比例如图所示,则该校女教师的人数为( )A.93 B.123C.137 D.167解析:初中部的女教师人数为 110×70%=77,高中部的女教师人数为 150×(1-60%)=60,该校女教师的人数为 77+60=137,故选 C.答案:C3.(2015·高考安徽卷)若样本数据 x1, x2,…, x10的标准差为 8,则数据2x1-1,2 x2-1,…,2 x10-1 的标准差为( )A.8 B.15C.16 D.32解析:已知样本数据 x1, x2,…, x10的标准差为 s=8,则 s2=64,数据22x1-1,2 x2-1,…,2 x10-1 的方差为 22s2=2 2×64,所以其标准差为=2×8=16,故选 C.22×64答案:C4.(2015·高考江苏卷)已知一组数据 4,6,5,8,7,6,那么这组数据的平均数为________.解析:由平均数的计算公式得.= =6.x4+ 6+ 5+ 8+ 7+ 66答案:65.(2014·高考江苏卷)为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的 60 株树木中,有________株树木的底部周长小于 100 cm.解析:底部周长在[80,90)的频率为 0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为 60,所以树木的底部周长小于 100 cm 的株数为(0.15+0.25)×60=24.答案:246.(2015·湖南省十校联考)某中学高三年级从甲、乙两个班级各选出 7 名学生参加数学竞赛,他们取得的成绩(满分 100 分)的茎叶图如图所示,其中甲班学生的平均分是 85,乙班学生成绩的中位数是 83,则 x+ y 的值为________.解析:依题意,甲班学生的平均分85= ,78+ 79+ 85+ 80+ x+ 80+ 92+ 967故 x=5,乙班学生成绩的中位数为 83,故其成绩为 76,81,81,83,91,91,96,所以3y=3, x+ y=8.答案:87.(2014·高考新课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50 位市民.根据这 50 位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75.50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本中位数为 =67,所以该市的市民对乙部门评分的中位数的估计值是 67.66+ 682(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分别为 =0.1,550=0.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为 0.1,0.16.850(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.8.(2014·高考广东卷)随机观测生产某种零件的某工厂 25 名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.4根据上述数据得到样本的频率分布表如下:分组 频数 频率[25,30] 3 0.12(30,35] 5 0.20(35,40] 8 0.32(40,45] n1 f1(45,50] n2 f2(1)确定样本频率分布表中 n1, n2, f1和 f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取 4 人,至少有 1 人的日加工零件数落在区间(30,35]的概率.解:(1)由所给数据知,落在区间(40,45]内的有 7 个,落在(45,50]内的有 2 个,故n1=7, n2=2,所以 f1= = =0.28, f2= = =0.08.n125 725 n225 225(2)样本频率分布直方图如图.(3)根据样本频率分布直方图,每人的日加工零件数落在区间(30,35]的概率为 0.2,设所取的 4 人中,日加工零件数落在区间(30,35]的人数为 ξ ,则 ξ ~ B(4,0.2), P(ξ ≥1)=1- P(ξ =0)=1-(1-0.2) 4=1-0.409 6=0.509 4,所以在该厂任取 4 人,至少有 1人的日加工零件数落在区间(30,35]的概率为 0.590 4.[B 级 能力突破]1.小波一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小波一星期的鸡蛋开支占总开支的百分比为( )5A.30% B.10%C.3% D.不能确定解析:由题图 2 可知鸡蛋开支占食品开支的 ,所以鸡蛋开支占总开支的 30%× =3%,110 110故选 C.答案:C2.(2015·高考山东卷)为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5天,将这 5 天中 14 时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温;②甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温;③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A.①③ B.①④C.②③ D.②④解析:甲地该月 14 时的气温数据分布在 26 和 31 之间,且数据波动较大,而乙地该月14 时的气温数据分布在 28 和 32 之间,且数据波动较小,可以判断结论①④正确,故选 B.答案:B3.(2015·高考课标卷Ⅱ)根据下面给出的 2004 年至 2013 年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )6A.逐年比较,2008 年减少二氧化硫排放量的效果最显著B.2007 年我国治理二氧化硫排放显现成效C.2006 年以来我国二氧化硫年排放量呈减少趋势D.2006 年以来我国二氧化硫年排放量与年份正相关解析:对于 A 选项,由图知从 2007 年到 2008 年二氧化硫排放量下降得最多,故 A 正确.对于 B 选项,由图知,由 2006 年到 2007 年矩形高度明显下降,因此 B 正确.对于 C选项,由图知从 2006 年以后除 2011 年稍有上升外,其余年份都是逐年下降的,所以 C 正确.由图知 2006 年以来我国二氧化硫年排放量与年份负相关,故选 D.答案:D4.某学员在一次射击测试中射靶 10 次,命中环数如下:7,8,7,9,5,4,9,10,7,4则:(1)平均命中环数为________;(2)命中环数的标准差为________.解析:利用平均值和标准差公式求解.(1) = =7.x- 7+ 8+ 7+ 9+ 5+ 4+ 9+ 10+ 7+ 410(2)s2= [(7-7) 2+(8-7) 2+(7-7) 2+(9-7) 2+(5-7) 2+(4-7) 2+(9-7)1102+(10-7) 2+(7-7) 2+(4-7) 2]=4,∴ s=2.答案:(1)7 (2)25.(2016·鄂州模拟)某校为了解高三同学寒假期间的学习情况,抽查了 100 名同学,统计他们平均每天的学习时间,绘成频率分布直方图(如图).则这 100 名同学中平均每天的学习时间在 6~8 小时内的人数为________.解析:由( x+0.14+0.12+0.05+0.04)×2=1,得 x=0.15.∴在 6~8 小时内的人数为7×100=30.0.150.15+ 0.14+ 0.12+ 0.05+ 0.04答案:306.(2016·咸宁模拟)甲、乙两人在 10 天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这 10 天甲、乙两人日加工零件的平均数分别________和________.解析:甲的平均数为20+ =24,- 1- 2+ 1+ 3+ 2+ 11+ 11+ 1510乙的平均数为20+ =23.- 1- 3- 9+ 1+ 4+ 2+ 4+ 10+ 12+ 1010答案:24 237.育才中学的高二一班有男同学 45 名,女同学 15 名,老师按照分层抽样的方法组建了一个 4 人的课外兴趣小组.(1)求某同学被抽到的概率及课外兴趣小组中男、女同学的人数;(2)经过一个月的学习、讨论,这个兴趣小组决定选出两名同学做某项实验,方法是先从小组里选出 1 名同学做实验,该同学做完后,再从小组内剩下的同学中选 1 名同学做实验,求选出的两名同学中恰有一名女同学的概率;(3)实验结束后,第一名做实验的同学得到的实验数据为 68,70,71,72,74,第二名做实验的同学得到的实验数据为 69,70,70,72,74,请问哪位同学的实验更稳定?并说明理由.解:(1) P= = ,445+ 15 115∴某同学被抽到的概率为 ,115设该课外兴趣小组中有 x 名男同学,则 = ,4560 x4∴ x=3,∴男、女同学的人数分别为 3,1.8(2)把 3 名男同学和 1 名女同学分别记为 a1, a3, a3, b,则选取两名同学的基本事件有( a1, a2),( a1, a3),( a1, b),( a2, a1),( a2, a3),( a2, b)(a3, a1),( a3, a2)(a3, b),(b, a1),( b, a2),( b, a3)共 12 种情况,其中恰有一名女同学的有 6 种情况,∴选出的两名同学中恰有一名女同学的概率P1= = .612 12(3)∵ 1= =71,x68+ 70+ 71+ 72+ 7452= =71,x69+ 70+ 70+ 72+ 745s =21 68- 71 2+ 70- 71 2+ 71- 71 2+ 72- 71 2+ 74- 71 25=4,s =2 69- 71 2+ 2× 70- 71 2+ 72- 71 2+ 74- 71 25=3.2,∴ 1= 2, s > s ,x x 21 2故第二名同学的实验更稳定.1【高考领航】2017 届高考数学大一轮复习 第十章 统计、统计案例 10.3 变量间的相关关系与统计案例课时规范训练 理 北师大版[A 级 基础演练]1.四名同学根据各自的样本数据研究变量 x, y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:① y 与 x 负相关且 y=2.347 x-6.423;② y 与 x 负相关且 y=-3.476 x+5.648;③ y 与 x 正相关且 y=5.437 x+8.493;④ y 与 x 正相关且 y=-4.326 x-4.578.其中一定不正确的结论的序号是( )A.①② B.②③ C.③④ D.①④解析:由正负相关性的定义知①④一定不正确.答案:D2.(2014·高考重庆卷)已知变量 x 与 y 正相关,且由观测数据算得样本平均数 =3,x=3.5,则由该观测数据算得的线性回归方程可能是( )yA. y=0.4 x+2.3 B. y=2 x-2.4C. y=-2 x+9.5 D. y=-0.3 x+4.4解析:因为变量 x 和 y 正相关,则回归直线的斜率为正,故可以排除选项 C 和 D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项 A 和 B 中的直线方程进行检验,可以排除 B,故选 A.答案:A3.大学生和研究生毕业的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:学士 硕士 总计男 162 27 189女 143 8 151总计 305 35 n=340根据以上数据,则可以判定( )A.获取学位类别与性别有关B.获取学位类别与性别无关C.性别决定获取学位的类别D.以上都是错误的解析: 2= ≈7.343>6.635.340× 162×8- 27×143 2189×151×305×352故有 99%的把握认为获取学位类别与性别有关.答案:A4.对具有线性相关关系的变量 x 和 y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为________.解析:由题意知 =2, =3, b=6.5,所以 a= - b =3-6.5×2=-10,即回归直x y y x线的方程为 y=-10+2 x.答案: y=-10+2 x5.研究某新药的疗效,给 50 个患者服用此药,跟踪调查后得如下表的数据.设 H0:服用此药的效果与患者的性别无关:则 2=________,从而得出结论________.无效 有效 总计男性患者 15 35 50女性患者 5 46 51总计 20 81 101解析:由公式得 2≈6.485,因为 3.841<6.485<6.635,所以说我们有 95%的把握认为服用此药的效果与患者的性别有关.答案:6.485 有 95%的把握认为服用此药的效果与患者的性别有关6.下表提供了某厂节能降耗技术改造后生产 A 产品过程中记录的产量 x(吨)与相应生产能耗 y(吨)的几组对照数据:x 3 4 5 6y 2.5 t 4 4.5根据上表提供的数据,求出 y 关于 x 的线性回归方程 y=0.7 x+0.35,则表中 t 的值为________.解析:∵ = =4.5, = = ,又点( , )在x3+ 4+ 5+ 64 y 2.5+ t+ 4+ 4.54 t+ 114 x yy=0.7 x+0.35 上,∴ =0.7×4.5+0.35,解得 t=3.t+ 114答案:37.(2016·南昌模拟)以下是某地搜集到的新房屋的销售价格 y 和房屋的面积 x 的数据.房屋面积 x/m2 115 110 80 135 105销售价格 y/万元 24.8 21.6 18.4 29.2 22(1)求线性回归方程;(2)据(1)的结果估计当房屋面积为 150 m2时的销售价格.解:(1) = ×(115+110+80+135+105)=109,x153= ×(24.8+21.6+18.4+29.2+22)=23.2.y15设所求回归直线方程为 y= bx+ a,则b= = ≈0.196 2,5∑i= 1 xi- x yi- y5∑i= 1 xi- x 2 3081 570∴ a= y- ax=23.2-109× ≈1.816 6.3081 570∴所求回归直线方程为y=0.196 2 x+1.816 6.(2)由第(1)问可知,当 x=150 m2时,销售价格的估计值为 y=0.196 2×150+1.816 6=31.246 6(万元).8.(2014·高考新课标全国卷Ⅱ)某地区 2007 年至 2013 年农村居民家庭人均纯收入y(单位:千元)的数据如下表:年份 2007 2008 2009 2010 2011 2012 2013年份代号 t 1 2 3 4 5 6 7人均纯收入 y 2.9 3.3 3.6 4.4 4.8 5.2 5.9(1)求 y 关于 t 的线性回归方程;(2)利用(1)中的回归方程,分析 2007 年到 2013 年该地区农村居民家庭人均纯收入的变化情况,并预测该地区 2015 年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘估计公式分别为:b= , a= - b .n∑i= 1 ti- t yi- yn∑i= 1 ti- t 2 y t解:(1)由所给数据计算得 = (1+2+3+4+5+6+7)=4,t17= (2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,y17(ti- )2=9+4+1+0+1+4+9=28,7∑i= 1 t(ti- )(yi- )=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)7∑i= 1 t y4+0×0.1+1×0.5+2×0.9+3×1.6=14,b= = =0.5,7∑i= 1 ti- t yi- y7∑i= 1 ti- t 2 1428a= - b =4.3-0.5×4=2.3,y t- 所求回归方程为 y=0.5 t+2.3.(2)由(1)知, b=0.50,故 2007 年至 2013 年该地区农村居民家庭人均纯收入逐年增加,平均每年增加 0.5 千元.将 2015 年的年份代号 t=9 代入(1)中的回归方程,得y=0.5×9+2.3=6.8,故预测该地区 2015 年农村居民家庭人均纯收入为 6.8 千元.[B 级 能力突破]1.(2014·高考湖北卷)根据如下样本数据( )x 3 4 5 6 7 8y 4.0 2.5 -0.5 0.5 -2.0 -3.0得到的回归方程为 y= bx+ a,则( )A. a0, b0 B. a0, b0 D. a0.故 a0, b0),故 x 与 y 之间是正相关.(3)将 x=7 代入回归方程可以预测该家庭的月储蓄为 y=0.3×7-0.4=1.7(千元).1【高考领航】2017 届高考数学大一轮复习 第十章 统计、统计案例 理 北师大版1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.1.抽样调查及相关概念通常情况下,从调查对象中按照一定的方法抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标作出推断,这就是抽样调查.其中,调查对象的全体称为总体,被抽取的一部分称为样本.2.简单随机抽样(1)定义:设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本( n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.3.分层抽样(1)定义:将总体按其属性特征分成若干类型,然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法通常叫作分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4.系统抽样(1)系统抽样是将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按相同的间隔抽取其他样本.系统抽样又叫等距抽样或机械抽样.(2)系统抽样的步骤①先将总体的 N 个个体编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;②确定分段间隔 k,对编号进行分段,当 (n 是样本容量)是整数时,取 k= ;Nn Nn③在第 1 段用简单随机抽样确定第一个个体编号 l(l≤ k);④按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号( l+ k),再加 k 得到第 3 个个体编号( l+2 k),依次进行下去,直到获取整个样本.[基础自测]1.(教材改编题)某公司有员工 500 人,其中不到 35 岁的有 125 人,35~49 岁的有 280 人,50 岁以上的有 95 人,为了调查员工的身体健康状况,从中抽取 100 名员工,则应在这三个年龄段分别抽取人数为( )A.33 个,34 人,33 人 B.25 人,56 人,19 人2C.30 人,40 人,30 人 D.30 人,50 人,20 人解析:因为 125∶280∶95=25∶56∶19,所以抽取人数分别为:25 人,56 人,19 人.答案:B2.(2016·抚顺质检)为了了解全校 240 名学生的身高情况 ,从中抽取 40 名学生进行测量,下列说法正确的是( )A.总体是 240 B.个体是每一个学生C.样本是 40 名学生 D.样本容量是 40解析:总体容量是 240,总体是 240 名学生的身高;个体是每名学生的身高;样本是 40 名学生的身高;样本容量是 40.答案:D3.老师在班级 50 名学生中,依次抽取学号为 5,10,15,20,25,30,35,40,45,50 的学生进行作业检查,这种抽样方法是( )A.随机抽样 B.分层抽样C.系统抽样 D.以上都不是解析:因为所抽取学生的学号成等差数列,即为等距离抽样,属于系统抽样.答案:C4.一支田径队有男运动员 48 人,女运动员 36 人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为 21 的样本,则抽取男运动员的个数为________.解析:抽取男运动员的人数为 ×48=12.2148+ 36答案:125.若总体中含有 1 650 个个体,现在要采用系统抽样法,从中抽取一个容量为 35 的样本,分段时应从总体中随机剔除________个个体,编号后应均分为________段,每段有________个个体.解析:计算 1 650 除以 35 的余数,可知商为 47,余数为 5,所以采用系统抽样首先要从总体中随机剔除 5 个个体,由于抽取的样本容量为 35,所以编号后应均分为 35 段,每段有 47 个个体.答案:5 35 47考点一 简单随机抽样[例 1] 某大学为了支持亚运会,从报名的 24 名大三学生中选 6 人组成志愿小组,请用抽签法和随机数法设计抽样方案.审题视点 考虑到总体的个数较少,利用抽签法和随机数法可容易地获取样本,须按这两种抽样方法的操作步骤进行.抽签法应“编号、制签、搅匀、抽取” ,随机数法应“编号、确定起始数、读数、取得样本” .解 抽签法:第一步:将 24 名志愿者编号,编号为 1,2,3,…,24;第二步:将 24 个号码分别写在 24 张外形完全相同的纸条上,并揉成团,制成号签;3第三步:将 24 个号签放入一个不透明的盒子中,充分搅匀;第四步:从盒子中逐个抽取 6 个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数法:第一步:将 24 名学生编号,编号为 01,02,03,…,24;第二步:在随机数表中任选一数开始,按某一确定方向选取两列组成两位数;第三步:凡不在 01~24 中的数或重复出现的数,都不能选取,依次选取即可得到 6 个样本的编号;第四步:所得号码对应的志愿者,就是志愿小组的成员.(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀,一般地,当总体容量和样本容量都较小时可用抽签法.(2)随机数表中共随机出现 0,1,2,…,9 十个数字,也就是说,在表中的每个位置上出现各个数字的机会都是相等的.在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或每四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.1.(2016·昆明调研)下列说法中正确说法的个数是( )①总体中的个体数不多时宜用简单随机抽样法;②在总体均分后的每一部分进行抽样时,采用的是简单随机抽样;③百货商场的抓奖活动是抽签法;④整个抽样过程中,每个个体被抽取的概率相等(有剔除时例外).A.1 B.2C.3 D.4解析:①②③显然正确,系统抽样无论有无剔除都是等概率抽样;④不正确.答案:C2.某车间工人加工一种轴 100 件,为了了解这种轴的直径,要从中抽取 10 件在同一条件下测量,如何采用简单随机抽样的方法抽取样本?解:法一:抽签法:将 100 件轴编号为 1,2,…,100,并制成大小、形状相同的号签,分别写上这 100 个数,将这些号签放在同一个箱子里,进行均匀搅拌,接着连续抽取 10 个号签,然后测量这 10 个号签对应的轴的直径.法二:随机数法:将 100 件轴编号为 00,01,…99,在随机数表中选定一个起始位置,如从第 21 行第 1 个数开始,选取 10 个,为 68,34,30,13, 70,55,74,77,40,44,这 10 件即为所要抽取的样本.考点二 系统抽样4[例 2] 某单位在职职工共 624 人,为了调查工人用于上班途中的时间,决定抽取 10%的工人进行调查,试采用系统抽样方法抽取所需的样本.审题视点 由题意应抽取 62 人,624 不是 10 的整数倍,需先剔除 4 人,再利用系统抽样完成抽样.解 第一步:将 624 名职工用随机方式进行编号;第二步:从总体中用随机数法剔除 4 人,将剩下的 620 名职工重新编号(分别为 000,001,002,…,619),并分成 62 段;第三步:在第 1 段 000,001,002,…009 这十个编号中用简单随机抽样确定起始号码为 l;第四步:将编号为 l, l+10, l+20,…, l+610 的个体抽出,组成样本.(1)系统抽样的特点——机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第 1 组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.(2)系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.1.(2015·高考湖南卷)在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为 1~35 号,再用系统抽样方法从中抽取 7 人,则其中成绩在区间[139,151]上的运动员人数是( )A.3 B.4C.5 D.6解析:因为 35÷7=5,因此可将编号为 1~35 的 35 个数据分成 7 组,每组有 5 个数据,在区间[139,151]上共有 20 个数据,分在 4 个小组中,每组取 1 人,共取 4 人.答案:B2.某校高一、高二、高三分别有学生人数为 495,493,482,现采用系统抽样方法,抽取 49 人做问卷调查,将高一、高二、高三学生依次随机按 1,2,3,…,1 470 编号,若第 1 组用简单随机抽样方法抽取的号码为 23,则高二应抽取的学生人数为( )A.15 B.16C.17 D.18解析:由系统抽样方法,知按编号依次每 30 个编号作为一组,共分 49 组,高二学生的编号为 496 到 988,在第 17 组到第 33 组内,第 17组抽取的编号为 16×30+23=503,为高二学生,第 33 组抽取的编号为 32×30+23=983,为高二学生,故共抽取高二学生人数为33-16=17.答案:C考点三 分层抽样[例 3] 某地区有小学 150 所,中学 75 所,大学 25 所.现采用分层抽样的方法从这些学校中抽取 30 所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.审题视点 先求出样本抽取的比例,再逐个求解5解析 应从小学中抽取 ×30=18(所).150150+ 75+ 25应从中学中抽取 ×30=9(所).75150+ 75+ 25答案 18 9分层抽样的操作步骤及特点(1)操作步骤①将总体按一定标准进行分层;②计算各层的个体数与总体数的比,按各层个体数占总体数的比确定各层应抽取的样本容量;③在每一层进行抽样(可用简单随机抽样或系统抽样).(2)特点①适用于总体由差异明显的几部分组成的情况;②更充分地反映了总体的情况;③等可能抽样,每个个体被抽到的可能性都是 .nN1.(2015·高考北京卷)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有 320 人,则该样本中的老年教师人数为( )类别 人数老年教师 900中年教师 1 800青年教师 1 600合计 4 300A.90 B.100C.180 D.300解析:设该样本中的老年教师人数为 x,由题意得 = ,故 x=180.x900 3201 600答案:C2.(2015·高考福建卷)某校高一年级有 900 名学生,其中女生 400 名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45 的样本,则应抽取的男生人数为________.解析:男生人数为 900-400=500(人),设男生应抽取 x 人,则有 = ,解得 x=25.45900 x500答案:256分层抽样的易错点[典例] 某个年级有男生 560 人,女生 420 人,用分层抽样的方法从该年级全体学生中抽取一个容量为 280 的样本,则此样本中男生人数为________.解题指南 由男生和女生的总人数和样本容量可得分层抽样的比例,进而可得男生的入样人数.解析 男生人数为 560× =160.280560+ 420答案 160阅卷点评 (1)不能正确确定抽样比例从而导致失误.(2)在求解过程中计算失误.备考建议 解决随机抽样问题时,还有以下几点容易造成失误,在备考时要高度关注:(1)熟练掌握各种抽样方法的步骤和适用条件;(2)系统抽样中各段入样的个体编号成等差数列,公差即每段的个体数;(3)分层抽样中各层所占的比例要确定准确.另外,某些情况下还需先剔除若干个体,注意剔除个体的等可能性.◆一条规律三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为 n,总体的个体数为 N,则用这三种方法抽样时,每个个体被抽到的概率都是 .nN◆三个特点(1)简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽出的个体带有随机性,个体间无固定间距.(2)系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.(3)分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.课时规范训练[A 级 基础演练]1.(2015·高考四川卷)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )A.抽签法 B.系统抽样法7C.分层抽样法 D.随机数法解析:根据年级不同产生差异及按人数比例抽取易知应为分层抽样法.答案:C2.(2016·浙江杭州模拟)某校 150 名教职员工中,有老年人 20 名,中年人 50 名,青年人 80 名,从中抽取 30 名作为样本.①采用随机抽样法:抽签取出 30 个样本;②采用系统抽样法:将教职工编号为 00,01,…,149,然后平均分组抽取 30 个样本;③采用分层抽样法:从老年人、中年人、青年人中抽取 30 个样本.下列说法中正确的是( )A.无论采用哪种方法,这 150 名教职工中每个人被抽到的概率都相等B.①②两种抽样方法,这 150 名教职工中每个人被抽到的概率都相等;③并非如此C.①③两种抽样方法,这 150 名教职工中每个人被抽到的概率都相等;②并非如此D.采用不同的抽样方法,这 150 名教职工中每个人被抽到的概率是各不相同的解析:三种抽样方法中,每个人被抽到的概率都等于 = ,故选 A.30150 15答案:A3.(2014·高考湖南卷)对一个容量为 N 的总体抽取容量为 n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为 p1, p2, p3,则( )A. p1= p2 乙 , y 甲 y 乙 B. 甲 y 乙 D. 甲 乙 , y 甲 乙 , s s ,所以甲组的研发水平优于乙组.x x 2甲 2乙(2)记 E={恰有一组研发成功}.在所抽得的 15 个结果中,恰有一组研发成功的结果是( a, ),( , b),( a, ),( , b),( a, ),( a, ),( , b),共 7 个.b a b a b b a故事件 E 发生的频率为 .715将频率视为概率,即得所求概率为 P(E)= .71520统计综合题的解答[典例] 若某产品的直径长与标准值的差的绝对值不超过 1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取 5 000 件进行检测,结果发现有 50 件不合格品.计算这 50 件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组 频数 频率[-3,-2) 0.10[-2,-1) 8(1,2] 0.50(2,3] 10(3,4]合计 50 1.00(1)将上面表格中缺少的数据填在相应位置;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;(3)现对该厂这种产品的某个批次进行检查,结果发现有 20 件不合格品.据此估算这批产品中的合格品的件数.解题指南 (1)根据题目中的数据可完成频率分布表(2)用频率估计概率(3)根据总体中不合格件数的比例列方程求解.【解】 (1)如下表所示.频率分布表分组 频数 频率[-3,-2) 5 0.10[-2,-1) 8 0.16(1,2] 25 0.50(2,3] 10 0.20(3,4] 2 0.04合计 50 1.00216 分 (2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率约为0.50+0.20=0.70.9 分 (3)设这批产品中的合格品数为 x 件,依题意有 = ,解得 x= -20=1 980.505 000 20x+ 20 5 000×2050所以该批产品的合格品件数估计是 1 980 件.12 分 【思维流程】完成频率分布表.用频率估计概率.估算合格品的件数.阅卷点评 频率分布表和直方图是表示样本数据的图表,在频率分布表中我们可以看出样本数据在各个组内的频数以及频率,利用这些数据可以绘制频率分布直方图,也可以根据题目的具体情况解决一些其他问题;而频率分布直方图则更加直观地表示了样本数据的分布情况,从中我们可以直观地看出样本数据分布的集中与分散程度、各组数据在整个样本中所占有的比例等信息,值得注意的是频率分布直方图中纵轴上的点表示频率除以组距.解答频率分布图表的关键就是弄清楚其含义.失分警示 (1)对常用的统计图表和数字特征反映的总体特征理解不透彻致误.(2)与其他知识,特别是概率结合时,不会用频率估计概率致误.备考建议 (1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积之和为 1;(2)在频率分布直方图中,如果两个小矩形的高相等,说明数据落在这两个区间上的频率相等,在进行计算时,不能漏掉其中的任何一个;(3)对于统计图表类的题目,求解时,最重要的就是认真观察图表,从中发现有用的信息和数据.◆两个异同(1)众数、中位数与平均数的异同①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.②由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.◆两个特征22利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.课时规范训练[A 级 基础演练]1.(2014·高考广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.200,20 B.100,20C.200,10 D.100,10解析:该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为 10 000×2%=200,其中抽取的高中生近视人数为 2 000×2%×50%=20,故选 A.答案:A2.(2015·高考陕西卷)某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别比例如图所示,则该校女教师的人数为( )A.93 B.123C.137 D.167解析:初中部的女教师人数为 110×70%=77,高中部的女教师人数为 150×(1-60%)=60,该校女教师的人数为 77+60=137,故选 C.答案:C3.(2015·高考安徽卷)若样本数据 x1, x2,…, x10的标准差为 8,则数据 2x1-1,2 x2-1,…,2 x10-1 的标准差为( )A.8 B.15C.16 D.32解析:已知样本数据 x1, x2,…, x10的标准差为 s=8,则 s2=64,数据 2x1-1,2 x2-1,…,2 x10-1 的方差为 22s2=2 2×64,所以其标准差为 =2×8=16 ,故选 C.22×64答案:C234.(2015·高考江苏卷)已知一组数据 4,6,5,8,7,6,那么这组数据的平均数为________.解析:由平均数的计算公式得.= =6.x4+ 6+ 5+ 8+ 7+ 66答案:65.(2014·高考江苏卷)为了了解一片经济林的生长情况,随机抽测了其中 60 株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的 60 株树木中,有________株树木的底部周长小于 100 cm.解析:底部周长在[80,90)的频率为 0.015×10=0.15,底部周长在[90,100)的频率为 0.025×10=0.25,样本容量为 60,所以树木的底部周长小于 100 cm 的株数为(0.15+0.25)×60=24.答案:246.(2015·湖南省十校联考)某中学高三年级从甲、乙两个班级各选出 7 名学生参加数学竞赛,他们取得的成绩(满分 100 分)的茎叶图如图所示,其中甲班学生的平均分是 85,乙班学生成绩的中位数是 83,则 x+ y 的值为________.解析:依题意,甲班学生的平均分85= ,78+ 79+ 85+ 80+ x+ 80+ 92+ 967故 x=5,乙班学生成绩的中位数为 83,故其成绩为 76,81,81,83,91,91,96,所以 y=3, x+ y=8.答案:87.(2014·高考新课标全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了 50 位市民.根据这 50 位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:24(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26 位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75.50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本中位数为 =67,所以该市的市民对乙部门评分的中位66+ 682数的估计值是 67.(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分别为 =0.1, =0.16,故该市的市民对甲、乙部门的评分高于 90550 850的概率的估计值分别为 0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.8.(2014·高考广东卷)随机观测生产某种零件的某工厂 25 名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如下:分组 频数 频率[25,30] 3 0.12(30,35] 5 0.20(35,40] 8 0.32(40,45] n1 f1(45,50] n2 f225(1)确定样本频率分布表中 n1, n2, f1和 f2的值;(2)根据上述频率分布表,画出样本频率分布直方图;(3)根据样本频率分布直方图,求在该厂任取 4 人,至少有 1 人的日加工零件数落在区间(30,35]的概率.解:(1)由所给数据知,落在区间(40,45]内的有 7 个,落在(45,50]内的有 2 个,故 n1=7, n2=2,所以 f1= = =0.28, f2= = =0.08.n125 725 n225 225(2)样本频率分布直方图如图.(3)根据样本频率分布直方图,每人的日加工零件数落在区间(30,35]的概率为 0.2,设所取的 4 人中,日加工零件数落在区间(30,35]的人数为 ξ ,则 ξ ~ B(4,0.2), P(ξ ≥1)=1- P(ξ =0)=1-(1-0.2) 4=1-0.409 6=0.509 4,所以在该厂任取 4 人,至少有 1 人的日加工零件数落在区间(30,35]的概率为 0.590 4.[B 级 能力突破]1.小波一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小波一星期的鸡蛋开支占总开支的百分比为( )A.30% B.10%C.3% D.不能确定解析:由题图 2 可知鸡蛋开支占食品开支的 ,所以鸡蛋开支占总开支的 30%× =3%,故选 C.110 110答案:C262.(2015·高考山东卷)为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5 天,将这 5 天中 14 时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温;②甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温;③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差;④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( )A.①③ B.①④C.②③ D.②④解析:甲地该月 14 时的气温数据分布在 26 和 31 之间,且数据波动较大,而乙地该月 14 时的气温数据分布在 28 和 32 之间,且数据波动较小,可以判断结论①④正确,故选 B.答案:B3.(2015·高考课标卷Ⅱ)根据下面给出的 2004 年至 2013 年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A.逐年比较,2008 年减少二氧化硫排放量的效果最显著B.2007 年我国治理二氧化硫排放显现成效C.2006 年以来我国二氧化硫年排放量呈减少趋势D.2006 年以来我国二氧化硫年排放量与年份正相关解析:对于 A 选项,由图知从 2007 年到 2008 年二氧化硫排放量下降得最多,故 A 正确.对于 B 选项,由图知,由 2006 年到 2007 年矩形高度明显下降,因此 B 正确.对于 C 选项,由图知从 2006 年以后除 2011 年稍有上升外,其余年份都是逐年下降的,所以 C 正确.由图知2006 年以来我国二氧化硫年排放量与年份负相关,故选 D.答案:D4.某学员在一次射击测试中射靶 10 次,命中环数如下:7,8,7,9,5,4,9,10,7,4则:(1)平均命中环数为________;(2)命中环数的标准差为________.解析:利用平均值和标准差公式求解.27(1) = =7.x- 7+ 8+ 7+ 9+ 5+ 4+ 9+ 10+ 7+ 410(2)s2= [(7-7) 2+(8-7) 2+(7-7) 2+(9-7) 2+(5-7) 2+(4-7) 2+(9-7) 2+(10-7) 2+(7-7) 2+(4-7) 2]=4,110∴ s=2.答案:(1)7 (2)25.(2016·鄂州模拟)某校为了解高三同学寒假期间的学习情况,抽查了 100 名同学,统计他们平均每天的学习时间,绘成频率分布直方图(如图).则这 100 名同学中平均每天的学习时间在 6~8 小时内的人数为________.解析:由( x+0.14+0.12+0.05+0.04)×2=1,得 x=0.15.∴在 6~8 小时内的人数为×100=30.0.150.15+ 0.14+ 0.12+ 0.05+ 0.04答案:306.(2016·咸宁模拟)甲、乙两人在 10 天中每天加工零件的个数用茎叶图表示如图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这 10 天甲、乙两人日加工零件的平均数分别________和________.解析:甲的平均数为20+ =24,- 1- 2+ 1+ 3+ 2+ 11+ 11+ 1510乙的平均数为20+ =23.- 1- 3- 9+ 1+ 4+ 2+ 4+ 10+ 12+ 1010答案:24 237.育才中学的高二一班有男同学 45 名,女同学 15 名,老师按照分层抽样的方法组建了一个 4 人的课外兴趣小组.(1)求某同学被抽到的概率及课外兴趣小组中男、女同学的人数;(2)经过一个月的学习、讨论,这个兴趣小组决定选出两名同学做某项实验,方法是先从小组里选出 1 名同学做实验,该同学做完后,再28从小组内剩下的同学中选 1 名同学做实验,求选出的两名同学中恰有一名女同学的概率;(3)实验结束后,第一名做实验的同学得到的实验数据为 68,70,71,72,74,第二名做实验的同学得到的实验数据为 69,70,70,72,74,请问哪位同学的实验更稳定?并说明理由.解:(1) P= = ,445+ 15 115∴某同学被抽到的概率为 ,115设该课外兴趣小组中有 x 名男同学,则 = ,4560 x4∴ x=3,∴男、女同学的人数分别为 3,1.(2)把 3 名男同学和 1 名女同学分别记为 a1, a3, a3, b,则选取两名同学的基本事件有( a1, a2),( a1, a3),( a1, b),( a2, a1),( a2, a3),(a2, b)(a3, a1),( a3, a2)(a3, b),( b, a1),( b, a2),( b, a3)共 12 种情况,其中恰有一名女同学的有 6 种情况,∴选出的两名同学中恰有一名女同学的概率P1= = .612 12(3)∵ 1= =71,x68+ 70+ 71+ 72+ 7452= =71,x69+ 70+ 70+ 72+ 745s =21 68- 71 2+ 70- 71 2+ 71- 71 2+ 72- 71 2+ 74- 71 25=4,s =2 69- 71 2+ 2× 70- 71 2+ 72- 71 2+ 74- 71 25=3.2,∴ 1= 2, s > s ,x x 21 2故第二名同学的实验更稳定.第 3 课时 变量间的相关关系与统计案例1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用.4.了解回归分析的基本思想、方法及其简单应用.291.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,两个变量的这种相关关系称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法求回归直线使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(2)回归方程方程 y= bx+ a 是两个具有线性相关关系的变量的一组数据( x1, y1),( x2, y2),…,( xn, yn)的回归方程,其中 a, b 是待定参数.Error!3.相关系数 r用相关系数 r= 来描述线性相关关系的强弱.当 r>0 时,两个变量正相关;当 r<0 时,两个变量负相关, r 的n∑i= 1xiyi- nx yn∑i= 1x2i- nx2n∑i= 1y2i- ny2绝对值越接近 1,表明两个变量的线性相关性越强, r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系.通常当| r|大于 0.75时,认为两个变量有很强的线性相关关系,因而求回归直线方程才有意义.4.独立性检验(1)2×2 列联表设 A, B 为两个变量,每一个变量都可以取两个值,变量 A: A1, A2;变量 B: B1, B2,通过观察得到下表所示数据:BA B1 B2 合计A1 a b a+ bA2 c d c+ d合计 a+ c b+ d n= a+ b+ c+ d其中, a 表示变量 A 取 A1,且变量 B 取 B1时的数据; b 表示变量 A 取 A1,且变量 B 取 B2时的数据; c 表示变量 A 取 A2,且变量 B 取 B1时的数据; d 表示变量 A 取 A2,且变量 B 取 B2时的数据.30(2)独立性检验的方法选取统计量 2= ,用它的大小来检验变量之间是否独立.n ad- bc 2 a+ b c+ d a+ c b+ d①当 2≤2.706 时,没有充分的证据判定变量 A, B 有关联,可以认为变量 A, B 是没有关联的;②当 2>2.706 时,有 90%的把握判定变量 A, B 有关联;③当 2>3.841 时,有 95%的把握判定变量 A, B 有关联;④当 2>6.635 时,有 99%的把握判定变量 A, B 有关联.[基础自测]1.(教材改编题)下面哪些变量是相关关系( )A.出租车车费与行驶的里程 B.房屋面积与房屋价格C.身高与体重 D.铁块的大小与质量解析:A,B,D 都是函数关系,只有 C 是相关关系.答案:C2.(2016·南昌模拟)某商品销售量 y(件)与销售价格 x(元/件)负相关,则其回归方程可能是( )A. y=-10 x+200 B. y=10 x+200C. y=-10 x-200 D. y=10 x-200解析:由 y 与 x 负相关,排除 B,D.又因为 x, y 不能为负,再排除 C.答案:A3.(2016·枣庄模拟)下面是 2×2 列联表:y1 y2 合计x1 a 21 73x2 22 25 47合计 b 46 120则表中 a, b 的值分别为( )A.94,72 B.52,50C.52,74 D.74,52解析:∵ a+21=73,∴ a=52 又 a+22= b,∴ b=74.答案:C4.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别 非统计专业 统计专业男 13 10
展开阅读全文
相关搜索