1、第十章 统计与统计案例10.1 随机抽样-3-考纲要求 :1.理解随机抽样的必要性和重要性 . 2.会用简单随机抽样方法从总体中抽取样本 ,了解分层抽样和系统抽样方法 .-4-1.抽样调查通常情况下 ,从 调查对 象中按照一定的方法抽取一部分 ,进 行 调查 或 观测获 取数据 ,并以此 对调查对 象的某 项 指 标 作出推断 ,这就是抽 样调查 ,其中 ,调查对 象的全体称 为 总体 ,被抽取的一部分称 为 样本 , 样 本中个体的数目叫做 样 本 容量 .2.简单随机抽样(1)含 义 :从个体有限的 总 体中 ,随机地抽取一些个体 ,如果每次抽取 时总 体内的各个个体被抽到的概率 相同 ,
2、这样 的抽 样 方法叫作简单 随机抽 样 .(2)常用的 简单 随机抽 样 的方法 :抽签法 和 随机数法 .-5-3.分层抽样(1)定 义 :将 总 体按其属性特征分成若干 类 型 (有 时 称作 层 ),然后在每个 类 型中按照所占 比例 随机抽取一定的 样 本 ,这 种抽 样 方法通常叫作分 层 抽 样 ,有 时 也称 为类 型抽 样 .(2)适用范 围 :总 体由差异比 较 明 显 的几个部分 组 成 .4.系统抽样(1)定 义 :将 总 体中的个体 进 行 编 号 ,等距分 组 ,在第一 组 中按照 简单随机抽样 抽取第一个 样 本 ,然后按分 组 的 间 隔 (称 为 抽 样 距
3、)抽取其他 样 本 ,这 种抽 样 方法叫作系 统 抽 样 ,有 时 也叫等距抽 样 或机械抽 样 .(2)应 用范 围 :总 体中的个体数 较 多 .-6-1 2 3 4 51.下列 结论 正确的打 “”,错误 的打 “”.(1)因 为简单 随机抽 样 是一种不放回抽 样 ,所以每个个体被抽到的机会不同 ,与先后有关 . ( )(2)系 统 抽 样 在起始部分抽 样时 采用 简单 随机抽 样 . ( )(3)为 适合分段或分 层 先剔除几个个体再抽 样 ,这对 剔除的个体来 说 是不公平的 . ( )(4)分 层 抽 样 中 ,每个个体被抽到的可能性与 层 数及分 层 有关 . () -7-
4、1 2 3 4 52.在 “世界 读书 日 ”前夕 ,为 了了解某地 5 000名居民某天的 阅读时间 ,从中抽取了 200名居民的 阅读时间进 行 统计 分析 .在 这 个 问题 中 ,5 000名居民的 阅读时间 是 ( )A.总 体 B.个体C.样 本的容量 D.从 总 体中抽取的一个 样 本答案解析解析关闭由题意知 ,5 000名居民的阅读时间是总体 ;200名居民的阅读时间为一个样本 ;每个居民的阅读时间为个体 ;200为样本容量 .故选 A.答案解析关闭A-8-1 2 3 4 53.某学校 为 了了解三年 级 、六年 级 、九年 级这 三个年 级 之 间 的学生 视 力是否存在 显
5、 著差异 ,拟 从 这 三个年 级 中按人数比例抽取部分学生 进 行 调查 ,则 最合理的抽 样 方法是 ( )A.抽 签 法 B.系 统 抽 样 法C.分 层 抽 样 法 D.随机数法答案解析解析关闭按照各种抽样方法的适用范围可知 ,应使用分层抽样 .选 C.答案解析关闭C -9-1 2 3 4 54.(2015陕西 ,文 2)某中学初中部共有 110名教 师 ,高中部共有 150名教 师 ,其性 别 比例如 图 所示 ,则该 校女教 师 的人数 为 ( )A.93 B.123C.137 D.167答案解析解析关闭由性别比例图知 ,该校女教师的人数为 11070%+150(1-60%)=77
6、+60=137.答案解析关闭C -10-1 2 3 4 55. (2015福建 ,文 13)某校高一年 级 有 900名学生 ,其中女生 400名 .按男女比例用分 层 抽 样 的方法 ,从 该 年 级 学生中抽取一个容量 为45的 样 本 ,则应 抽取的男生人数 为 . 答案解析解析关闭答案解析关闭-11-1 2 3 4 5自 测 点 评1.抽样必须公平 ,每种抽样方法中每个个体入样的可能性都是相同的 ;分层抽样中每个个体入样的可能性都等于抽样比 ,与所在层无关 .2.系统抽样中一定要注意均匀分组 ,等间距抽取 ,第一组应用简单随机抽样抽取样本 .3.分层抽样最关键的是把握层数和抽样比 (要
7、清楚各层的抽样比和整体抽样比是一致的 ).-12-考点 1 考点 2 考点 3 知识方法 易错易混考点 1简单 随机抽 样 例 1(1)下面的抽 样 方法是 简单 随机抽 样 的是 ( )A.在某年明信片 销 售活 动 中 ,规 定每 100万 张为 一个开 奖组 ,通过 随机抽取的方式确定号 码 的后四位 为 2709的是三等 奖B.某 车间 包装一种 产 品 ,在自 动 包装的 传 送 带 上 ,每隔 30分 钟 抽一包 产 品 ,称其 质 量是否合格C.某学校分 别 从行政人 员 、教 师 、后勤人 员 中抽取 2人、 14人、 4人了解学校机构改革的意 见D.用抽 签 方法从 10件
8、产 品中 选 取 3件 进 行 质 量 检验答案解析解析关闭A,B不是简单随机抽样 ,因为抽取的个体间的间隔是固定的 ;C不是简单随机抽样 ,因为总体的个体有明显的层次差异 ;D是简单随机抽样 .答案解析关闭D-13-考点 1 考点 2 考点 3 知识方法 易错易混(2)总 体由 编 号 为 01,02, ,19,20的 20个个体 组 成 .利用下面的随机数表 选 取 5个个体 ,选 取方法是从随机数表第 1行的第 5列数字开始由左到右依次 选 取数字 ,则选 出来的第 5个个体的 编 号 为 ( )A.08 B.07 C.02 D.01答案解析解析关闭选出的 5个个体的编号依次是 08,0
9、2,14,07,01,故选 D.答案解析关闭D-14-考点 1 考点 2 考点 3 知识方法 易错易混思考 :使用简单随机抽样应满足的条件是什么 ?解题心得 :1.简单随机抽样需满足 : 被抽取的样本总体的个体数有限 ; 逐个抽取 ; 不放回抽取 ; 等可能抽取 .2.简单随机抽样常有抽签法 (适用总体中个体数较少的情况 )、随机数法 (适用于个体数较多的情况 ).-15-考点 1 考点 2 考点 3 知识方法 易错易混对点训练 1 (1)下列抽取样本的方式是简单随机抽样的有 ( ) 从无限多个个体中抽取 50个个体作 为样 本 ; 箱子里有 100支 铅 笔 ,今从中 选 取 10支 进 行
10、 检验 ,在抽 样 操作时 ,从中任意拿出一支 检测 后再放回箱子里 ; 从 50个个体中一次性抽取 5个个体作 为样 本 .A.0个 B.1个 C.2个 D.3个答案解析解析关闭 不满足样本的总体数有限的特点 ; 不满足不放回抽取的特点 ; 不满足逐个抽取的特点 .答案解析关闭A-16-考点 1 考点 2 考点 3 知识方法 易错易混(2)(2015广东七校联考 )假 设 要考察某公司生 产 的 500克袋装牛奶的三聚 氰 胺是否超 标 ,现 从 800袋牛奶中抽取 60袋 进 行 检验 ,利用随机数表抽取 样 本 时 ,先将 800袋牛奶按 000,001, ,799进 行 编 号,如果从
11、随机数表第 7行第 8列的数开始向右 读 ,则 得到的第 4个 样 本个体的 编 号是 .(下面摘取了随机数表第 7行至第 9行 ) 87 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54答案解析解析关闭由随机
12、数表 ,可以看出前 4个样本的个体的编号是 331,572,455,068.于是 ,第4个样本个体的编号是 068.答案解析关闭068-17-考点 1 考点 2 考点 3 知识方法 易错易混考点 2系 统 抽 样 例 2(1)(2015辽宁抚顺重点高中协作体高考模拟 )某校三个年 级 共有 24个班 ,学校 为 了了解同学 们 的心理状况 ,将每个班 编 号 ,依次 为1到 24,现 用系 统 抽 样 方法 ,抽取 4个班 进 行 调查 ,若抽到的最小 编号 为 3,则 抽取最大 编 号 为 ( )A.15 B.18 C.21 D.24答案解析解析关闭24个班分为 4组 ,抽取间隔为 244=
13、6.设抽到的最大编号为 x,根据最小编号为 3,可得 x-3=(4-1)6,解得 x=21.答案解析关闭C -18-考点 1 考点 2 考点 3 知识方法 易错易混(2)已知某 单 位有 40名 职 工 ,现 要从中抽取 5名 职 工 ,将全体 职 工随机按 140编 号 ,并按 编 号 顺 序平均分成 5组 .按系 统 抽 样 方法在各 组 内抽取一个号 码 .若第 1组 抽出的号 码为 2,则 所有被抽出 职 工的号 码为 . 答案解析解析关闭由系统抽样知识知 ,第一组为 18号 ;第二组为 916号 ;第三组为 1724号 ;第四组为 2532号 ;第五组为 3340号 .第一组抽出号码
14、为 2,则依次为10,18,26,34.答案解析关闭2,10,18,26,34-19-考点 1 考点 2 考点 3 知识方法 易错易混思考 :具有什么特点的总体适合用系统抽样抽取样本 ?解题心得 :1.当总体中的个体数较多 ,并且没有明显的层次差异时,可用系统抽样的方法 ,把总体分成均衡的几部分 ,按照预先制定的规则 ,从每一部分抽取一个个体 ,得到需要的样本 .2.在利用系统抽样时 ,经常遇到总体容量不能被样本容量整除的情况 ,这时可以先从总体中随机地剔除几个个体 ,使得总体中剩余的个体数能被样本容量整除 .-20-考点 1 考点 2 考点 3 知识方法 易错易混对点训练 2 (1)(201
15、5江西临川模拟 )某商 场举办 新年 购 物抽 奖活 动 ,先将 160名 顾 客随机 编 号 为 001,002,003, ,160,采用系 统 抽样 的方法抽取幸运 顾 客 ,已知抽取的幸运 顾 客中最小的两个 编 号为 007,023,那么抽取的幸运 顾 客中最大的 编 号 应该 是 ( ) A.151 B.150C.143 D.142答案解析解析关闭由两个最小编号知间隔为 16,共分成了 10组 ,故最大编号为 7+916=151.答案解析关闭A-21-考点 1 考点 2 考点 3 知识方法 易错易混(2)(2015四川自贡模拟 )将参加夏令 营 的 600名学生 编 号 为:001,
16、002, ,600,采用系 统 抽 样 方法抽取一个容量 为 50的 样 本 ,且随机抽得的号 码为 003.这 600名学生分住在三个 营 区 ,从 001到 300住在第 营 区 ,从 301到 495住在第 营 区 ,从 496到 600住在第 营区 ,三个 营 区被抽中的人数依次 为 ( )A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9答案解析解析关闭依题意可知 ,在随机抽样中 ,首次抽到 003号 ,以后每隔 12个号抽到一个人 ,则分别是 003,015,027,039, 构成以 3为首项 ,12为公差的等差数列 ,故可分别求出在 001到 300中有
17、 25人 ,在 301至 495号中共有 17人 ,则 496到 600中有 8人 ,所以 B正确 .答案解析关闭B-22-考点 1 考点 2 考点 3 知识方法 易错易混考点 3分 层 抽 样 (多 维 探究 ) 类型一 已知总体数量 ,求各层抽取数量例 3某校 选 修 乒乓 球 课 程的学生中 ,高一年 级 有 30名 ,高二年 级有 40名 .现 用分 层 抽 样 的方法在 这 70名学生中抽取一个 样 本 ,已知在高一年 级 的学生中抽取了 6名 ,则 在高二年 级 的学生中 应 抽取的人数 为 ( )A.6 B.8 C.10 D.12思考 :在分层抽样中 ,明确抽样比是什么 ?每一层
18、是按什么比来抽取的 ?答案解析解析关闭答案解析关闭-23-考点 1 考点 2 考点 3 知识方法 易错易混类型二 已知抽取人数 ,确定总体或各层数量例 4(1)(2015石家庄模拟 )交通管理部 门为 了解机 动车驾驶员 (简 称 驾驶员 )对 某新法 规 的知 晓 情况 ,对 甲、乙、丙、丁四个社区做分 层 抽 样调查 .假 设 四个社区 驾驶员 的 总 人数 为 N,其中甲社区有 驾驶员 96人 .若在甲、乙、丙、丁四个社区抽取 驾驶员 的人数分 别为 12,21,25,43,则这 四个社区 驾驶员 的 总 人数 N为 ( )A.101 B.808C.1 212 D.2 012答案解析解析
19、关闭答案解析关闭-24-考点 1 考点 2 考点 3 知识方法 易错易混(2)某中学有高中生 3 500人 ,初中生 1 500人 .为 了解学生的学 习 情况 ,用分 层 抽 样 的方法从 该 校学生中抽取一个容量 为 n的 样 本 ,已知从高中生中抽取 70人 ,则 n为 ( )A.100 B.150 C.200D.250答案解析解析关闭答案解析关闭-25-考点 1 考点 2 考点 3 知识方法 易错易混思考 :在分层抽样中 ,每个个体入样的可能性与抽样的个数和总体数量之比有怎样的关系 ?解题心得 :1.在分层抽样中 ,抽样比 = ,每一层都是按抽样比的比例来抽取的 .2.在分层抽样的过程
20、中 ,各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比 ,即 niNi=nN.3.分层抽样适用于总体是由差异明显的几部分组成的情况 ,这样更能反映总体的情况 ,是等可能抽样 .-26-考点 1 考点 2 考点 3 知识方法 易错易混对点训练 3 (1)某校高三一班有学生 54人 ,二班有学生 42人 ,现在要用分层抽样的方法从两个班抽出 16人参加军训表演 ,则一班和二班分别被抽取的人数是 ( ) A.8,8 B.10,6 C.9,7 D.12,4答案解析解析关闭答案解析关闭-27-考点 1 考点 2 考点 3 知识方法 易错易混(2)某校高一、高二、高三分 别 有学生
21、 1 600名、 1 200名、 800名.为 了解 该 校高中学生的牙 齿 健康情况 ,按各年 级 的学生数 进 行分层 抽 样 .若高三抽取 20名学生 ,则 高一、高二共需抽取的学生数 为.答案解析解析关闭高一、高二、高三三个年级的学生数之比为 432,高三抽取了 20人 ,则高一、高二应分别抽取 40,30人 ,故高一、高二共抽取 70人 .答案解析关闭70-28-考点 1 考点 2 考点 3 知识方法 易错易混1.三种抽 样 方法中 简单 随机抽 样 是最基本的抽 样 方法 ,是其他两种方法的基 础 ,适用范 围 不同 ,要根据 总 体的具体情况 选 用不同的方法 ;它 们 的共同点
22、都是等可能抽 样 ,即抽 样过 程中每个个体被抽取的可能性相等 ,体 现 了 这 三种抽 样 方法的客 观 性和公平性 ;若样 本容量 为 n,总 体的个体数 为 N,则 用 这 三种方法抽 样时 ,每一个个体被抽到的可能性都是-29-考点 1 考点 2 考点 3 知识方法 易错易混2.三种抽 样 方法的比 较 -30-考点 1 考点 2 考点 3 知识方法 易错易混1.系 统 抽 样 中要注意根据所抽取 样 本个数 进 行分 组 ,并确定好间 隔 ,遇到不能整除的情况 ,一般是先剔除几个再抽取 .2.进 行分 层 抽 样时应 注意几点 :(1)分 层 抽 样 中分多少 层 、如何分 层 要
23、视 具体情况而定 ,总 的原则 是 层 内 样 本的差异要小 ,两 层 之 间 的 样 本差异要大 ,且互不重叠 ;(2)为 了保 证 每个个体等可能入 样 ,所有 层 中每个个体被抽到的可能性相同 ;(3)在每 层 抽 样时 ,应 采用 简单 随机抽 样 或系 统 抽 样 的方法 进 行抽 样 ;(4)分 层 抽 样 中 ,易忽 视 每 层 抽取的个体的比例是相同的 ,即10.2 统计图表、数据的数字特征、用样本估计总体-2-考纲要求 :1.了解分布的意义和作用 ,能根据频率分布表画频率分布直方图、频率折线图、茎叶图 ,体会它们各自的特点 . 2.理解样本数据标准差的意义和作用 ,会计算数据
24、标准差 . 3.能从样本数据中提取基本的数字特征 (如平均数、标准差 ),并给出合理的解释 . 4.会用样本的频率分布估计总体分布 ,会用样本的基本数字特征估计总体的基本数字特征 ,理解用样本估计总体的思想 . 5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题 .-3-1.四种常用的 统计图 表 :条形统计图 、折 线统计图 、扇形 统计图 、 茎叶图 .2.数据的数字特征(2)中位数 :将数据从小到大排列 ,若有奇数个数 则 最中 间 的数是中位数 ;若有偶数个数 则 中 间 两数的 平均数 是中位数 .(3)众数 :一 组 数据中出 现 次数最多的数 .(4)极差 :一
25、 组 数 值 中最大 值 与 最小值 的差 ,它反映一 组 数据的波动 情况 .-4-5-3.用样本估计总体(1)频率分布直方图 含 义 :频 率分布直方 图 由一些小矩形来表示 ,每个小矩形的 宽度 为 xi(分组的宽度 ),高 为 ,小矩形的面 积 恰 为 相 应 的 频率 fi,图中所有小矩形的面 积 之和 为 1. 绘 制 频 率分布直方 图 的步 骤为 :求极差 ;决定 组 距与 组 数 ;将数据分组 ;列 频 率分布表 ;画 频 率分布直方 图 .(2)频 率分布折 线图 :在 频 率分布直方 图 中 ,按照分 组 原 则 ,再在左 边 和右 边 各加一个区 间 .从所加的左 边
26、区 间 的中点开始 ,用 线 段依次 连 接各个矩形的 顶 端中点 ,直至右 边 所加区 间 的中点 ,就可以得到一条折 线 ,我 们 称之 为频 率折 线图 .随着 样 本容量的增加 ,作图时 所分的 组 数增加 ,组 距减小 ,相 应 的 频 率分布折 线图 就会越来越接近于一条光滑的曲 线 .-6-2 3 41 51.下列 结论 正确的打 “”,错误 的打 “”.(1)平均数、众数与中位数都可以描述数据的集中 趋势 . ( )(2)一 组 数据的方差越大 ,说 明 这组 数据的波 动 越大 . ( )(3)频 率分布直方 图 中 ,小矩形的面 积 越大 ,表示 样 本数据落在 该区 间
27、内的 频 率越大 . ( )(4)从 频 率分布直方 图 中得不出原始的数据内容 . ( )(5)茎叶 图 中的数据要按从小到大的 顺 序写 ,相同的数据可以只记 一次 . ( ) -7-2 3 41 52. (2015湖南 ,文 2)在一次 马 拉松比 赛 中 ,35名运 动员 的成 绩 (单位 :分 钟 )的茎叶 图 如 图 所示 :若将运 动员 的成 绩 按由好到差 编为 135号 ,再用系 统 抽 样 方法从中抽取 7人 ,则 其中成 绩 在区 间 139,151上的运 动员 人数是 ( )A.3 B.4 C.5 D.6答案解析解析关闭依题意 ,应将 35名运动员的成绩由好到差排序后分
28、为 7组 ,每组 5人 .然后从每组中抽取 1人 ,其中成绩在区间 139,151上的运动员恰好是第 2,3,4,5组 ,因此 ,成绩在该区间上的运动员人数是 4.答案解析关闭B-8-2 3 41 53.(2015重庆 ,文 4)重 庆 市 2013年各月的平均气温 ( )数据的茎叶图 如下 :则这组 数据的中位数是 ( )A.19 B.20 C.21.5 D.23答案解析解析关闭答案解析关闭-9-2 3 41 5答案解析解析关闭答案解析关闭-10-2 3 41 55.为 了了解一片 经济 林的生 长 情况 ,随机抽 测 了其中 60株 树 木的底部周 长 (单 位 :cm),所得数据均在区
29、间 80,130上 ,其 频 率分布直方 图 如 图 所示 ,则 在抽 测 的 60株 树 木中 ,有 株 树 木的底部周 长 小于 100 cm. 答案解析解析关闭由题意 ,在抽测的 60株树木中 ,底部周长小于 100 cm的株数为(0.015+0.025)1060=24.答案解析关闭24-11-2 3 41 51.平均数表示一组数据的平均水平 ,众数表示一组数据中出现次数最多的数 ,中位数表示一组数据按从小到大或从大到小的顺序排列后中间一项或中间两项的平均数 ,都可以从不同的角度描述数据的集中趋势 .2.频率分布直方图中的纵轴代表的是 ,而不是频率 .3.对于实际中的数据分析的时候 ,要
30、注意贴合实际目的 ,并尽量分析全面 ,从而做出合理的决策 .-12-考点 1 考点 2 考点 3 知识方法 易错易混考点 1频 率分布直方 图 例 1某城市 100户 居民的月平均用 电 量 (单 位 :度 ),以160,180),180,200),200,220),220,240),240,260),260,280),280,300分 组 的 频 率分布直方 图 如 图 .(1)求直方 图 中 x的 值 ;(2)求月平均用 电 量的众数和中位数 ;(3)在月平均用 电 量 为 220,240),240,260),260,280),280,300的四 组 用 户 中 ,用分 层 抽 样 的方法
31、抽取 11户 居民 ,则 月平均用 电 量在220,240)的用 户 中 应 抽取多少 户 ?-13-考点 1 考点 2 考点 3 知识方法 易错易混解 :(1)由 (0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)20=1,得 x=0.007 5,所以直方图中 x的值是 0.007 5.(2)月平均用电量的众数是 因为 (0.002+0.009 5+0.011)20=0.450.5,所以月平均用电量的中位数在 220,240)内 ,设中位数为 a,由 (0.002+0.009 5+0.011)20+0.012 5(a-220)=0.5,得 a=224,
32、所以月平均用电量的中位数是 224.-14-考点 1 考点 2 考点 3 知识方法 易错易混(3)月平均用电量在 220,240)的用户有 0.012 520100=25(户 ),月平均用电量在 240,260)的用户有 0.007 520100=15(户 ),月平均用电量在 260,280)的用户有 0.00520100=10(户 ),月平均用电量在 280,300的用户有 0.002 520100=5(户 ),抽取比例为所以月平均用电量在 220,240)的用户中应抽取 25 =5(户 ).-15-考点 1 考点 2 考点 3 知识方法 易错易混思考 :频率分布直方图有哪些性质 ?如何利用
33、频率分布直方图求众数、中位数与平均数 ?解题心得 :1.频率分布直方图的性质 .2.频率分布直方图中的众数、中位数与平均数 .(1)最高的小长方形底边中点的横坐标即是众数 ;(2)中位数左边和右边的小长方形的面积和是相等的 ;(3)平均数是频率分布直方图的 “重心 ”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和 .-16-考点 1 考点 2 考点 3 知识方法 易错易混对点训练 1 (1)为了调查某工厂工人生产某种产品的能力 ,随机抽查了 20名工人某天生产该产品的数量 ,产量的分组区间为45,55),55,65),65,75),75,85),85,95,频率分布直
34、方图如图所示 ,若数据落在第 3组和第 5组的频率和等于数据落在第 4组的频率的 2倍 ,则这 20名工人中一天生产该产品的数量在 75,85)内的人数是 .答案解析解析关闭设样本数据落在 75,85)内的频率为 x,则由各小组的频率之和为 1,可知 0.02010+0.03510+x+2x=1,解得x=0.15,所以 20名工人中一天生产该产品的数量在 75,85)内的人数为200.15=3.答案解析关闭3-17-考点 1 考点 2 考点 3 知识方法 易错易混(2)某地政府 调查 了工薪 阶层 1 000人的月工 资 收入 ,并根据 调查结 果画出如 图 所示的 频 率分布直方 图 ,为
35、了了解工薪 阶层对 月工资 收入的 满 意程度 ,要用分 层 抽 样 的方法从 调查 的 1 000人中抽出100人做 电话询访 ,则 月工 资 收入段 30,35)(百元 )应 抽出 人. 答案解析解析关闭答案解析关闭-18-考点 1 考点 2 考点 3 知识方法 易错易混考点 2茎叶 图 的 应 用 例 2(1)如 图 所示的茎叶 图记录 了甲、乙两 组 各 5名学生在一次英 语 听力 测试 中的成 绩 (单 位 :分 ).已知甲 组 数据的中位数 为 15,乙组 数据的平均数 为 16.8,则 x,y的 值 分 别为 ( )A.2,5B.5,5 C.5,8D.8,8答案解析解析关闭答案解
36、析关闭-19-考点 1 考点 2 考点 3 知识方法 易错易混(2)(2015海口调研 )某 样 本数据的茎叶 图 如 图 所示 ,若 该组 数据的中位数 为 85,则该组 数据的平均数 为 . 答案解析解析关闭答案解析关闭-20-考点 1 考点 2 考点 3 知识方法 易错易混思考 :如何制作茎叶图 ?使用茎叶图统计数据有什么优缺点 ?如何用茎叶图估计样本数据特征 ?解题心得 :1.一般制作茎叶图的方法是 :将所有两位数的十位数字作为 “茎 ”,个位数字作为 “叶 ”,茎相同者共用一个茎 ,茎按从小到大顺序由上到下列出 .2.茎叶图的优缺点如下 :(1)优点 :一是所有的信息都可以从这个茎叶
37、图中得到 ;二是茎叶图便于记录和表示 ,能够展示数据的分布情况 .(2)缺点 :样本数据较多或数据位数较多时 ,不方便表示数据 .3.对于给定两组数据的茎叶图 ,估计数字特征 ,可根据 “重心 ”下移者平均数较大 ,数据集中者方差较小 .-21-考点 1 考点 2 考点 3 知识方法 易错易混对点训练 2 (1)某商店对一个月内每天的顾客人数进行了统计 ,得到样本的茎叶图 (如图所示 ),则该样本的中位数、众数、极差分别是 ( ) A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53答案解析解析关闭由茎叶图可知中位数为 46,众数为 45,极差为 68-12=5
38、6.故选 A.答案解析关闭A-22-考点 1 考点 2 考点 3 知识方法 易错易混(2)某学校随机抽取 20个班 ,调查 各班中有网上 购 物 经历 的人数 ,所得数据的茎叶 图 如 图 所示 ,以 组 距 为 5将数据分 组 成0,5),5,10), ,30,35),35,40时 ,所作的 频 率分布直方 图 是 ( )答案解析解析关闭由分组可知 C,D一定不对 ;由茎叶图可知 0,5)有 1人 ,5,10)有 1人 , 第一、二小组频率相同 ,频率分布直方图中矩形的高应相等 ,可排除 B.答案解析关闭A-23-考点 1 考点 2 考点 3 知识方法 易错易混考点 3样 本的数字特征 例
39、3甲、乙两人参加某体育 项 目 训练 ,近期的五次 测试 成 绩 得分 统计 情况如 图 .(1)分 别 求出两人得分的平均数与方差 ;(2)根据 统计图 和 (1)中得出的 结 果 ,请对 两人的 训练 成 绩 作出评 价 .-24-考点 1 考点 2 考点 3 知识方法 易错易混解 :(1)由题图可得甲、乙两人五次测试的成绩分别为甲 :10分 ,13分 ,12分 ,14分 ,16分 ;乙 :13分 ,14分 ,12分 ,12分 ,14分 .(2)由 可知乙的成绩较稳定 .从折线图看 ,甲的成绩基本呈上升状态 ,而乙的成绩上下波动 ,可知甲的成绩在不断提高 ,而乙的成绩则无明显提高 .-25
40、-考点 1 考点 2 考点 3 知识方法 易错易混思考 :众数、中位数、平均数及方差的意义有什么不同 ?解题心得 :1.众数、中位数、平均数及方差的意义 :(1)平均数与方差都是重要的数字特征 ,是对总体的一种简明地描述 ;(2)平均数、中位数、众数描述其集中趋势 ,方差和标准差描述波动大小 .2.平均数、方差的公式推广 : 数据 x1+b,x2+b, ,xn+b的方差也为 s2; 数据 ax1,ax2, ,axn的方差为 a2s2.-26-考点 1 考点 2 考点 3 知识方法 易错易混对点训练 3 (1)(2015武汉调研 )甲、乙两人在一次射 击 比 赛 中各射靶 5次 ,两人成 绩 的
41、条形 统计图 如 图 所示 ,则 ( ) A.甲的成 绩 的平均数小于乙的成 绩 的平均数B.甲的成 绩 的中位数等于乙的成 绩 的中位数C.甲的成 绩 的方差小于乙的成 绩 的方差D.甲的成 绩 的极差小于乙的成 绩 的极差答案解析解析关闭答案解析关闭-27-考点 1 考点 2 考点 3 知识方法 易错易混(2)(2015哈尔滨四校统考 )甲、乙、丙、丁四人参加某运 动 会射击项 目 选 拔 赛 ,四人的平均成 绩 和方差如下表所示 :从 这 四个人中 选择 一人参加 该 运 动 会射 击项 目比 赛 ,最佳人 选是 ( )A.甲 B.乙 C.丙 D.丁答案解析解析关闭从表中可以看出 :乙、
42、丙两人的平均环数相等且最大 ,说明乙、丙两人的成绩最好 ,但方差丙的最小 ,说明丙比乙成绩稳定 ,所以选丙 .答案解析关闭C -28-考点 1 考点 2 考点 3 知识方法 易错易混1.平均数、中位数、众数-29-考点 1 考点 2 考点 3 知识方法 易错易混3.从 频 率分布直方 图 中得出有关数据的方法 : -30-考点 1 考点 2 考点 3 知识方法 易错易混1.利用 频 率分布直方 图 求众数、中位数与平均数 时 ,应 注意 这三者的区分 :(1)最高的矩形底 边 中点的横坐 标 即众数 ;(2)中位数左边 和右 边 的直方 图 的面 积 是相等的 ;(3)平均数是 频 率分布直方
43、 图的 “重心 ”,等于 频 率分布直方 图 中每个小矩形的面 积 乘以小矩形底 边 中点的横坐 标 之和 .2.直方 图 与条形 图 不要搞混 :(1)条形 图 是用条形的 长 度表示各 类别频 数的多少 ,其 宽 度 (表示类别 )是固定的 ;直方 图 是用面 积 表示各 组频 率的多少 ,矩形的高度表示每一 组 的 频 率除以 组 距 ,宽 度 则 表示各 组 的 组 距 ,因此其高度与 宽 度均有意 义 .(2)由于分 组 数据具有 连续 性 ,直方 图 的各矩形通常是 连续 排列 ,而条形 图则 是分开排列 .10.3 相关性、最小二乘估计与统计案例-2-考纲要求 :1.会作两个有关
44、联变量的数据的散点图 ,会利用散点图认识变量间的相关关系 . 2.了解最小二乘法的思想 ,能根据给出的线性回归方程系数公式建立线性回归方程 (线性回归方程系数公式不要求记忆 ). 3.通过典例案例了解回归分析的思想、方法 ,并能初步应用回归分析的思想、方法解决一些简单的实际问题 . 4.通过典型案例了解独立性检验的思想、方法 ,并能初步应用独立性检验的思想、方法解决一些简单的实际问题 .-3-1.相关性(1)散点 图 :在考 虑 两个量的关系 时 ,为 了 对变 量之 间 的关系有一个大致的了解 ,人 们 通常将 变 量所 对应 的点描出来 ,这 些点就 组 成了 变 量之 间 的一个 图 ,
45、通常称 这 种 图为变 量之 间 的 散点图 .(2)线 性相关 :若两个 变 量 x和 y的散点 图 中 ,所有点看上去都在 一条直线 附近波 动 ,则 称 变 量 间 是 线 性相关的 ,此 时 ,我 们 可以用 一条直线 来近似 .(3)非 线 性相关 :在两个 变 量 x和 y的散点 图 中 ,若所有点看上去都在某条 曲线 附近波 动 ,则 称此相关 为 非 线 性相关的 .此 时 ,可以用一条 曲线 来 拟 合 .如果所有的点在散点 图 中没有 显 示任何关系 ,则 称变 量 间 是 不相关的 .-4-2.最小二乘法与线性回归方程(1) 最小二乘法 :如果有 n个点 :(x1,y1)
46、,(x2,y2), ,(xn,yn),可以用下面的表达式来刻画 这 些点与直 线 y=a+bx的接近程度 :y1-(a+bx1)2+y2-(a+bx2)2+ +yn-(a+bxn)2.使得上式达到最小 值 的直 线 y=a+bx就是我 们 所要求的直 线 ,这 种方法称 为 最小二乘法 .-5-3.独立性检验(1)22列 联 表-6-(2)独立性 检验利用随机 变 量来判断 “两个 变 量 有关联 ”的方法称 为 独立性 检验.(3)当数据量 较 大 时 ,在 统计 中 ,用以下 结 果 对变 量的独立性 进行判断 当 2 2.706时 ,没有充分的 证 据判定 变 量 A,B有关 联 ,可以
47、 认为变 量 A,B是没有关 联 的 ; 当 22.706时 ,有 90%的把握判定 变 量 A,B有关 联 ; 当 23.841时 ,有 95%的把握判定 变 量 A,B有关 联 ; 当 26.635时 ,有 99%的把握判定 变 量 A,B有关 联 .-7-2 3 41 51.下列 结论 正确的打 “”,错误 的打 “”.(1)相关关系的两个 变 量是非确定性关系 . ( )(2)利用散点 图 可以直 观 判断两个 变 量的关系是否可以用 线 性关系表示 . ( )(3)只有两个 变 量有相关关系 ,所得到的回 归 模型才有 预测 价 值 . ( )(4)对 于分 类变 量 X与 Y,统计
48、 量 2的 值 越小 ,“X与 Y有关 联 ”的把握程度越大 . ( )(5)通 过 回 归 方程 y=bx+a可以估 计 和 观测变 量的取 值 和 变 化 趋势 . ( )-8-2 3 41 52. 2015湖北 ,文 4)已知 变 量 x和 y满 足关系 y=-0.1x+1,变 量 y与 z正相关 .下列 结论 中正确的是 ( )A.x与 y负 相关 ,x与 z负 相关B.x与 y正相关 ,x与 z正相关C.x与 y正相关 ,x与 z负 相关D.x与 y负 相关 ,x与 z正相关答案解析解析关闭由 y=-0.1x+1知 y与 x负相关 ,又因为 y与 z正相关 ,故 z与 x负相关 .答
49、案解析关闭A-9-2 3 41 5答案解析解析关闭答案解析关闭-10-2 3 41 54. (2015北京 ,文 14) 高三年 级 267位学生参加期末考 试 ,某班 37位学生的 语 文成 绩 、数学成 绩 与 总 成 绩 在全年 级 中的排名情况如下 图 所示 ,甲、乙、丙 为该 班三位学生 .从 这 次考 试 成 绩 看 ,(1)在甲、乙两人中 ,其 语 文成 绩 名次比其 总 成 绩 名次靠前的学生是 ; (2)在 语 文和数学两个科目中 ,丙同学的成 绩 名次更靠前的科目是 . 答案解析解析关闭(1)由题图可知 ,甲的语文成绩排名比总成绩排名靠后 ;而乙的语文成绩排名比总成绩排名靠
50、前 .故填乙 .(2)由题图可知 ,比丙的数学成绩排名还靠后的人比较多 ;而总成绩的排名中比丙排名靠后的人数比较少 ,所以丙的数学成绩的排名更靠前 .故填数学 .答案解析关闭(1)乙 (2)数学-11-2 3 41 5答案解析解析关闭 2=27.6310.828, 在犯错误的概率不超过 0.001的前提下认为打鼾与患心脏病有关 .答案解析关闭有关5.在一 项 打鼾与患心 脏 病的 调查 中 ,共 调查 了 1 671人 ,经过计 算2的 观测值 k=27.63,根据 这 一数据分析 ,我 们 有理由 认为 打鼾与患心 脏 病是 的 (填 “有关 ”或 “无关 ”).-12-2 3 41 5自
51、测 点 评1.散点图上的点大致分布在某条直线附近 ,整体上呈线性分布时 ,两个变量相关关系越强 .2. 2越大 ,“X与 Y有关联 ”的把握程度越大 .3.注意回归分析时对应的结果均是估计值 ,不要误认为是真实值 ;对于独立性检验的结论需要在概率意义下来理解 ,避免在现实生活中错误应用 .4.要理解回归直线方程中的参数是用最小二乘法得出的 ,目的是使距离的平方和最小 ,不是看具体某一个距离的大小 ,这样使用求平方和也避免了讨论绝对值和正负问题 .-13-考点 1 考点 2 考点 3 知识方法 易错易混考点 1相关关系的判断 例 1(1)对变 量 x,y有 观测 数据 (xi,yi)(i=1,2
52、, ,10),得散点 图 ;对变 量 u,v有 观测 数据 (ui,vi)(i=1,2, ,10),得散点 图 ,由 这 两个散点图 可以判断 ( )A.变 量 x与 y正相关 ,u与 v正相关B.变 量 x与 y正相关 ,u与 v负 相关C.变 量 x与 y负 相关 ,u与 v正相关D.变 量 x与 y负 相关 ,u与 v负 相关 答案解析解析关闭题图 的散点分布在斜率小于 0的直线附近 ,y随 x的增大而减小 ,故变量 x与 y负相关 ;题图 的散点分布在斜率大于 0的直线附近 ,u随 v的增大而增大 ,故变量 u与 v正相关 ,故选 C.答案解析关闭C -14-考点 1 考点 2 考点
53、3 知识方法 易错易混(2)甲、乙、丙、丁四位同学各自 对 A,B两 变 量的 线 性相关性做试验 ,并用回 归 分析方法分 别 求得相关系数 r与残差平方和 m如下表 :则 哪位同学的 试验结 果体 现 A,B两 变 量有更 强 的 线 性相关性 ()A.甲 B.乙 C.丙 D.丁答案解析解析关闭在验证两个变量之间的线性相关关系时 ,相关系数的绝对值越接近 1,相关性越强 ,在四个选项中只有丁的相关系数最大 ;残差平方和越小 ,相关性越强 ,只有丁的残差平方和最小 ,综上可知丁的试验结果体现了 A,B两变量有更强的线性相关性 ,故选 D.答案解析关闭D-15-考点 1 考点 2 考点 3 知
54、识方法 易错易混思考 :如何判断两个变量有无相关关系 ?解题心得 :判断两个变量有无相关关系有两个方法 :一是根据散点图 ,具有很强的直观性 ,直接得出两个变量是正相关或负相关 ;二是计算相关系数法 ,这种方法能比较准确地反映相关程度 ,相关系数的绝对值越接近 1,相关性就越强 ,相关系数就是描述相关性强弱的 .-16-考点 1 考点 2 考点 3 知识方法 易错易混对点训练 1 (1)对四组数据进行统计 ,获得如图所示的散点图 ,关于其相关系数的比较 ,正确的是 ( ) A.r26.635,所以有 99%以上的把握认为该地区的老年人是否需要帮助与性别有关 .(3)由 (2)的结论知 ,该地区
55、老年人是否需要帮助与性别有关 ,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异 ,因此在调查时 ,先确定该地区老年人中男、女的比例 ,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好 .-28-考点 1 考点 2 考点 3 知识方法 易错易混思考 :独立性检验得出的结论是什么 ?它对我们日常生活有什么帮助 ?解题心得 :独立性检验就是考察两个分类变量是否有关系 ,利用独立性检验 ,能够帮助我们对日常生活中的实际问题作出合理的推断和预测 ,并能较为准确地给出这种判断的可信度 ;具体做法是根据公式 ,计算 2,2值越大 ,说明 “两个变量有关系 ”的可能性越大 .-29-考点 1 考点 2 考点 3 知识方法 易错易混对点训练 3 某中学对 “学生性别和是否喜欢看 NBA比赛 ”作了一次调查 ,其中男生人数是女生人数的 2倍 ,男生喜欢看 NBA的人数占男生人数的 ,女生喜欢看 NBA的人数占女生人数的 (1)若被 调查 的男生人数 为 n,根据 题 意建立一个 22列 联 表 ;(2)若有 95%以上的把握 认为 是否喜 欢 看 NBA和性 别 有关 ,求男生至少有多少人 ?-30-考点 1 考点 2 考点 3 知识方法 易错易混解 :(1)由已知得 :