1、12.2 分层抽样与系统抽样1理解分层抽样与系统抽样的概念2通过对实例的分析,了解分层抽样与系统抽样的方法1分层抽样(1)定义:将总体按其_分成若干类型(有时称作层),然后在每个类型中按照_随机抽取一定的样本这种抽样方法通常叫作分层抽样,有时也称为类型抽样(2)分层抽样的步骤:分层:按某种_将总体分成若干部分(层)按_确定每层抽取个体的个数各层分别按简单随机抽样或其他的抽样方法抽取样本综合每层抽样,组成样本应用分层抽样应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则,即保证样本结构与总体结构的一致性(2)分层抽样为保证每个个
2、体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与该层个体数量的比与样本容量与总体容量的比相等(3)当总体个体差异明显时,采用分层抽样【做一做 11】某社区有 500 户家庭,其中高收入家庭 125 户,中等收入家庭 280 户,低收入家庭 95 户,为了调查社会购买力的某项指标,要从中抽取一个容量为 100 的样本,应采用的抽样方法是( )A简单随机抽样 B分层抽样C系统抽样 D分类抽样【做一做 12】当前,国家正分批修建经济适用房以解决低收入家庭住房紧张的问题已知甲、乙、丙三个社区现分别有低收入家庭 360 户、270 户、180 户,若第一批经济适用房中有 90 套住房用于解决
3、这三个社区中 90 户低收入家庭的住房问题,则应从甲社区中抽取低收入家庭的户数为( )A40 B30C20 D362系统抽样(1)定义:将总体中的个体进行编号,等距分组,在第一组中,按照_抽取第一个样本,然后按_(称为抽样距)抽取其他样本这种抽样方法称为系统抽样,有时也叫等距抽样或机械抽样(2)注意:编号时要随机编号,否则抽取的样本代表性差(3)系统抽样的步骤:采用随机抽样的方法将总体中的 N 个个体_确定分段间隔 k(k N),将整体按编号进行分段(组)在第_段用简单随机抽样确定起始个体的编号 l(l N,0 l k)按照一定的规则抽取样本,通常是将起始编号 l_上间隔 k 得到第 2 个个
4、体编号 l k,再加上 k 得到第 3 个个体编号 l2 k,这样继续下去,直到获取整个样本系统抽样的特征:(1)当总体中个体无差异且个体数目较大时,采用系统抽样(2)将总体分成均衡的若干部分指的是,将总体分段,分段的间隔要求相等,因此,系2统抽样又称等距抽样,间隔一般为 k Error!表示不超过Error!.Nn(3)预先制定的规则指的是,在第一段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号【做一做 21】下列抽样试验中,最适宜用系统抽样法的是( )A某市的 4 个区共有 2 000 名学生,且 4 个区的学生人数之比为 3282,从中抽取 200
5、人入样B从某厂生产的 2 000 个电子元件中随机抽取 5 个入样C从某厂生产的 2 000 个电子元件中随机抽取 200 个入样D从某厂生产的 20 个电子元件中随机抽取 5 个入样【做一做 22】一个总体中有 1 000 个个体,现用系统抽样抽取一个容量为 100 的样本,则编号后,按从小到大的编号顺序平均分成_组,每组有_个个体1系统抽样中如何对总体中的每个个体进行合理分段?剖析:系统抽样操作的要领是先将个体数较多的总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取 1 个个体,得到所需样本由于抽样的间隔相等,因此系统抽样又称为等距抽样(或叫机械抽样),所以系统抽样中必须对
6、总体中的每个个体进行合理(即等距)分段若从容量为 N 的总体中抽取容量为 n 的样本,用系统抽样时,应先将总体中的各个个体编号,再确定分段间隔 k,以便对总体进行分段当 是整数时,取 k 为分段间隔即可,如 N100, n20,则分段间隔 k 5,Nn Nn 10020也就是将 100 个个体平均每 5 个分为一段(组)当 不是整数时,应先从总体中随机剔除一些个体,使剩余个体数 N能被 n 整除,这Nn时分段间隔 k ,如 N101, n20,则应先用简单随机抽样从总体中剔除 1 个个体,Nn使剩余的总体容量(即 100)能被 20 整除,从而得出分段间隔 k 5,也就是说,只需10020将
7、100 个个体平均分为 20 段(组)一般地,用简单随机抽样的方法从总体中剔除部分个体,其个数为总体中的个体数除以样本容量所得的余数上述过程中,总体中的每个个体被取出(或被剔除)的可能性相等,也就是每个个体不被选取(或不被剔除)的可能性也相等,所以在整个抽样过程中每个个体被抽取的机会仍然都相等,这说明使用系统抽样法抽取样本的过程是公平的2分层抽样中各层入样的个体数应如何确定?剖析:当总体由差异明显的几部分组成时,应将总体分成互不交叉的几部分,其中所分成的每一部分叫层,然后按照各部分所占的比例,从各部分中独立抽取一定数量的个体,再将各部分抽出的个体合在一起作为样本,这就是分层抽样由于层与层之间有
8、明显的区别,而层内个体间差异不明显,为了使样本更能充分地反映总体的情况,抽取样本时,必须照顾到各个层的个体所以每层中所抽取的个体数应按各层个体数在总体中所占的比例抽取,也就是各层抽取的比例都等于样本容量在总体中的比例,即抽样比 .这样抽取能使所得到的样本结构与总体结构相同,可以提高样样 本 容 量总 体 容 量本对总体的代表性在实际操作时,应先计算出抽样比 k ,再按抽样比确定每层需要抽取的个样 本 容 量总 体 容 量体数:抽样比该层个体数目 该层个体数目样 本 容 量总 体 容 量3题型一 分层抽样中的计算问题【例题 1】某校共有师生 1 600 人,其中教师有 100 人,现用分层抽样的
9、方法,从所有师生中抽取一个容量为 80 的样本,则抽取的学生数为_反思:一个总体中有 m 个个体,用分层抽样方法从中抽取一个容量为 n(n m)的样本,某层中含有 x(x m)个个体,在该层中抽取的个体数目为 y,则有 y,该等式中含有四nxm个量,已知其中任意三个量,就能求出第四个量题型二 分层抽样的应用【例题 2】某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为 12 000 人,其中持各种态度的人数如下表所示:很喜爱 喜爱 一般 不喜爱2 435 4 567 3 926 1 072电视台为了进一步了解观众的具体想法和意见,打算从中再抽取 60 人进行更为详细的调查
10、,应怎样进行抽样?分析: 人 数 多 , 差 异 大 分 层 抽 样 确 定 每 层 抽 取 比 例 在 各 层 中 分 别 抽 取合 在 一 起 得 样 本反思:在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比题型三 为整数的系统抽样问题Nn【例题 3】为了了解某地区今年高一学生期末考试的数学成绩,打算从参加考试的 15 000 名学生的数学成绩中用系统抽样的方法抽取容量为 150 的样本,请写出抽取过程分析:按照系统抽样的步骤进行反思:当总体容量 n 能被样本容量 N 整除时,分段间隔 k ;当用系
11、统抽样抽取样本Nn时,通常是将起始数 s 加上间隔 k 得到第 2 个个体编号 s k,再加 k 得到第 3 个个体编号s2 k,依次进行下去,直到获取整个样本题型四 不是整数的系统抽样问题Nn【例题 4】从某厂生产的 802 辆轿车中抽取 80 辆测试某项性能请合理选择抽样方法进行抽样,并写出抽样过程分析: 总 体 特 点 , 采 用 系 统 抽 样 - - - - - - - 间 隔 不 为 整 数 剔 除 2个 个 体系 统 抽 样 样 本反思:当总体容量不能被样本容量整除时,可以先从总体中随机剔除几个个体,但要注意的是剔除过程必须是随机的,也就是总体中的每个个体被剔除的机会均等,剔除几
12、个个体后使总体中剩余的个体能被样本容量整除,然后再按系统抽样方法抽取样本题型五 易错辨析【例题 5】要从某学校的 10 013 名学生中抽取 100 名进行健康检查,采用何种抽样方法较好,并写出过程错解:由于总体个数为 10 013,数量较大,而且都是学生,差别不大,因而应该采用系统抽样,具体过程如下:由系统抽样的步骤先分为 100 段,其中前 87 段每段 100 人,后13 段每段 101 人,再在第一段中用简单随机抽样确定起始个体编号 l;最后将l100, l200, l9 913 分别抽出得第 2,3,100 组中的编号,从而获得整个样本错因分析:上面的解法违背了系统抽样的等距均分原理
13、,抽出的个体不都是处在每段的同一位置上,前 87 段与后 13 段各自处的位置不一样,导致抽样的不公平性,所以解法是错误的,必须先要随机地剔除 13 人41 下列问题中,最适合用分层抽样抽取样本的是( )A从 10 名同学中抽取 3 人参加座谈会B某社区有 300 户家庭,其中高收入的家庭 75 户,中等收入的家庭 180 户,低收入的家庭 45 户,为了了解生活购买力的某项指标,要从中抽取一个容量为 50 户的样本C从 1 000 名工人中,抽取 100 人调查上班途中所用的时间D从生产流水线上,抽取样本检查产品质量2(2011 西安市一中月考,1)我校在检查学生作业时,抽出每班学号尾数为
14、5 的学生作业进行检查,这里运用的是( )A分层抽样 B抽签抽样C随机抽样 D系统抽样3(2012 江苏高考,2)某学校高一、高二、高三年级的学生人数之比为 334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为 50 的样本,则应从高二年级抽取_名学生4 若总体中含有 1 645 个个体,采用系统抽样的方法从中抽取容量为 35 的样本,则编号后确定编号分为_段,分段间隔 k_,每段有_个个体5 某学校有在编人员 200 人,其中行政人员 20 人,教师 140 人,后勤人员 40 人,教育部门为了解学校机构改革意见,要从中抽取一个容量为 20 的样本,试确定用何种方法抽样,并写出抽样
15、过程答案:基础知识梳理1(1)属性特征 所占比例 (2)特征 所占比例【做一做 11】B【做一做 12】A 抽样比是 ,则应从甲社区中抽取低收入家庭的90360 270 180 19户数为 360 40.192(1)简单随机抽样 分组的间隔 (3)编号 一加【做一做 21】C【做一做 22】100 10典型例题领悟【例题 1】75 抽样比为 ,该校有学生 1 6001001 500 人,则抽取的学801 600 1205生数为 1 500 75.120【例题 2】解:采用分层抽样的方法,抽样比为 .6012 000“很喜爱”的有 2 435 人,应抽取 2 435 12(人);6012 000
16、“喜爱”的有 4 567 人,应抽取 4 567 23(人);6012 000“一般”的有 3 926 人,应抽取 3 926 20(人);6012 000“不喜爱”的有 1 072 人,应抽取 1 072 5(人)6012 000因此,采用分层抽样的方法在“很喜爱” 、 “喜爱” 、 “一般” 、 “不喜爱”的人中分别抽取 12 人、23 人、20 人和 5 人【例题 3】解:(1)对全体学生的数学成绩进行编号:1,2,3,15 000.(2)分段:由于样本容量与总体容量的比是 1100,所以我们将总体平均分为 150 个部分,其中每一部分包括 100 个个体(3)在第一部分即 1 号到 1
17、00 号用简单随机抽样抽取一个号码,比如是 56.(4)以 56 作为起始数,再顺次抽取 156,256,356,14 956,这样就得到一个容量为 150 的样本【例题 4】解:由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:第一步 先从 802 辆轿车中剔除 2 辆轿车(剔除方法可用随机数法);第二步 将余下的 800 辆轿车编号为 1,2,800,并均匀分成 80 段,每段含 k10 个个体;80080第三步 从第 1 段即 1,2,10 这 10 个编号中,用简单随机抽样的方法抽取一个号(如 5)作为起始号;第四步 从 5 开始,再将编号为 15,25,7
18、95 的个体抽出,得到一个容量为 80 的样本【例题 5】正解:由于总体个数为 10 013,数量较大,而且都是学生,差别不大,因而应采用系统抽样法,具体过程如下:由系统抽样的步骤可知编号分段时,10 013100不为整数,先从总体中随机剔除 13 人,再按如下步骤操作:采用随机的方式将总体中的个体编号为 1,2,3,10 000;把总体分成 100 段,每段 100 人;10 000100在第一段中用简单随机抽样确定起始个体的编号 l;将 l100, l200, l9 900 分别抽出得到第 2,3,100 组中的各个编号,从而获得整个样本随堂练习巩固1B 2D315 根据分层抽样的特点,可
19、得高二年级学生人数占学生总人数的 ,因此在样本310中,高二年级的学生所占比例也应该为 ,故应从高二年级抽取 50 15(名)学生310 310435 47 47 因为 N1 645, n35,则编号后确定编号分为 35 段,且 k Nn47,则分段间隔 k47,每段有 47 个个体1 645355分析:因为不同部门的人对机构改革有不同意见,因此可选用分层抽样,按分层抽样的方法步骤进行即可6解:(1)将 200 人分成行政人员、教师、后勤人员三层(2)按照 的比例确定各20200 110层抽取人数:行政人员:20 2(人),教师:140 14(人),后勤人员:110 11040 4(人)(3)在各层中用简单随机抽样的方法抽取样本(4)将抽取的 20 人综合到110一起,即得到一个容量为 20 的样本