1、1第 2 课时 分层抽样导入新课 思路 1.中国共产党第十八次代表大会的代表名额原则上是按各选举单位的党组织数、党员人数进行分配的,并适当考虑前几次代表大会代表名额数等因素按照这一分配办法,各选举单位的代表名额,比十七大时都有增加另外,按惯例,中央将确定一部分已经退出领导岗位的老党员作为特邀代表出席大会这种产生代表的方法是简单随机抽样还是系统抽样?教师点出课题:分层抽样思路 2.我们已经学习了两种抽样方法:简单随机抽样和系统抽样,本节课我们学习分层抽样推进新课 Error!Error!1假设某地区有高中生 2 400 人,初中生 10 900 人,小学生 11 000 人,此地区教育部门为了了
2、解本地区中小学的近视情况及其形成原因,要从本地区的学生中抽取 1%的学生进行调查,你认为应当怎样抽取样本?2想一想为什么这样取各个学段的个体数?3请归纳分层抽样的定义4请归纳分层抽样的步骤5分层抽样时应如何分层?其适用于什么样的总体?讨论结果:1分别利用系统抽样在高中生中抽取 2 4001%24 人,在初中生中抽取 10 9001%109 人,在小学生中抽取 11 0001%110 人这种抽样方法称为分层抽样2含有个体多的层,在样本中的代表也应该多,即样本从该层中抽取的个体数也应该多这样的样本才有更好的代表性3一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数
3、量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样4分层抽样的步骤:(1)分层:按某种特征将总体分成若干部分(层);(2)按抽样比确定每层抽取个体的个数;(3)各层分别按简单随机抽样的方法抽取样本;(4)综合每层抽样,组成样本5分层抽样又称类型抽样,应用分层抽样应遵循以下要求:(1)分层时将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则,即保证样本结构与总体结构一致性(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等(3)当总体个体差异明显时,采用分层
4、抽样Error!思路 1例 某地农田分布在山地、丘陵、平原、洼地不同的地形上,要对这个地区的农作物产量进行调查,应当采用什么抽样方法?解:显然不同类型的农田之间的产量有较大差异,应当采用分层抽样的方法,对不同类型的农田按其占总数的比例来抽取样本点评:在每个层中进行抽样时,大多数情况下是采用简单随机抽样,有时也会用到其他的抽样方法,这要根据问题的需要来决定.变式训练1某公司有 1 000 名员工,其中:高层管理人员占 5%,属于高收入者;中层管理人员占 15%,属于中等收入者;一般员工占 80%,属于低收入者要对这个公司员工的收入情况进行调查,欲抽取 100 名员工,应当怎样进行抽样?2解:我们
5、可以采用分层抽样的方法,按照收入水平分成三个层:高收入者、中等收入者、低收入者可抽取 5 名高级管理人员、15 名中层管理人员、80 名一般员工,再对收入状况分别进行调查2某市有大型、中型与小型的商店共 1 500 家,它们的家数之比为 159.要调查商店的每日零售额情况,要求抽取其中的 15 家商店进行调查,应当采用怎样的抽样方法?解:在这个问题中,商店有大型、中型和小型之分,商店的每日零售额直接受到商店规模的影响,如果采用简单随机抽样的方法,可能使抽样的结果不具有代表性从题目中数据可以看出,最好是:从 100 家大型商店中抽出 1 个代表,从 500 家中型商店中抽出 5个代表,从 900
6、 家小型商店中抽出 9 个代表因此,我们要对每个类型的商店分别进行抽样.思路 2例 1 一个单位有职工 500 人,其中不到 35 岁的有 125 人,35 岁至 49 岁的有 280 人,50 岁以上的有 95 人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取 100名职工作为样本,若职工年龄与这项指标有关,应该怎样抽取?分析:由于职工年龄与这项指标有关,所以应选取分层抽样来抽取样本解:用分层抽样来抽取样本,步骤是:(1)分层:按年龄将 150 名职工分成三层:不到 35 岁的职工;35 岁至 49 岁的职工;50 岁以上的职工(2)确定每层抽取个体的个数抽样比为 ,则在不到 3
7、5 岁的职工中抽100500 15125 25 人;在 35 岁至 49 岁的职工中抽 280 56 人;在 50 岁以上的职工中抽 9515 1519 人15(3)在各层分别按抽签法或随机数表法抽取样本(4)综合每层抽样,组成样本点评:本题主要考查分层抽样及其实施步骤如果总体中的个体有差异时,那么就用分层抽样抽取样本用分层抽样抽取样本时,要把性质、结构相同的个体组成一层.变式训练1某市的 3 个区共有高中学生 20 000 人,且 3 个区的高中学生人数之比为235,现要从所有学生中抽取一个容量为 200 的样本,调查该市高中学生的视力情况,试写出抽样过程分析:由于该市高中学生的视力有差异,
8、按 3 个区分成三层,用分层抽样来抽取样本在 3 个区分别抽取的学生人数之比也是 235,所以抽取的学生人数分别是 20040;200 60;200 100.22 3 5 32 3 5 52 3 5解:用分层抽样来抽取样本,步骤是:(1)分层:按区将 20 000 名高中生分成三层;(2)确定每层抽取个体的个数在这 3 个区抽取的学生数目分别是 40,60,100;(3)在各层分别按随机数表法抽取样本;(4)综合每层抽样,组成样本2某单位有老年人 28 人,中年人 54 人,青年人 81 人,为了调查他们的身体状况,从他们中抽取容量为 36 的样本,最适合抽取样本的方法是( )A简单随机抽样B
9、系统抽样C分层抽样D先从老年人中剔除 1 人,再用分层抽样解析:总人数为 285481163.样本容量为 36,由于总体由差异明显的三部分组成,考虑用分层抽样若按 36163 取样,无法得到整解,故考虑先剔除 1 人,抽取比例变为3616229,则中年人取 12 人,青年人取 18 人,先从老年人中剔除 1 人,老年人取 6人,组成容量为 36 的样本3答案:D例 2 某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有 40种、10 种、30 种、20 种,现从中抽取一个容量为 20 的样本进行食品安全检测若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是(
10、)A4 B5 C6 D7解析:抽样比为 ,则抽取的植物油类食品种数是 10 2,则抽2040 10 30 20 15 15取的果蔬类食品种数是 20 4.故所抽取的植物油类与果蔬类食品种数之和是 246.15答案:C点评:如果 A, B, C 三层含有的个体数目分别是 x, y, z,在 A, B, C 三层应抽取的个体数目分别是 m, n, p,那么有 x y z m n p;如果总体有 N 个个体,所抽取的样本容量为 n,某层所含个体数目为 a,在该层抽取的样本数目为 b,那么有 .nN ba变式训练1某校有学生 2 000 人,其中高三学生 500 人为了解学生的身体素质情况,采用按年级
11、分层抽样的方法,从该校学生中抽取一个 200 人的样本则样本中高三学生的人数为_解析:因为抽样比为 ,所以样本中高三学生的人数为 500 50.2002 000 110 110答案:502.甲校有 3 600 名学生,乙校有 5 400 名学生,丙校有 1 800 名学生,为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为 90 人的样本,应在这三校分别抽取学生( )A30 人,30 人,30 人 B30 人,45 人,15 人 C20 人,30 人,40 人 D30 人,50 人,10 人 解析:因抽样比是 ,故应在这三校分别抽取学生: 3 903 600 5 400 1 800
12、 1120 112060030 人, 5 40045 人, 1 80015 人1120 1120答案:BError!1某城区有农民、工人、知识分子家庭共计 2 000 户,其中农民家庭 1 800 户,工人家庭 100 户现要从中抽取容量为 40 的样本,调查家庭收入情况,则在整个抽样过程中,可以用到下列抽样方法中的( )简单随机抽样 系统抽样 分层抽样A BC D解析:由于各家庭有明显差异,所以首先应用分层抽样的方法分别从农民、工人、知识分子三类家庭中抽出若干户,即 36 户、2 户、2 户又由于农民家庭户数较多,那么在农民家庭这一层宜采用系统抽样;而工人、知识分子家庭户数较少,宜采用简单随
13、机抽样法故整个抽样过程要用到三种抽样法答案:D2某地区有 300 家商店,其中大型商店有 30 家,中型商店有 75 家,小型商店有 195家为了掌握各商店的营业情况,要从中抽取一个容量为 20 的样本若采用分层抽样的方法,抽取的中型商店数是_答案:53某校 500 名学生中,O 型血有 200 人,A 型血有 125 人,B 型血有 125 人,AB 型血有 50 人,为了研究血型与色弱的关系,需从中抽取一个容量为 20 的样本,怎样抽取样本?分析:由于研究血型与色弱的关系,按血型分层,用分层抽样抽取样本利用抽样比4确定抽取各种血型的人数解:用分层抽样抽取样本 ,即抽样比为 ,20500 2
14、50 250200 8,125 5,50 2.250 250 250故 O 型血抽 8 人,A 型血抽 5 人,B 型血抽 5 人,AB 型血抽 2 人抽样步骤:(1)确定抽样比 ;250(2)按比例分配各层所要抽取的个体数,O 型血抽 8 人,A 型血抽 5 人,B 型血抽 5 人,AB 型血抽 2 人;(3)用简单随机抽样分别在各种血型中抽取样本,直至取出容量为 20 的样本Error!某高级中学有学生 270 人,其中一年级 108 人,二、三年级各 81 人,现要利用抽样方法抽取 10 人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学
15、生按一、二、三年级依次统一编号为 1,2,270;使用系统抽样时,将学生统一随机编号为 1,2,270,并将整个编号依次分为 10 段如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,250;5,9,100,107,111,121,180,195,200,265;11,38,65,92,119,146,173,200,227,254;30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是( )A都不能为系统抽样 B都不能为分层抽样C都可能为系统抽样 D都可能为分层抽样解析:如果按分层抽样抽取时,在一年
16、级抽取 108 4 人,在二、三年级各抽取1027081 3 人,则在号码段 1,2,108 中抽取 4 个号码,在号码段 109,110,18910270中抽取 3 个号码,在号码段 190,191,270 中抽取 3 个号码,符合,于是可能是分层抽样,因为不符合,所以不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是“等距”的,符合,不符合因此都可能为系统抽样,都不能为系统抽样答案:D点评:根据样本的号码判断抽样方法时,要紧扣三类抽样方法的特征利用简单随机抽样抽取出的样本号码没有规律性;利用分层抽样抽取出的样本号码有规律性,即在每一层抽取的号码个数 m 等于该层所含个体数目与抽样比的积
17、,并且应该恰有 m 个号码在该层的号码段内;利用系统抽样抽取出的样本号码也有规律性,其号码按从小到大的顺序排列,则所抽取的号码是: l, l k, l2 k, l( n1) k.其中, n 为样本容量, l 是第一组中的号码, k 为分段间隔 .总 体 容 量样 本 容 量Error!本节课学习了分层抽样的定义及其实施步骤Error!习题 12 1,3. 设 计 感 想本节课重视从学生的生活经验和已有知识中学习数学和理解数学首先为教科书内容选择生活背景,让学生体验数学问题来源于生活实际;其次,大胆调用学生熟知的生活经验,使数学学习变得易于理解掌握;最后,善于联系生活实际有机改编教科书习题,让学
18、生在实践活动中理解掌握知识,变“学了做”为“做中学” 5备 课 资 料抽样调查及其主要方法抽样调查可以分为两类,即概率抽样和非概率抽样概率抽样是按照随机原则进行抽样,不加主观因素,组成总体的每个单位都有被抽中的概率(非零概率),可以避免样本出现偏差,样本对总体有很强的代表性非概率抽样是按主观意向进行的抽样(非随机的),组成总体的很大部分单位没有被抽中的机会(零概率),使调查很容易出现倾向性偏差现在被广泛应用的抽样调查是概率抽样因此,现在的抽样调查是指概率抽样,其定义为:抽样调查,又称抽样推断,是一种重要的、科学的非全面调查方法它根据调查的目的和任务要求,按照随机原则,从若干单位组成的事物总体中
19、,抽取部分样本单位来进行调查、观察,用所得到的调查标志的数据来推断总体抽样调查按抽样的组织形式划分,有以下几种主要方法:(1)简单随机抽样(也叫纯随机抽样,SPS 抽样)也就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此之间无一定的关联性和排斥性简单随机抽样是其他各种抽样形式的基础通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法(2)等距抽样(也叫机械抽样或系统抽样,SYS 抽样)是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位特点是:抽
20、出的单位在总体中是均匀分布的,而且抽取的样本可少于纯随机抽样等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式(3)类型抽样(也叫分层抽样,STR 抽样)就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况(4)整群抽样(又称集团抽样)就是从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查样本特点是:调查单位比较集中,调
21、查工作的组织和进行比较方便但调查单位在总体中的分布不均匀,准确性要差些因此,在群间差异性不大或者不适宜单个地抽选调查样本的情况下,可采用这种方式(5)多阶抽样(又称多级抽样)就是将调查分成两个或两个以上的阶段进行抽样第一阶段先将总体按照一定的规范分成若干抽样单位,称之为一级抽样单位(或称初级抽样单位),再把抽中的一级抽样单位分成若干更小的二级抽样单位,从抽中的二级抽样单位再分三级抽样单位,等等,这样就形成一个多阶段抽样过程特点是,在对超大而又复杂总体调查的抽样中实施和管理更加方便,且不需要对每级抽样单位编制完全的抽样框(6)二重抽样(又称两相抽样)就是先抽取一个容量比较大的初始样本,用初始样本
22、估计总体的某些参数或某些必要的信息作为分层的比例或再次抽样的标志,然后将抽出的初始大样本作为“总体” ,从中抽取容量合适的样本进行比较详细的调查特点是,适合用于对总体信息了解比较少的调查(7)比率抽样(PPS 抽样)就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样特点是,总体中含量大的部分被抽中的概率也大,可以提高样本的代表性在抽样调查的实际工作中,经常是要将几种抽样方法结合起来应用比如,城市居民的收支调查,是将二重抽样、多阶段抽样、分层抽样、机械抽样等多种方法结合起来使用在现实的商业性的市场调查中也有非概率抽样的应用如,配额抽样、随意抽样、志愿者抽样、判断抽样、修正的概率抽样和滚雪球抽样等,由于这些抽样方法容易出现偏差,所以只在对共性特别强的群体的商业性调查中应用