1、第9讲,随机抽样,1.简单随机抽样,抽签法,(1)定义:设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:_和随机数法.,2.系统抽样的步骤假设要从容量为 N 的总体中抽取容量为 n 的样本.(1)编号:先将总体的 N 个个体编号;(3)确定首个个体:在第 1 段用简单随机抽样确定第 1 个个体编号 l(lk);(4)获取样本:按照一定的规则抽取样本,通常是将 l 加上间隔 k 得到第 2 个个体编号 lk,再加 k 得到第 3 个个体编号,_,依次
2、进行下去,直到获取整个样本.,l2k,3.分层抽样,(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样;(2)分层抽样的应用范围:当总体是由差异明显的几个部分,组成时,往往选用分层抽样.,),1.在简单随机抽样中,某一个个体被抽到的可能性(A.与第几次抽样有关,第一次抽到的可能性最大B.与第几次抽样有关,第一次抽到的可能性最小C.与第几次抽样无关,每一次抽到的可能性相等D.与第几次抽样无关,与抽取几个样本有关,C,2.(由人教版必修 3P1001改编)在“世界读书日”前夕,为解某地 500
3、0 名居民某天的阅读时间,从中抽取了 200 名居民的阅读时间进行统计分析.在这个问题中,5000 名居民的阅读时间,的全体是(,),A,A.总体C.样本的容量,B.个体D.从总体中抽取的一个样本,解析:为了解 5000 名居民某天的阅读时间,从中抽取了200 名居民的阅读时间进行统计分析.样本容量为 200,每个居民的阅读时间就是一个个体,5000 名居民的阅读时间的全体是总体.,3.对一个容量为 N 的总体抽取容量为 n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,,),D,总体中每个个体被抽中的概率分别为 p1,p2,p3,则(,解析:根据随机抽样的原理可得简单
4、随机抽样、分层抽样、系统抽样都必须满足每个个体被抽到的概率相等,即 p1p2p3.故选 D.,A.p1p2p3 B.p2p3p1 C.p1p3p2 D.p1p2p3,4.(2013 年新课标)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大,在下面的抽样方法中,最合,理的抽样方法是(,),C,A.简单随机抽样C.按学段分层抽样,B.按性别分层抽样D.系统抽样,解析:由差异明显的几部分构成时,一般采用分层抽样,显然根据学段分层抽样比较科学.,考点 1,简单随机抽样,例 1:(1
5、)(2016 年福建龙岩模拟)某班有 34 名同学,座位号 记为 01,02,34,用下列的随机数表选取 5 组数作为参加青 年志愿者活动的 5 名同学的座位号.选取方法是从随机数表第 1 行的第 6 列和第 7 列数字开始,由左到右依次选取两个数字,,则选出来的第 4 个志愿者的座位号是(,),49 96 04,54 43 74,43 54 84 26 47 67,82 34 21,17 91 76,37 93 64 57 33 50,23 24 25,78 55 83,87 06 92,35 88 12,20 77 06,A.23,B.09,C.02,D.16,解析:从随机数表第 1 行的
6、第 6 列和第 7 列数字 35 开始,由左到右依次选取两个数字中小于 34 的编号依次为21,32,09,16,其中第 4 个为 16.故选 D.,答案:D,(2)设某总体是由编号为 01,02,19,20 的 20 个个体组成,利用下面的随机数表选取 6 个个体,选取方法是从随机数表第1 行的第 3 列数字开始从左到右依次选取两个数字,则选出来的第 6 个个体编号为_.,18186206,07927650,45440310,17165523,58096405,79830526,86196238,解析:由题意可得,选取的这 6 个个体分别为 18,07,17,16,09,19,故选出的第 6
7、 个个体编号为 19.答案:19,(3)(2013 年江西)总体由编号为 01,02,19,20 的 20 个个体组成.利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个,数字,则选出来的第 5 个个体的编号为(,),63148200,97286938,78163204A.08,6572 08029234 4935B.07,0702 43693623 4869C.02,01987481D.01,解析:从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字开始向右读,第一个数为 65,不符合条件,第二个数为
8、 72,不符合条件,第三个数为 08,符合条件,以下符合条件的依次为 02,14,07,01,故第 5 个数为 01.答案:D,【规律方法】简单随机抽样,也叫做纯随机抽样.就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位.简单随机抽样是其他各种抽样形式的基础.通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法.特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性.简单随机抽样常用的方法有:抽签法;随机数表法;计算机模拟法;使用统计软件直接抽取.,考点 2 系统抽样例 2:(1)雅礼中学教务处采用系统抽样方法,从学校高
9、三年级全体 1000 名学生中抽 50 名学生做学习状况问卷调查.现将1000 名学生从 1 到 1000 进行编号,求得间隔数 k20,即分50 组每组 20 人.在第一组中随机抽取一个号,如果抽到的是 17,号,那么第 8 组中应抽取的号码是(,),A.177,B.157,C.417,D.367,解析:根据系统抽样法的特点,可知抽取出的编号成首项为 17,公差为 20 的等差数列,所以第 8 组的编号是 17(81)20157.故选 B.答案:B,(2)(2015 年湖南)在一次马拉松比赛中,35 名运动员的成绩 (单位:分钟)的茎叶图如图 991,若将运动员按成绩由好到差 编为 135
10、号,再用系统抽样方法从中抽取 7 人,则其中成绩 在区间139,151上的运动员人数是 _.图 991解析:由茎叶图可知,在区间139,151的人数为 20,再由,系统抽样的性质可知人数为 20,7 35,4(人).,答案:4,(3)从 2004 名学生中选取 50 名组成参观团,若采用下面的方法选取:先用简单随机抽样从 2004 人中剔除 4 人,剩下的,2000 人再按系统抽样的方法进行,则每人入选的概率(,),A.不全相等,B.均不相等,C.都相等,且为,25 1002,D.都相等,且为,1 40,解析:注意随机抽样,每个个体被抽到的概率都一样.此题,中,每人入选的概率为,50 2004
11、,25 1002,.故选 C.,答案:C,【规律方法】当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方式叫做系统抽样.系统抽样也叫等距抽样.,例 3:(1)(2017 年江苏) 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取 60 件进行检验,则应从丙种型号的产品中抽取_件.,解析:所求人数为 60,300 1000,18.故答案为 18.,答案:18,考点 3 分层抽样,(2)(2016 年山东潍坊模拟)某高中在校
12、学生有 2000 人.为了 响应“阳光体育运动”的号召,学校开展了跑步和登山比赛活动,每人都参与而且只参与其中一项比赛,各年级参与比赛的人数情况如下表:其中 abc235,全校参与登山的人数占总人数的,2 5,.为了了解学生对本次活动的满意程度,从中抽取一个 200 人,的样本选行调查,则从高二年级参与跑步的学生中应抽取_.,答案:36,(3)已知某地区中小学生人数和近视情况分别如图 992(1) 和图 992(2).为了解该地区中小学生的近视形成原因,用分层 抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高,(2),中生近视人数分别为( )(1)图 9-9-2,A.200,20,B.
13、100,20,C.200,10,D.100,10,解析:该 地 区中小学 生总人数为 3500 2000 4500 10 000,则样本容量为 10 0002%200,其中抽取的高中生近视人数为 20002%50%20.故选 A.,答案:A,(4)(2016 年河北衡水一模)某书法社团有男生 30 名,女生20 名,从中抽取一个 5 人的样本,恰好抽到了 2 名男生和 3 名女生:该抽样一定不是系统抽样;该抽样可能是随机抽样;该抽样不可能是分层抽样;男生被抽到的概率大于女生被,抽到的概率.其中说法正确的为(,),A.,B.,C.,D.,解析:无论何种抽样,各个体被抽到的概率相同,由相关抽样类型
14、特征知正确.答案:B,【规律方法】当总体由差异明显的几个部分组成,按某种特征抽样时,将总体中的各个个体分成互不交叉的层,然后按照一定的比例,从各层中独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫做分层抽样.在三种基本抽样中,分层抽样在高考中考查得最多,主要考查比例的运算.,【互动探究】1.某校高一、高二、高三分别有学生 1600 名、1200 名、800名,为了解该校高中学生的牙齿健康状况,按各年级的学生人数进行分层抽样,若高三抽取 20 名学生,则高一、高二共抽取,的学生人数为_.,70,20 800,解析:设高一、高二抽取的人数分别为 x ,y ,则xy,xy
15、70. 16001200,2.某大学为了了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为 300 的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为 4556,则应从一年,级本科生中抽取_名学生.,60,解析:根据题意,应从一年级本科生中抽取的人数为,4 4556,30060.,难点突破,抽样方式与概率的结合,例题:惠州市某县区甲、乙、丙三所高中的高三文科学生,共有 800 人,各学校男、女生人数如下表:,已知在三所高中的所有高三文科学生中随机抽取 1 人,抽,到乙高中女生的概率为 0.2.,(1)求表中 x 的值;
16、,(2)惠州市第三次调研考试后,该县区决定从三所高中的所有高三文科学生中利用随机数表法抽取 100 人进行成绩统计分析,先将 800 人按 001,002,800 进行编号.如果从第 8 行第7 列的数开始向右读,请你依次写出最先抽取的 3 个人的编号;(下面摘取了随机数表中第 7 行至第 9 行),(3)已知 y145,z145,求丙高中高三文科学生中的女生,比男生人数多的概率.,解:(1)由,x 800,0.2,得 x160,即表中 x 的值为 160.,(2)依题意,最先抽到的 3 个人的编号依次为 165,538,629.(3)设“丙高中高三文科学生中的女生比男生人数多”为事件 A,其
17、中女生、男生数记为(y,z).由(1)知,x160,则 yz300,且 y145,z145,y,zN,所以满足条件的(y,z)有(145,155),(146,154),(147,153),(148,152),(149,151),(150,150),(151,149),(152,148),(153,147),(154,146),(155,145),共 11 组,且每组出现的可能性相同.,其中事件 A 包含的基本事件(y,z),即满足 yz 的有,(151,149),(152,148),(153,147),(154,146),(155,145),共,5 组.,所以丙高中高三文科学生中的女生比男生人
18、数多的概率,【互动探究】,3.某校高三(1)班共有 40 名学生,他们每天自主学习的时间全部在 180 分钟到 330 分钟之间,按他们学习时间的长短分 5个组统计,得到如下频率分布表:,(1)求分布表中 s,t 的值;,(2)王老师为完成一项研究,按学习时间用分层抽样的方法从这 40 名学生中抽取 20 名进行研究,应抽取多少名第一组的学生?(3)已知第一组学生中男、女生人数相同,在(2)的条件下抽取的第一组学生中,既有男生又有女生的概率是多少?,解:(1)s,8 40,0.2,t10.1s0.30.250.15.,故应抽取 2 名第一组的学生.,(3)在(2)的条件下应抽取 2 名第一组的学生,记第一组中 2,名男生为 a1,a2,2名女生为b1,b2.,按学习时间用分层抽样的方法抽取 2 名第一组的学生共有,6 种结果,列举如下:,a1a2,a1b1,a1b2,a2b1,a2b2,b1b2.,其中既有男生又有女生被抽中的有 a1b1,a1b2,a2b1,a2b2,,共 4 种结果,,