1、考点一 抽样方法,考点清单,考向基础 1.简单随机抽样是抽样的基础方法,是一种等机会抽样. 2.系统抽样的最基本特征是“等距性”,一般地,每组内所抽取的号码依 据第一组抽取的号码和组距唯一确定,每组抽取的号码依次构成一个以 第一组抽取的号码m为首项,组距d为公差的等差数列an,第k组抽取的 号码ak=m+(k-1)d. 3.分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样, 抽样比= = .,考向突破 考向一 系统抽样,例1 从编号为001,002,500的500个产品中用系统抽样的方法抽取一 个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大 的编号应该为 .
2、,解析 根据系统抽样的定义可知样本的编号成等差数列,令a1=7,a2=32, 则d=25,所以7+25(n-1)500,所以n20.72.因为nN*,所以n最大取20, 则最大编号为7+2519=482.,答案 482,考向二 分层抽样 例2 某市有大型超市100家、中型超市200家、小型超市700家.为掌握 各类超市的营业情况,现按分层抽样方法抽取一个容量为80的样本,应 抽取中型超市 家.,解析 设应抽取中型超市t家,则 = ,解得t=16.,答案 16,考点二 总体分布、总体特征数的估计,考向基础 1.频率分布直方图的特征 (1)各小矩形的面积和为1. (2)纵轴的含义为频率/组距,小矩
3、形的面积=组距 =频率. (3)样本数据的平均数的估计值等于每个小矩形的面积乘其底边中点的 横坐标之和. (4)众数的估计值为最高的小矩形的底边中点的横坐标. 2.茎叶图的画法步骤:第一步:将每个数据分为茎(高位)和叶(低位)两部 分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将 各个数据的叶依次写在其茎的右(左)侧.,3.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数. (2)中位数:将数据从小到大(或从大到小)排列,若有奇数个数,则最中间 的数是中位数;若有偶数个数,则中间两数的平均数是中位数. (3)平均数: = ,反映了一组数据的平均水平.
4、 (4)标准差: s= ,反映了样本数据的离散程 度.,(5)方差:s2= (x1- )2+(x2- )2+(xn- )2 ,反映了样本数据的离散 程度. 4.有关平均数、方差的一些结论 (1)若数据x1,x2,xn的平均数为 ,那么mx1+a,mx2+a,mx3+a,mxn+a的平 均数是m +a. (2)设数据x1,x2,xn的方差为s2,则 a.s2= ( + + )-n ; b.数据x1+a,x2+a,xn+a的方差也为s2; c.数据ax1,ax2,axn的方差为a2s2.,考向突破 考向一 频率分布直方图、茎叶图,例1 (2019届江苏海门中学检测)某高校调查了200名学生每周的自
5、习 时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的 范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5), 27.5,30.根据直方图,这200名学生中每周的自习时间不少于22.5小时 的人数是 .,解析 由频率分布直方图知200名学生每周的自习时间不少于22.5小时 的频率为1-(0.02+0.10)2.5=0.7,则这200名学生中每周的自习时间不少 于22.5小时的人数为2000.7=140.,答案 140,考向二 求样本的方差 例2 (2019届江苏如皋搬经中学检测)样本中共有五个个体,其值分别 为0,1,2,3
6、,m.若该样本的平均值为1,则其方差为 .,解析 依题意得m=51-(0+1+2+3)=-1,样本方差s2= (12+02+12+22+22)= 2,即所求的样本方差为2.,答案 2,方法一 系统抽样的处理方法 1.分组的方法应依据抽取比例而定(根据定义每组抽取一个样本). 2.起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编 号便随之确定了. 3.在系统抽样中,如果总体中的个体数正好能被样本容量整除,则可用它 们的比值作为进行系统抽样的间隔;如果不能被整除,则可用简单随机 抽样的方法从总体中剔除若干个个体,其个数为总体中的个体数除以样 本容量所得的余数,然后再编号、分段,确定第
7、一段的起始点,继而确定 整个样本.,方法技巧,例1 (2019届江苏西亭高级中学检测)用系统抽样法从160名学生中抽 取容量为20的样本,将160名学生按1,2,160编号,按编号顺序平均分成 20组(18号,916号,153160号),若第16组抽出的号码为123,则第2组 中应抽出个体的号码是 .,解析 由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码 为x,则由系统抽样的法则可知,第n组抽出个体的号码应该为x+(n-1)8, 所以第16组应抽出的号码为x+(16-1)8=123,解得x=3,所以第2组中应抽 出个体的号码为3+(2-1)8=11.,答案 11,方法二 分层抽
8、样的处理方法 1.分层抽样适用于总体由差异明显的几个部分组成的情况,即各个层次 之间有明显区别,而各个层内的个体间差异较小. 2.每层中所抽取的个体数可按各层个体在总体中所占比例抽取. 3.在各个分层内抽取时我们采用简单随机抽样或系统抽样.,例2 (2018江苏南通中学高三数学练习)一汽车厂生产A,B,C三类轿车, 每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):,按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆,则z的值为 .,解析 由题意可得 = , 解得z=400. 经检验,z=400是原方程的根.,答案 400,例3 为了了解某地九年级男生的身高情况,从当地一个学校选取容量 为60的样本(60名男生的身高),分组情况如下:,(1)求出表中a,m的值; (2)画出频率分布直方图和频率分布折线图.,解析 (1)因为 =频率, 所以 =0.1,所以m=6. 所以163.5,171.5)段的人数为60-6-21-6=27, 所以a= =0.45.故a=0.45,m=6. (2)由(1)知,各组频率分别为0.1,0.35,0.45,0.1, 则 分别为0.012 5,0.043 75,0.056 25,0.012 5. 所以频率分布直方图和频率分布折线图如图.,