1、章末总结,网络建构,知识辨析,判断下列说法是否正确.(请在括号中填“”或“”) 1.抽签法和随机数法都是不放回抽样.( ) 2.抽签法抽签时,先抽签的人占便宜.( ) 3.利用随机数表抽样时,开始位置和读数方向可以任意选择.( ) 4.分层抽样中,为确保公平性,在每层都应用同一抽样方法.( ) 5.频率分布直方图中每个小长方形的面积等于相应组的频率,各个小长方形面积之和小于1.( ) 6.从总体中抽取一个样本,用样本的分布估计总体的分布,样本容量越小估计越准确.( ) 7.在样本数据中,频率分布最大值所对应的样本数据是众数.( ),主题串讲 方法提炼总结升华,一、抽样方法的应用 【典例1】 如
2、图是某市高中男生体重的样本频率分布直方图,已知图中从左到右的前3个小组的频率之比为123,第2个小组的频数为100,若按照分层抽样的方法再从各个小组抽取一个容量为16的样本,则各个小组依次抽取的人数为 .,答案:2,4,6,3,1,规律方法 三种抽样方法中每个个体被抽中的机会均等、系统抽样抽取的号码成等差数列,公差为间隔.分层抽样在各层中抽取的数目取决于抽样比,即各层抽取数目=抽样比各层个体总数.,二、用样本的频率分布估计总体分布 【典例2】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩
3、(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频数分布直方图,解答下列问题: (1)填充频率分布表的空格(将答案直接填在表格内),解:(1),(2)补全频数分布直方图,解:(2)频数分布直方图如图所示:,(3)学校决定成绩在75.585.5分的学生为二等奖,问该校获得二等奖的学生约为多少人?,规律方法 频率分布直方图中,各个矩形的面积为对应数据组的频率且所有矩形的面积和为1.,即时训练2-1:我校高三年级进行了一次水平测试.用系统抽样的方法抽取了50名学生的数学成绩,准备进行分析和研究.经统计成绩的分组及各组的频数如下: 40,50),2;50,60),3;60,70
4、),10;70,80),15;80,90),12;90,100,8. (1)绘制样本的频率分布表,画出频率分布直方图;,解:(1)频率分布表,频率分布直方图,(2)估计成绩在85分以下的学生比例; (3)请你根据以上信息去估计样本的众数、中位数、平均数.(精确到0.01),解:(2)成绩在85分以下的学生比例为 ( +0.3+0.2+0.06+0.04)100%=72%. (3)众数为75.00,中位数在70,80)范围内,然后由 0.00410+0.00610+0.0210+(x中-70)0.03=0.5, 解得x中76.67. 平均数为 450.04+550.06+650.2+750.3+
5、850.24+950.16=76.20.,三、用样本的数字特征估计总体 【典例3】 在一次科技知识竞赛中,两组学生的成绩如表:,已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.,解:(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.,(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好. (4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的
6、有24人, 所以乙组成绩集中在高分段的人数多,同时,乙组得满分的人数比甲组得满分的人数多6人. 从这一角度看,乙组的成绩较好.,规律方法 样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差.我们常通过样本的数字特征估计总体的数字特征.,即时训练3-1:某工厂甲、乙两个车间包装同一种产品,在自动包装传送带上每隔一小时抽一包产品,称其重量(单位:克)是否合格,分别记录抽查数据,获得重量数据茎叶图. (1)写出甲的众数和乙的中位数;,解:(1)甲的众数是111,乙的中位数是111.,(2)根据样本数据,计算甲、乙两个车间产
7、品重量的均值与方差,并说明哪个车间的产品的重量相对稳定.,四、线性回归分析 【典例4】 某研究机构对中学生记忆能力x和识图能力y进行统计分析,得到如下数据:,解:(1)设丢失的数据为m,依题意得 =5.5,解得m=5, 即丢失的数据值是5.,由于某些原因,识图能力的一个数据丢失,但已知识图能力样本平均值是5.5. (1)求丢失的数据;,(3)若某一学生记忆能力值为12,请你预测他的识图能力值.,解:(3)由(2)得,当x=12时, =0.812-0.1=9.5. 即记忆能力值为12,预测他的识图能力值是9.5.,规律方法 两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个
8、变量是否具有相关关系.若两变量具有线性相关关系代入公式求回归直线方程由直线方程预测变量,估计和预测分析实际问题.,即时训练4-1:2017年元旦前夕,某市统计局统计了该市2016年10户家庭的年收入和年饮食支出的统计资料如表:,(1)如果已知y与x是线性相关的,求回归方程;,解:(2)当x=9时, =0.179+0.81=2.34(万元). 可预测该家庭的年饮食支出约为2.34万元.,五、易错辨析 【典例5】 中秋节,相关部门对某食品厂生产的303盒中秋月饼进行质量检验,需要从中抽取10盒,请用系统抽样的方法完成对此样本的抽取.,错解:(1)将303盒月饼用随机的方式编号. (2)从总体中剔除
9、3盒月饼,将剩下的均分成10段. (3)在第一段中用简单随机抽样抽取起始号码l. (4)将编号为l,l+30,l+230,l+930的个体取出,组成样本. 纠错:在第(2)步剔除3盒月饼后没有对剩下的月饼重新用000,001, 002,299编号.,正解:(1)将303盒月饼用随机的方式编号. (2)从总体中用简单随机抽样的方式剔除3盒月饼,将剩下的月饼重新用000299编号,并等距分成10段. (3)在第一段000,001,002,029这30个编号中用简单随机抽样确定起始号码l. (4)将编号为l,l+30,l+230,l+330,l+930的个体取出,组成样本.,真题体验 真题引领感悟提
10、升,1.(2017全国卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) (A)x1,x2,xn的平均数 (B)x1,x2,xn的标准差 (C)x1,x2,xn的最大值 (D)x1,x2,xn的中位数,B,解析:标准差衡量样本的稳定程度,故选B.,C,3.(2017江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件.,答案:18,
11、4.(2017北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:20,30),30,40),80,90,并整理得到如下频率分布直方图:,解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+ 0.04)10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计 为0.4.,(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;,(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间
12、40,50)内的人数;,解:(2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)10=0.9, 分数在区间40,50)内的人数为100-1000.9-5=5. 所以总体中分数在区间40,50)内的人数估计为400 =20.,解:(3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)10100=60, 所以样本中分数不小于70的男生人数为60 =30, 所以样本中的男生人数为302=60,女生人数为100-60=40,男生和女生人数的比例为6040=32. 所以根据分层抽样原理,总体中男生和女生人数的比例估计为32.,(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.,5.(2017全国卷)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:,(1)求(xi,i)(i=1,2,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).,谢谢观赏!,