1、成才之路 数学,路漫漫其修远兮 吾将上下而求索,人教B版 必修3,统 计,第二章,章末归纳总结,第二章,统计学是研究如何收集、整理、分析数据的科学在现实客观世界中,需要认识的现象无穷无尽,认识现象的第一步就是通过观察或实验收集大量数据取得观测资料,然后通过分析这些资料来认识它,从而为人们正确的决策提供依据如何取得有代表性的观测资料并正确的加以分析、评价是正确认识未知现象的基础,是数理统计学要研究的基本问题,本章中主要介绍了获取数据的最基本的方法及从样本数据中提取信息的基本统计方法(包括用样本分布估计总体分布,用样本数字特征估计总体数字特征和线性回归分析),学习本章要深刻领会用样本估计总体分布及
2、其特征的思想,体会统计思维与确定性思维的差异1根据简单随机抽样、系统抽样、分层抽样这三种抽样方法的共同点、适用范围和各自特点,恰当选取抽样方法从总体中抽取样本,在选取样本时,要按照各种抽样方法的步骤抽取个体三种抽样方法的比较如下表:,三种抽样方法比较,2.用样本估计总体一般分成两种,一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征(如平均数、标准差等)估计总体的数字特征所谓第一种就是利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体估计直方图能够很容易地表示大量数据,非常直观地表明分布的特征,使我们能够看到在分布表中看不清楚的数据模式,
3、这样根据样本的频率分布,我们可以大致估计出总体的分布,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便所谓第二种就是为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计,3分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,具有线性相关关系的可利用最小二
4、乘法求出回归直线方程把样本数据表示的点在直角坐标系中作出,构成的图叫做散点图从散点图上,我们可以分析出两个变量是否存在相关关系:如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,直线方程叫做回归直线方程,随机抽样的识别与计算,导学号67640553,S2给出的随机数表中是5个数一组,使用各个5位数字的前2位,从各位数字任选一个前2位小于或等于39的数作为起始号码例如,从第2行第3组数组开始,取出27作为抽取的产品的第一个代码;S3从选定的27开始向右读下去,得到下一个两位数字代码26,将它取出;继续向右读,又得到27,将它去掉;继续
5、向右读,得到39,将它取出;然后向下读,得到20、21、34、12、28、22、13,至此,10个样本号码已经取满于是所要抽取的样本号码是27、26、39、20、21、34、12、28、22、13.,导学号67640554,导学号67640555,解析S1确定七年级、八年级、九年级的被抽个体数七年级、八年级、九年级的学生数分别为:454852145,465450150,505550155.由于样本容量与总体容量的比为120.所以,样本中包含的各部分个体数应为:145207,150208,155208.S2将七年级的被抽个体数分配到七年级1班、2班、3班因为七年级1班、2班、3班的人数比为454
6、852,所以七年级1班、2班、3班的被抽个体数分别为7145452,7145482,7145523.,S3将八年级的被抽个体数分配到八年级1班、2班、3班,因为八年级1班、2班、3班的人数比为465450,所以,八年级1班、2班、3班的被抽个体数分别为8150462,8150543,8150503.S4用同样的方法将九年级的被抽个体数分配到九年级1班、2班、3班,结果分别为3、3、3人S5再用合适的方法在对应各部分抽取个体点评分层抽样的特点是充分考虑到各个层次不同代表的合理比例,大大提高了样本的代表性本题交错使用了分层抽样的方法,像这样比较复杂的问题,在解答的时候可以将问题分成几个部分,再对各
7、个部分具体解决.,用样本分布估计总体分布,导学号67640556,解析(1)样本的频率分布表如下:,导学号67640557,利用两个变量的相关性研究线性回归问题,导学号67640558,数学思想方法,导学号67640559,解析(1)100535301020,所以处填20;1000.0500.2000.3000.1000.35,所以处填0.35.(2)补全频率分布直方图如图所示500名志愿者中,年龄在30,35)的人数为0.35500175.,导学号67640560,分析程序框图的功能是求A2A3A6的值,问题转化为从频率分布直方图中求出A2、A3、A6的值读懂频率分布直方图和程序框图是解题的
8、关键,解析解法一:先求样本容量x,再分别计算A2、A3、A6.在频率分布直方图中,小长方形的高是频率/组距,所以A14 0000.000 8500x,解得x10 000.从而,A20.000 450010 0002 000,A30.000 350010 0001500,A40.000 2550010 0001250,A50.000 1550010 000750,A60.000 150010 000500,所以,A2A3A66 000.,解法二:先求样本容量x,再计算A2A3A6.在频率分布直方图中,小长方形的高是频率/组距,所以A14 0000.000 8500x,解得x10 000.所以,A2A3A610 000A110 0004 0006 000.答案6 000,