1、总体分布的估计,总体分布的估计,1、用样本去估计总体,是研究统计问题的一个基本思想,2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、分层抽样。要注意这几种抽样方法的联系与区别。,3、 初中时我们学习过样本的频率分布,包括频数、频率的概念,频率分布表和频率分布直方图的制作。,频率分布,样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的频率。,频率分布的表示形式有:样本频率分布表样本频率分布条形图样本频率分布直方图,所有数据(或数据组)的频数的分布变化规律叫做样本的频率分布。,1、抛掷硬币的大量重复试验的结果:,样本容量为72 088,频率分布条形图,频率分布表:,注意: 各长方形
2、长条的宽度要相同。,相邻长条的间距要适当。,结论:当试验次数无限增大时,两种试验结果的频率大致相等。,长方形长条的高度表示取各值的频率。,上表排除了抽样造成的误差,精确地反映了总体取值的概率分布规律这种总体取值的概率分布规律称为总体分布 ,思考:从上述例子可以看出样本频率分布与总体分布的关系?,通过样本的频率分布可以估计总体的概率分布即用样本频率分布估计总体分布,归纳1:当总体中的个体所取的不同数值较少时,其随机变量是离散型。则样本的频率分布表示形式有:,(2)频率分布条形图,(1)样本频率分布表,例.从规定尺寸为25.40mm的一堆产品中任取 100件,测得尺寸如下: 25.39 25.36
3、 25.34 25.42 25.45 25.38 25.39 25.42 25.4725.35 25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.4025.51 25.45 25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.4925.34 25.42 25.50 25.37 25.35 25.32 25.45 25.40 25.2725.43 25.54 25.39 25.45 25.43 25.40 25.43 25.
4、44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36 25.41 25.3225.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35 25.47 25.34 25.30 25.39 25.46 25.29 25.40 25.37 25.33 25.40 25.35 25.41 25.37 25.37 25.47 25.39 25.42 25.47 25.38 25.39,显然:这个例子与前面抛掷硬币的问
5、题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有: 频率分布表和频率分布直方图,一、计算最大值与最小值的差(也称极差),从而知道这组数据的变动范围。,二、决定组距与组数(将数据分组),组距:指每个小组的两个端点的距离,组距=极差/组数,列出频率分布表、画频率分布直方图的方法,极差为:25.56 25.24=0.32,三.决定分点 可以令分点比数据多1位小数,并且把第1小组的起点稍微减少一点,组数:将数据分组,当数据在100个以内时, 按数据多少分成512组,四.列出频率分布表,五.画频率分布直方图,注意:直方图的纵轴表示频率与组距的比值,,8.3,频率分布
6、的条形图和频率分布直方图的区别,两者是不同的概念;,横轴:两者表示内容相同,思考: 频率分布条形图和频率分布直方图是两个相同的概念吗? 有什么区别?,纵轴:两者表示的内容不相同,频率分布条形图的纵轴(长方形的高)表示频率,频率分布直方图的纵轴(长方形的高)表示频率与组距的比值,,其相应组距上的频率等于该组距上长方形的面积。,根据课本上给出的数据制作频率分布表和频率分布直方图,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线,总体在区间 内取值的概率,总体密度曲线,频率分布表,归纳2:当总体中的个体所取的数值较多,甚至无限时,其随机变量是是连续型。,
7、频率分布直方图,样本频率分布中,当样本容量无限增大,组距无限缩小,样本频率分布直方图接近于一条光滑曲线总体密度曲线,反映了总体分布。,归纳3:通常,我们不易知道一个总体的分布情况。在实践中,往往是是从总体中抽取一个样本,用样本的频率分布去估计总体分布:离散型总体:用样本的频率分布表和频率分布条形图连续型总体:用样本的频率分布表和频率分布直方图样本容量越大,估计就越精确。,例如:利用表13的频率分布表,可对总体分布进行估计。 从表中看到,样本数据落在25.355到25.445之间 的频率为0.59,说明产品尺寸在这个范围内的概率约为0.59.,例 为检测某种产品的质量,抽取了一个容量为30的样本
8、,检测结果为一级品5件,二级品8件,三级品13件,次品4件 (1) 列出样本的频率分布表; (2) 画出表示样本频率分布的条形图; (3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少,(3)此种产品为二级品或三级品的概率约为0.270.430.7,课堂小结,当总体中个体取不同数值很少时,我们常用样本的频率分布表及频率分布条形图去估计总体分布,总体分布排除了抽样造成的误差,精确反映了总体取值的概率分布规律,例一:在100名学生中,每人参加1个运动队,其中参加足球队者有30人,参加篮球队者有27人,参加排球队者有23人,参加乒乓球队者有20人.(1).列出学生参加各运动队的频率分布表.(2).画出表示频率分布的条形图,再见,