收藏 分享(赏)

2.2.1用样本的频率分布估计总体分布.ppt

上传人:s36f12 文档编号:6923862 上传时间:2019-04-27 格式:PPT 页数:37 大小:795.50KB
下载 相关 举报
2.2.1用样本的频率分布估计总体分布.ppt_第1页
第1页 / 共37页
2.2.1用样本的频率分布估计总体分布.ppt_第2页
第2页 / 共37页
2.2.1用样本的频率分布估计总体分布.ppt_第3页
第3页 / 共37页
2.2.1用样本的频率分布估计总体分布.ppt_第4页
第4页 / 共37页
2.2.1用样本的频率分布估计总体分布.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

1、2.2.1 用样本的频率分布估计总体的分布(一),复习回顾,1、什么是简单随机抽样?什么样的总体适宜简单随机抽样?,2、什么是系统抽样?什么样的总体适宜 系统抽样?,3、什么是分层抽样?什么样的总体适宜分层抽样?,抽样是统计的第一步,接下来就要对样本进行分析,4.求100个数据的最大值的算法,S1 把这100个数据命名为A(1)、A(2)、A(3)、A(100); S2 设变量x=A(1); S3 把A(i) (i=2,3,100)逐个与x比较,如果A(i)x,则x=A(i);,从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所包含的信息。如果把这些数据形成频数分布或

2、频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。,一、频率分布表与频率分布直方图:,1频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。每组的频数除以样本容量的商叫做该组的频率;频率反映每组数据在样本中所占比例的大小。,2样本的频率分布根据随机所抽样本容量的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的相应频率列在一张表中,叫做样本的频率分布表。,3用样本的频率分布估计总体的分布从一个总体得到一个包含大量数据的样

3、本时,我们很难从一个个数字中直接看出样本所包含的信息,如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体的分布,我们总是用样本的频率分布对它进行估计。,4列频率分布表的步骤,下面我们通过一个具体的实例来阐述这一方法。,某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需定期对产品进行检测,下面的数据是一次抽样中的100件钢管的内径尺寸:,最大值,最小值,列频率分布表的方法步骤:,求极差(也称全距,即一组数据中最大值与最小值的差):计算极差时,需要找出这组数据的最大值和最

4、小值,当数据很多时,可借助算法(最大值)引例4:,运用上面的算法得出这组样本数据的最大值是25.56,用类似的算法可以得出最小值是25.24它们的差为 25.5625.24= 0.32,所以极差等于0.32mm.,决定组距与组数,样本数据有100个,由上面算得极差为0.32,取组距为0.03,,注意:为方便起见,组距的选择应力求“取整”,如果极差不利于分组( 如不能被组数整除)要适当增大极差,如在左、右两端各增加适当范围(尽量使两端增加的量相同).,决定分点,将数据分组,将第1组的起点定为25.235,以组距为0.03将数据分组时,可以分成以下11组: 25.235,25.265),25.26

5、5,26.295), , 25.535,25.565.,分组时,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,当然也可以采用其他分组方法。,登记频数,计算频率,列出频率分布表,频率分布表:, 绘制频率分布直方图,利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称频率分布直方图。 下面仍以上例中的数据加以说明。,(1)频率分布直方图的绘制方法与步骤 S1 先制作频率分布表,然后作直角坐标系,以横轴表示产品内径尺寸,纵轴表示频率/组距.,S2 把横轴分成若干段,每一段对应一个组的组距,即在横轴上标上25.235,25.265, , 25.565表示的点; S3 在上面

6、标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的频率/组距,每个矩形的面积恰好是该组的频率。 这些矩形就构成了频率分布直方图。,(2)有关问题的理解, 因为小矩形的面积=组距频率/组距=频率,所以各小矩形的面积表示相应各组的频率。这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小。,在频率分布直方图中,各小矩形的面积之和等于1.,同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的图的形状也会不同。不同的形状给人的印象也不同,这种印象有时会影响我们对总体的判断。,同一个总体,由于抽样的随机性,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布一

7、般会与前一个样本频率分布有所不同。但是,它们都可以近似地看作总体的分布。,上例中,如果规定,钢管内径的尺寸在区间25.32525.475内为优等品,我们可依据抽样分析统计出产品中优等品的比例,也就是它的频率。从上表或上图容易看出,这个频率值等于0.12+0.18+0.25+0.16 +0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品。工厂可以根据质量规范,看看是否达到优等品率的要求,如果没有达到,就需要进一步分析原因,解决问题。,频率分布直方图的特点,从频率分布直方图可以清楚的看出数据分布的总体态势。但是从直方图本身得不出原始的数据内容。所以,把数据表示成直方图后,原有的具体

8、数据信息就被抹掉了。,如右图,我们连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.,一般的,随着样本容量的增加,作图时组数也相应的变大,相应的频率分布折线图会越来越接近一条光滑曲线总体密度曲线.,总体密度曲线反映了总体在各个范围内取值的百分比,它比频率分布直方图提供更加精细的信息。,例如:图中阴影部分的面积就表示总体在a ,b内的百分比。,注意点:由于样本是随机的,不同的样本得到的频率分布折线图不同;即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是随着样本的容量和分组情况的变化而变化的,因此不能由样本的频率分布折线图得到准确的总体密度曲线。,除了上面

9、的几种处理方式外,我们还有一种用来表示数据的图茎叶图,例 某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下: 甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50。 乙的得分:8,13,14,16,23,26,28,33,38,39,51。上述的数据可以用下图来表示,中间数字表示得分的十位数,两边数字分别表示两个人各场比赛得分的个位数.,0 1 2 3 4 5,8 346 368 3891,52 54 976611 94 0,甲,乙,通过此图即可看出甲运动员的得分大致对称,发挥比较稳定!,用茎叶图表示有两个突出的优点:,但茎叶图只能表示两位的整数,虽然可以

10、表示两个人的比赛结果(或两个以上的记录),但没有直方图那么直观、清晰。,2.茎叶图可以在比赛时随时记录,方便记录与表示,1.从统计图上没有信息的损失,所有的信息都可以从这个茎叶图中得到,例1. 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高的样本,数据如下(单位:cm)。试作出该样本的频率分布表。,解:最大值=180,最小值=151,极差=29,决定分为10组;则需将全距调整为30,组距为3,既每个小区间的长度为3,组距=全距/组数。可取区间150.5, 180.5,频率分布直方图为:,练习1. 一个容量为20的样本数据,数据的分组及各组的频数如下: (10,20)

11、,2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.则样本在区间(,50)上的频率为 ( )A0.5 B0.7 C0.25 D0.05,B,2. 从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下:(单位:分)40,50),2;50,0),3;60,70),10;70,80),15;80,90),12;90,100),8; (1)列出样本的频率分布表(含累计频率); (2)画出频率分布直方图; (3)估计成绩在60,90)分的学生比例; (4)估计成绩在85分以下的学生比例。,解:(1)频率分布表如下:,(2)频率分布直方图

12、如下:,(3)成绩在60,90)的学生比例即为学生成绩在60,90)的频率,0.2+0.3+0.24 =0.74.,(4)成绩在85分以下的学生比例即为学生成绩不足85分的频率,设相应频率为b,,由 ,故b=0.72,估计成绩在85分以下的学生约占0.72.,1.求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1,2.决定组距与组数(将数据分组),3.将数据分组(8.2取整,分为9组),小结:画频率分布直方图的步骤,4.列出频率分布表.(学生填写频率/组距一栏),5.画出频率分布直方图,组距:指每个小组的两个端点的距离 , 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组.,小结:,频率分布直方图,应用,1.求极差,2.决定组距与组数,3.将数据分组,4.列频率分布表,5.画频率分布直方图,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 社会民生

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报