1、用样本的频率分布估计总体分布,我国的缺水情况,我国是世界上严重缺水的国家之一。,如何节约用水?,市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费,那么该如何比较合理的确定出这个标a?,为了确定一个比较合理的标准a,必须先了解全市居民的日常用水量的分布情况。通过抽样调查了解居民的用水情况。,通过抽样我们得到了100户居民的某年的月平均用水量,显示了样本数据落在各个小组的比例大小!,频率分布表,0,0.5),0.5,1),1,1.5),1.5,2),2,2.5),2.5,3),3,3.5),3.5,4)
2、,4,4.5,合计,4,8,15,22,25,14,6,4,2,100,频数,分组,频率,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,1.00,频率分布直方图,1、显示了样本数据落在各个小组的比例大小。2、居民用水量的分布呈两边低,中间高的“山峰状”,而且是“单峰”的。且有一定的对称性。,1、每一区间上面矩形的面积等于该组的频率。2、各个矩形的总面积和为1!这与频率和为1相一致。3、易于估计任意区间的频率分布。,频率分布表和频率分布直方图在带我们许多新的信息的同时,也丢失了一些信息,如原始数据不能在分布表和直方图中很好地体现出来。,希望使85%以上
3、的居民每月的用水量不超出标准a,你能提出合理的建议吗?大约88%的居民的用水量在3t以下,所以3t是一个可以考虑的标准。,所得到的结论的统计意义,3t这个标准一定能保证85%以上的居民用水不超标吗?不一定!原因1、样本只是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。原因2、明年的用水情况与今年不可能完全一样,但应该大致一样。,所得到的结论的统计意义,一般的,统计得到的结果,是对于总体较为合理的估计或预测,但其误差应该控制在合理的范围之内。也正因为这样,统计结果的好坏,往往需要进一步的评价,或通过理论方法的检验,或通过实际应用的检验。 思考:有其他a值的确定方法吗?
4、应用统计解决问题的方法不唯一!,直方图作法的讨论,为了更加细致地分析样本的频率分布以估计总体的分布,组数是不是越多越好?,影响组数与组距的因素,因素1:样本容量的大小;因素2:原始数据的精细程度;当样本容量不超过100时,常分成512组。这是由统计经验获得的。,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。,随着样本容量的增加,原始数据的准确度增加,频率分布折线图会越来越接近一条光滑的曲线。统计中称这条光滑的曲线为总体密度曲线。,总结,我们如何确定用水量标准a的大小的?1、通过合理抽样得到样本;2、通过频率分布表、频率分布直方图来分析样本的频率分布,并用样本的频率分布来估计总体的分布;3、估计得到的结果是一个具有统计意义的结果,需要进一步评价。,练习,某个容量为100的样本的频率分布直方图如右,则在区间4,5)上的数据的频数为 ,