1、22用样本估计总体22.1用样本的频率分布估计总体分布,第二章统计,1问题导航(1)画频率分布直方图有哪些步骤?频率分布直方图的特征是什么?(2)什么是频率分布折线图?(3)什么是总体密度曲线?(4)画茎叶图的步骤有哪些?茎叶图有什么特征?,2例题导读对“P68探究”内容的导读:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断对“P68思考”内容的导读:由于约有88%的居民月均用水量都在3吨以下,因此,只要将月用水量标准制定为3吨时,就可以满足85%以上的居民每月的用水量不超过标准对“P69思考”内容的导读:
2、不同的样本得到的频率分布折线图不同;即使对于同一样本,不同的分组情况得到的频率分布折线图也不同,因此不能由样本的频率分布折线图得到准确的总体密度曲线,1频率分布表与频率分布直方图(1)频数与频率将一批数据按要求分成若干个组,数据分布在各个小组的个数,叫做该组的_,每组频数除以全体数据总数的商,叫做该组的_,频率反映数据在每组中所占比例的大小,频数,频率,(2)样本的频率分布与频率分布表相关概念根据随机所抽样本的大小,分别计算数据分布在各个小组的频率,这些频率的分布规律(取值情况),就叫做样本的_为了能直观地显示样本的频率分布情况,通常我们会将样本的分组情况、数据分布在各个小组的频数以及计算所得
3、的相应频率列在一张表中,叫做_,频率分布,样本频率分布表,求一组数据的频率分布表的步骤:a求极差b决定组距与组数c将数据分组d列频率分布表(3)用样本的频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,很难从一个个的数字中直接看出样本所包含的信息如果把这些数据形成频率分布表或频率分布直方图,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况,频率/组距,各小长方形的面积,1,总体密度曲线,3茎叶图茎叶图也是用来表示数据的一种图,其画法如下:(1)将一个或两个样本的数据分为“_”(高位)和“_”(低位)两部分(2)将最小茎和最大茎之间的数按_次序排成一列(3)将各个数据的“_
4、”按大小次序写在其茎一侧或两侧,茎,叶,大小,叶,1判断下列各题(对的打“”,错的打“”)(1)频率分布折线图与总体密度曲线无关;()(2)频率分布折线图就是总体密度曲线;()(3)样本容量很大的频率分布折线图就是总体密度曲线;()(4)如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线;()(5)频率分布直方图不能保留原始数据,而茎叶图可以保留原始数据,而且可以随时记录(),解析:总体密度曲线通常都是用样本频率分布估计出来的如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线,2一个容量为32
5、的样本,分成5组,已知第三组的频率为0.375,则另外四组的频数之和为_解析:由题意,得第三组的频数为320.37512.另外四组的频数之和为321220.3在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?解:各小长方形的面积表示样本中落在该组内的数据的频率;总和等于1.,20,1茎叶图的优缺点优点:用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示缺点:茎叶图在样本数据较多时,显得不太方便,而且茎叶图只方便记录两组的数据,两组以上的数据虽然能够记录,但是没有表示两组记录那
6、么直观、清晰,2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的茎叶图由所有样本数据构成,没有损失任何样本信息,可以在抽样的过程中随时记录(这对于教练员发现运动员现场状态特别有用);而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作3.频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,茎叶图和频率分布表极为类似,事实上,茎相当于频率分布表中的分组;茎上叶的数目相当于频率分布表中指定区间组的频数,作频率分布表、绘制频率分布直方图,互动探究本例中,画出相应的频率分布折线图解:连接频率分布直方图中各小长方形上端
7、的中点,就得到频率分布折线图如下:,解:(1)以4为组距,列表如下:,画频率分布直方图及频率分布折线图如下:(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小,茎叶图及其应用,频率分布直方图的综合应用,(2)频率分布直方图及频率分布折线图,如图,(3)由上述图表可知数据落在10.95,11.35)范围内的频率为1(0.030.09)(0.070.040.02)0.7575%,即数据落在10.95,11.35)范围内的可能性是75%.(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,则(x0.
8、41)(11.2011.15)(0.670.41)(11.2511.15),所以x0.410.13,即x0.54,从而估计数据小于11.20的可能性是54%.,方法归纳(1)用样本的频率分布估计总体的分布,是列频率分布表和画频率分布直方图的主要目的,频率分布表比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性,3(1)随机抽取100名学生,测得他们的身高(单位:cm),按照区间160,165),165,170),170,175),175,
9、180),180,185分组,得到样本身高的频率分布直方图如图,求频率分布直方图中x的值及身高在170 cm以上的学生人数;将身高在170,175),175,180),180,185区间内的学生依次记为A,B,C三个组,用分层抽样的方法从三个组中抽取6人,求从这三个组分别抽取的学生人数,(2)从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):40,50),2;50,60),3;60,70),10;70,80),15;80,90),12;90,100,8.列出样本的频率分布表;画出频率分布直方图;估计成绩在70,80)分的学生所占总体的百分比;估计成绩在70,100分的
10、学生所占总体的百分比,根据表格画出频率分布直方图如图:由频率分布表可知成绩在70,80)分的学生所占总体的百分比约是0.330%.估计成绩在70,100分的学生所占总体的百分比是0.30.240.160.770%.,(1)完成数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论解(1),(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据(3)通过观察茎叶图可以看出:品种A的亩产量比品种B高;品种A的亩产量
11、比较分散,故品种A的亩产稳定性较差感悟提高数形结合思想是中学数学很重要的方法之一,是高考的重要内容之一,是根据数的结构特征,构造出与之相应的几何图形,并利用图形的特性和规律,解决数的问题,1没有信息的损失,所有的原始数据都可以从图中得到的统计图是()A总体密度曲线 B茎叶图C频率分布折线图 D频率分布直方图解析:所有的统计图中,仅有茎叶统计图完好无损地保存着所有的数据信息,B,C,3(2014高考江苏卷)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间80,130上,其频率分布直方图如图所示,则在抽测的60株树木中,有_株树木的底部周长小于100 cm.,24,解析:底部周长在80,90)的频率为0.015100.15,底部周长在90,100)的频率为0.025100.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.150.25)6024.,本部分内容讲解结束,按ESC键退出全屏播放,