1、22用样本估计总体22.1用样本的频率分布估计总体的分布,学习导航学习目标,重点难点学会列频率分布表、画频率分布直方图、频率分布折线图、茎叶图,会用样本的频率估计总体的分布难点:对几种表示频率分布图表的理解和应用.,1频率分布表和频率分布直方图(1)频率分布表编制的方法步骤:,最大数,最小数,组距、组数,分点,(2)频率分布直方图,做一做1.若在频率分布直方图中一个小矩形的面积为0.4,高为0.5,则组距为_答案:0.8,想一想“做一做”中三个数据0.4、0.5、0.8,哪一个表示该组频率其中0.5表示什么意义?,2频率分布折线图、总体密度曲线(1)频率分布折线图的定义把频率分布直方图_用线段
2、连接起来,就得到频率分布折线图.(2)总体密度曲线,各个长方形上边的中点,如果样本容量_,分组的组距_,则频率分布直方图实际上越来越接近于_,它可以用一条光滑曲线yf(x)来描绘,这条光滑曲线就叫做总体密度曲线,不断增大,不断缩小,总体的分布,做一做2.判断下列说法的正误频率分布折线图与总体密度曲线无关()频率分布折线图就是总体密度曲线()样本容量很大的频率分布折线图就是总体密度曲线()如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线(),解析:因为如果样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限近于一条光滑的曲线这条光滑的曲线就是总体
3、的密度曲线,所以频率分布折线图与总体密度曲线有关但又不是,只是无限接近答案:,3茎叶图,做一做3甲、乙两个班级各随机选出15名同学进行随堂测验,成绩的茎叶图如图所示,则甲、乙两组的最高成绩各是_,_.解析:由茎叶图中可以看出甲的最高成绩为96,乙的最高成绩为92.答案:9692,题型一频率分布直方图和频率分布折线图的绘制 美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,,当时69岁下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,
4、54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48,(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图;(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况,【解】(1)以4为组距,列表如下:,(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50,60)岁之间,45岁以下及65岁以上就任的总统所占的比例相对较小,2组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规
5、律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为512组,一般样本容量越大,所分组数越多,3在绘制频率分布直方图的过程中,易出现如下错误:将直方图中的纵轴标作频率,这一点一定要与条形图区分开,变式训练1对某班50人进行智力测验,其得分如下:48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,55,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,
6、58(1)这次测验成绩的最大值和最小值分别是多少?,(2)将30,100平分成7个小区间,试画出该班学生智力测验成绩的频数分布图;(3)分析这个频数分布图,你能得出什么结论?,解:(1)这次测验成绩中的最小值为32,最大值为97;(2)7个区间分别为30,40),40,50),50,60),60,70),70,80),80,90),90,100.每一小区间内的长度是10,统计出各小区间内的数据频数,列表如下:,频数分布图如下图:,(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右基本对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布,题
7、型二频率分布直方图的应用 (本题满分12分)从2012年起,山东省高考将加试体育,为此某校在训练学生体能时抽取部分学生进行一分钟跳绳测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形的面积之比为24171593,第二小组的频数为12.,(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110)为达标,则该校全体高一年级学生的达标率是多少?,名师微博解题中要有必要的文字说明.,名师微博小矩形的面积代表频率,你记得吗?,名师微博达标率是百分数不能忘乘100%.,【名师点评】(1)频率反映了样本落在某一区间的可能性大小(2)频率分布直方图中,用面积表
8、示频率(3)在频率分布直方图中,所有小长方形的面积之和等于1.,变式训练2下图是容量为100的样本频率分布直方图,试根据图形中的数据填空:,(1)样本数据落在6,10)内的频率是_,频数是_;(2)样本数据落在2,6),10,14),14,18内的频率分别是_,_,_.解析:每组频率长方形的高组距,每组频数样本容量该组频率,所以6,10)的频率:0.0840.32,,频数:1000.3232.同样2,6),10,14)的频率分别为0.0240.08,0.0940.36.各组的频率之和为1,所以14,18内的频率为1减去前三组的频率,即10.320.080.360.24.答案:(1)0.3232
9、(2)0.080.360.24,题型三茎叶图的画法及应用 某中学高一(2)班甲、乙两名同学自上高中以来每场数学考试成绩情况如下:甲的得分:95,81,91,86,89,71,65,76,75,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,102,101,97.,画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较【思路点拨】用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两位同学每场数学考试成绩的个位数作茎叶图先确定中间数取数据的哪几位,填写数据时边读边填比较时从数据分布的对称性、中位数、稳定性等几个方面来比较,【解
10、】甲、乙两人数学成绩的茎叶图,如图所示,从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是88.因此乙同学发挥比较稳定,总体得分情况比甲同学好,【名师点评】绘制茎叶图关键是分清茎和叶一般地,数据是两位数时,十位上数字为“茎”,个位上数字为“叶”;如果是小数时,通常把整数部分作为“茎”,小数部分作为“叶”解题时要根据数据特点合理选择“茎”和“叶”,变式训练3在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27
11、,17.在某一报纸的一篇文章中,每个句子中所含的字数如下:,27,37,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据比较,得到什么结论?,解:(1)茎叶图如图:,(2)电脑杂志上的文章中每个句子的字数集中在1030之间,中位数为22.5;而报纸上的文章中每个句子的字数集中在2040之间,中位数为27.5.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少,说明电脑杂志作为科普读物需要通俗易懂、简明,1甲、乙两棉农连续5年棉花产量(单位:千克/亩)的统计
12、数据用茎叶图表示如图所示:则平均产量较高与产量较稳定的分别是(),A棉农甲;棉农甲B棉农甲;棉农乙C棉农乙;棉农甲 D棉农乙;棉农乙解析:选B.甲棉农的棉花产量较多集中在70以上,而乙产量较多集中在70以下,故棉农甲平均产量较高又因为甲产量较分散,乙产量较集中,故乙产量较稳定,2(2011高考浙江卷)某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是_,解析:考试成绩小于60分的学生频率为0.002100.006100
13、.012100.2,所以成绩小于60分的学生数为0.23000600.答案:600,3某教师出了一份共3道题的测试卷,每题1分,全班得3分、2分、1分和0分的学生所占比例分为30%、50%、10%和10%.(1)若全班共10人,则平均分是多少?(2)若全班共20人,则平均分是多少?(3)若该班人数未知,能求出该班的平均分吗?,解:各数据频率确定时,平均数不受样本容量的影响平均分330%250%110%2(分),即全班人数为10人、20人或该班人数未知时该班的平均分都为2分,方法技巧1当总体很大或不便获得时,可以用样本的频率分布估计总体的频率分布,如列频率分布表,绘制频率分布直方图以及频率分布折线图等;而当样本数据较少时,则可利用茎叶图来表示数据,2频率分布表表示数据的优点是在数量表示上比较确切,缺点是不够直观、形象,分析数据分布的总体态势不太方便3频率分布折线图的优点是它反映了数据的变化趋势如果样本容量不断增大,分组的组距不断缩小,那么频率分布折线图就趋向于总体分布的密度曲线,4用茎叶图刻画数据有两个优点:一是所有的数据都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了,