1、第二章 2.2 用样本估计总体,2.2.1 用样本的频率分布估计总体分布,学习目标,1.理解用样本的频率分布估计总体分布的方法. 2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图. 3.能够利用图形解决实际问题.,知识梳理 自主学习,题型探究 重点突破,当堂检测 自查自纠,栏目索引,知识梳理 自主学习,知识点一 频率分布表与频率分布直方图,1.用样本估计总体的两种情况 (1)用样本的 估计总体的分布. (2)用样本的 估计总体的数字特征. 2.作频率分布直方图的步骤 (1)求极差:即一组数据中 和 的差; (2)决定组距与组数:将数据分组时,组数应力求合适,以使数据的分布规律能较清
2、楚地呈现出来.这时应注意:一般样本容量越大,所分组数 ;为方便起见,组距的选择应力求“取整”;当样本容量不超过100时,按照数据的多少,通常分成 组.,频率分布,数字特征,最大值,最小值,越多,512,答案,(3)将数据分组:按 将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间. (4)列频率分布表:一般分四列:分组、频数累计、 、 ,最后一行是合计.其中频数合计应是样本容量,频率合计是 . (5)画频率分布直方图:画图时,应以横轴表示分组,纵轴表示 .其相应组距上的频率等于该组上的小长方形的面积.,即每个小长方形的面积组距 频率.,组距,频数,频率,1,频率/组,距,答案,思考 为
3、什么要对样本数据进行分组?,答 不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征.,答案,知识点二 频率分布折线图与总体密度曲线,1.频率分布折线图 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图,如图所示.,2.总体密度曲线 一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,如图所示.,知识点三 茎叶图,1.定义:顾名思义,茎是指 的一列数,叶就是从茎的 生长出来的数.一般地,对于两位数茎叶图,中间的数字
4、表示十位数,旁边的数字表示个位数. 2.几种表示频率分布的方法的优点与不足:,中间,旁边,答案,返回,题型探究 重点突破,题型一 频率分布直方图的绘制,例1 为了了解一大片经济林的生长情况,人们随机测量其中的100株树木的底部周长(单位:cm),得到如下数据: 135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 105 124 87 131 97 102 123 104 104 128 109 123 111 103 105 92 114 108 104 102 129 126 97 100 11
5、5 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108,(1)列出频率分布表;,解析答案,解 从数据中可以看出,这组数据的最大值为135,最小值为80,故极差为55,可将其分为11组,组距为5.列频率分布表如下:,(2)绘制频率分布直方
6、图、频率分布折线图.,解 画频率分布直方图、频率分布折线图如图所示.,解析答案,反思与感悟,反思与感悟,2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为512组,一般样本容量越大,所分组数越多.,跟踪训练1 美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄: 57,61,57,
7、57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48 (1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;,解析答案,解 以4为组距,列表如下:,(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.,解 从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.,解析答案,题型二 频率分布直方图的应用,例2
8、 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为24171593,第二小组的频数为12.,(1)第二小组的频率是多少?样本容量是多少?,解 频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,,解析答案,(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?,解析答案,反思与感悟,反思与感悟,1.频率分布直方图的性质: (1)因为小矩形的面积组距 频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小
9、组内的频率大小. (2)在频率分布直方图中,各小矩形的面积之和等于1. (3) 样本容量. 2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.,跟踪训练2 如图所示是总体的一个样本频率分布直方图,且在15,18)内频数为8. (1)求样本在15,18)内的频率; (2)求样本容量; (3)若在12,15)内的小矩形面积为0.06,求在18,33)内的频数.,解析答案,解 由样本频率分布直方图可知组距为3.,(3)在12,15)内的小矩形面积为0.06, 故样本在12,15)内的频率为0.06, 故样本在15,3
10、3)内的频数为50(10.06)47, 又在15,18)内频数为8, 故在18,33)内的频数为47839.,题型三 茎叶图及其应用,例3 某中学甲、乙两名同学最近几次的数学考试成绩情况如下: 甲的得分:95,81,75,89,71,65,76,88,94,110,107; 乙的得分:83,86,93,99,88,103,98,114,98,79,101. 画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.,解析答案,反思与感悟,解 甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98分; 甲同学的得分情况除一个特殊得分外,也大致对称
11、,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段. 因此乙同学发挥比较稳定,总体得分情况比甲同学好.,反思与感悟,1.画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、稳定性等几方面来比较. 2.绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.,跟踪训练3 如图茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲
12、组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( ),A.2,5 B.5,5 C.5,8 D.8,8,解析 由于甲组数据的中位数为1510x,x5.,y8,故选C.,C,解析答案,频率分布直方图的应用,易错点,例4 为了解某地居民的月收入情况,一个社会调查机构调查了20 000 人,并根据所得数据画出样本的频率分布直方图如图所示(最后一组包含两端值,其他组包含最小值,不包含最大值).现按月收入分层,用分层抽样的方法在这20 000 人中抽出200 人进一步调查,则月收入在 1 500,2 000)(单位:元)的应抽取_人.,分析 首先求出频率,再利用频数样本容量频率求解.
13、,解析答案与解后反思,分析,返回,解析 月收入在1 500,2 000)的频率为1(0.000 20.000 520.000 30.000 1)5000.2,故应抽取2000.240(人). 答案 40,解后反思 在频率分布直方图中,矩形的面积 组距频率,各矩形表示的频率之和为1.此外,解题时常用到频数样本容量频率.,返回,当堂检测,1,2,3,4,5,1.下列关于样本频率分布折线图与总体密度曲线的关系的说法中,正确的是( ) A.频率分布折线图与总体密度曲线无关 B.频率分布折线图就是总体密度曲线 C.样本容量很大的频率分布折线图就是总体密度曲线 D.如果样本容量无限增大,分组的组距无限减小
14、,那么频率分布折线图就会无限接近于总体密度曲线,解析答案,1,2,3,4,5,解析,答案 D,1,2,3,4,5,2.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0.125,则n的值为( ) A.640 B.320 C.240 D.160,B,解析答案,1,2,3,4,5,3某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30,样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ),A56
15、 B60 C120 D140,解析答案,1,2,3,4,5,解析 设所求人数为N,则N2.5(0.160.080.04)200140,故选D. 答案 D,1,2,3,4,5,4.已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为0.2的范围是( ) A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5,解析 由题意知,共20个数据,频率为0.2,在此范围内的数据有200.24个, 只有在11.513.5范围内有4个数据:13,12,12,12,故选D.,D,解析答案,1,2,3,4,5,5.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是_,_.,解析 甲组数据为:28,31,39,42,45,55,57,58,66,中位数为45. 乙组数据为:29,34,35,42,46,48,53,55,67,中位数为46.,45,46,解析答案,课堂小结,返回,1.总体分布指的是总体取值的频率分布规律,由于总体分布不易统计,因此我们往往用样本的频率分布去估计总体的分布. 2.总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.,本课结束,