1、12.2.2 频率分布直方图与折线图学习目标 重点难点1理解用样本的频率分布估计总体分布的方法2会用频率分布表,画频率分布直方图、频率分布折线图3能够利用图形解决实际问题.重点:理解用样本的频率分布估计总体分布的方法难点:会画频率分布直方图与折线图,并会用图形解决实际问题.1频率分布表(1)频率分布表:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布我们把反映总体频率分布的表格称为频率分布表(2)制作频率分布表的步骤:(1)求全距,决定组数和组距,组距 ;(2)分组,通全 距组 数常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表预习
2、交流 1将数据的样本进行分组的目的是什么?提示:从样本的一个个数字中很难直接看出样本所包含的信息通过分组,并计算其频率,目的是通过描述样本数据分布的特征,从而估计总体的分布情况2频率分布直方图的概念及画法(1)概念:我们利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图,简称频率直方图(2)画法:先制作频率分布表,然后作直角坐标系,把横轴分成若干段,每一线段对应 1 个组的组距,然后以此线段为底作矩形,它的高等于该组的 ,即为纵轴的对应高频 率组 距度;依次作出一系列的矩形(常常为连续矩形),每个矩形的面积恰好是该组的频率这些矩形就构成了频率分布直方图预习交流 2频率分布直方图以
3、怎样的形式反映了数据落在各个小组内的频率大小?提示:以面积形式,因为矩形的面积组距 ,并且各个小矩形的面积之和等于频 率组 距1.3频率分布折线图如果将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,那么就得到频率分布折线图,简称频率折线图频率折线图的优点是它反映了数据的变化趋势如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线预习交流 3是否所有的总体都存在密度曲线?若总体存在密度曲线,那么是否都能准确画出其密度曲线?提示:并非所有的总体都存在密度曲线尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那
4、样被准确地画出来,只能用样本的频率分布对它进行估计一般说来,样本容量越大,这种估计就越精确预习交流 4(1)在用样本频率分布估计总体分布的过程中,2总体容量越大,估计越精确总体容量越小,估计越精确样本容量越大,估计越精确样本容量越小,估计越精确以上说法错误的是_(2)一个容量为 N 的样本数据,分组后组别与频数、频率如下:组别 10,20) 20,30) 30,40) 40,50) 50,60) 60,70频数 2 3 x 5 2频率 0.05 0.1则 N x_.提示:(1) (2)64一、列频率分布表为了了解九年级学生中女生的身高(单位:cm)情况,统计了同年级 50 名女生的身高数据如下
5、:145.5 149.5 149.6 151.9 153.0 153.5 153.6154.0 154.1 154.3 154.6 155.0 155.3 155.6155.7 155.8 156.1 156.2 156.5 157.0 157.1157.0 157.2 157.3 157.4 157.5 157.5 157.7157.8 158.0 158.1 158.3 158.5 158.8 158.9159.0 158.8 159.0 160.8 160.9 161.6 162.8162.9 163.0 163.0 164.2 164.9 165.1 167.0169.5根据样本列出相
6、应的频率分布表思路分析:根据题中给出的数据,先求全距,然后决定组数与组距,最后列表求解解:通过样本数据可以看出,这组数据的最大值与最小值的差为 24,可将其分成 6 组,组距为 4.从第 1 组145.5,149.5)开始,将频数累计、各组的频数、各组的频率填入表中,得频率分布表为:分组 频数累计 频数 频率145.5,149.5) 1 1 0.02149.5,153.5) 5 4 0.08153.5,157.5) 25 20 0.40157.5,161.5) 40 15 0.30161.5,165.5) 48 8 0.16165.5,169.5 50 2 0.04合计 50 1.001从某校
7、高一年级书法能力测试中抽取 100 人的成绩统计如下表,则分数为 3 分的人数的频率为_.分数 5 4 3 2 1人数 20 10 30 30 10答案:0.3解析:全体抽样人数为 100 人,其中分数为 3 分的人数为 30,故分数为 3 分的人数的频率为 0.3.301002某中学同年级 40 名男生的体重数据如下(单位:千克)61 60 59 59 59 58 58 57 57 57 57 56356 56 56 56 56 56 55 55 55 55 54 54 5454 53 53 52 52 52 52 52 51 51 51 51 5049 48根据该样本,列出相应的频率分布表
8、解:频率分布表如下:分组 频数累计 频数 频率47.5,49.5) 2 2 0.0549.5,51.5) 7 5 0.12551.5,53.5) 14 7 0.17553.5,55.5) 22 8 0.2055.5,57.5) 33 11 0.27557.5,59.5) 38 5 0.12559.5,61.5 40 2 0.05合计 40 1.00列频率分布表的注意事项:(1)计算全距,需要找出这组数据的最大值和最小值当数据很多时,可选一个数当参照;(2)将一批数据分组,目的是要描述数据的分布规律,要根据数据多少来确定分组数目一般来说,数据越多,分组越多;(3)将数据分组,决定分点时,一般使分
9、点比数据多一位小数,并且把第一组的起点稍微减小一点;(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数二、绘制频率分布直方图、折线图美国历届总统中,就任时年纪最小的是罗斯福,他于 1901 年就任,当时年仅 42 岁;就任时年纪最大的是里根,他于 1981 年就任,当时 69 岁下面按时间顺序(从 1789 年的华盛顿到 2008 年的奥巴马,共 44 任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,5
10、6,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,47(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况思路分析:本题主要考查列出频率分布表、画出频率分布直方图、折线图的方法和步骤在画频率分布直方图的过程中,一定要合理分组,确定恰当的组距,严格按步骤画出频率分布直方图解:(1)以 4 为组距,列表如下:分组 频数累计 频数 频率41.5,45.5) 2 2 0.045 545.5,49.5) 9 7 0.159 149.5,53.5) 17 8 0.181 853.5,57
11、.5) 33 16 0.363 657.5,61.5) 38 5 0.113 661.5,65.5) 42 4 0.090 965.5,69.5 44 2 0.045 5合计 44 1.004(2)从频率分布表中可以看出,将近 60%的美国总统就任时的年龄在 50 岁至 60 岁之间,45 岁以下以及 65 岁以上就任的总统所占的比例相对较小1某棉纺厂为了解一批棉花的质量,从中随机抽测了 100 根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间5,40中,其频率分布直方图如图所示,则在抽测的 100 根中,有_根棉花纤维的长度小于 20 mm.答案:30解析:由频率分布
12、直方图可知小于 20 mm 的频率是(0.010.010.04)50.3,故小于 20 mm 的棉花纤维的根数是 0.310030.2某个容量为 100 的样本的频率分布直方图如图所示,则在区间4,5)上的数据的频数为_答案:30解析:在区间4,5)上的数据的频率为 10.050.100.150.400.3,故频数为1000.330.(1)在列频率分布表时,全距、组距、组数有如下关系:若 为整数,则 组数;全 距组 距 全 距组 距若 不为整数,则 的整数部分1组数全 距组 距 全 距组 距(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组
13、数太多或太少,都会影响我们了解数据的分布情况若样本容量不超过 100,按照数据的多少常分为 512 组一般样本容量越大,所分组数越多(3)作频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率三、频率分布直方图的应用5某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是96,106(单位:厘米),样本数据分组为96,98),98,100),100,102),102,104),104,106(1)求出 x 的值;(2)已知样本中身高小于 100 厘米的人数是 36,求出样本容量 N 的数值;(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于 98
14、厘米并且小于104 厘米的学生数思路分析:根据频率之和等于 1 可求出 x 的值, 样本容量,样本容量频 数相 应 的 频 率相应的频率频数解:(1)由题意可知:(0.0500.1000.1500.125 x)21,解得 x0.075.(2)设样本容量为 N,样本中身高小于 100 厘米的频率为 p1,所以,p1(0.0500.100)20.30,而 p1 ,所以 N 120.36N 36p1 360.30(3)样本中身高大于或等于 98 厘米并且小于 104 厘米的频率为p2(0.1000.1500.125)20.75,所以身高大于或等于 98 厘米并且小于 104 厘米的学生数 n Np2
15、1200.7590.1下列关于频率分布直方图的说法,正确的序号是_直方图的高表示取某数的频率直方图的高表示该组上的个体在样本中出现频数与组距的比值直方图的高表示该组上的个体在样本中出现的频率直方图的高表示该组上的个体在样本中出现的频率与组距的比值答案:解析:由频率分布直方图的定义知正确2为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,绘制出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为24171593,第二小组频数为 12.(1)第二小组的频率是多少?样本容量是多少?6(2)若次数在 110 以上(含 110 次)为达标,试估计该校全体高一学
16、生的达标率是多少?解:(1)由于面积的大小反映了相应组内样本频率的大小,因此第二小组的频率为 0.08.42 4 17 15 9 3又频率 ,频 数样 本 容 量样本容量 150.第 二 小 组 的 频 数第 二 小 组 的 频 率 120.08(2)由图可估计该校高一学生的达标率约为 100%88%.17 15 9 32 4 17 15 9 3故高一学生的达标率是 88%.(1)频率分布直方图的性质因为小矩形的面积组距 频率,所以各小矩形的面积表示相应各组的频频 率组 距率这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;在频率分布直方图中,各小矩形的面积之和等于 1;
17、样本容量频 数相 应 的 频 率(2)频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性及样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性1有一个容量为 45 的数据样本,分组后,各组的频数如下:12.5,15.5),3;15.5,18.5),8;18.5,21.5),9;21.5,24.5),11;24.5,27.5),10;27.5,30.5),4.根据总体分布,估计小于 27.5 的数据约占总体的百分数是_答案:91%解析:由题意,所求百分比为 100%91%.3 8 9 11 10452某路段检测点对 200 辆汽车的车速进行检测,检测结果表示为频率分布直方图
18、,如图所示,则车速不小于 90 km/h 的汽车约有_辆答案:60解析:频率 组距(0.020.01)100.3,频 率组 距频数频率样本容量0.320060(辆)3在抽查某产品尺寸过程中,将其尺寸分成若干组, a, b)是其中一组,已知该组的频率为 m,该组上的直方图的高为 h,则| a b|等于_答案:mh解析:频率分布直方图中长方形的面积即为频率|a b|h m,| a b| .mh4容量为 50 的样本按从小到大的顺序分为 6 组如下表7组号 1 2 3 4 5 6频数 7 8 8 10 9 8则第 3 组的频率为_答案:0.16解析:由表格可知第 3 组的频数为 8,所以频率 0.16.8505某市 100 位居民的月均用水量(单位:t)的频率分布直方图如图,请作出对应的频率分布折线图,并说明该市居民用水量的大致情况解:连结频率分布直方图中各个相邻的矩形的上底边的中点,即得频率分布折线图由图可知,该市 100 位居民的用水量呈一定的对称性,且是“单峰”的这说明,大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少由此推测这一城市全体居民月均用水量的情况也大致如此