1、12.2 总体分布的估计2.2.1 频率分布表2.2.2 频率分布直方图与折线图内容要求 1.理解用样本的频率分布估计总体分布的方法(难点);2.会列频率分布表,画频率分布直方图、频率分布折线图(重点);3.能够利用图形解决实际问题.知识点一 频率分布表与频率分布直方图1.频率分布表当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布,我们把反映总体频率分布的表格称为频率分布表.2.频率分布直方图把横轴分成若干段,每一段对应一个组的组距,然后以此线段为底作一矩形,它的高等于该组的 ,这样得出一系列的矩形,每个矩形的面积恰好是该组的频率.这些矩形就构成频 率组 距了频率分布直方图.【
2、预习评价】 (正确的打“” ,错误的打“”)(1)制作频率分布表时,组距与组数的确定有固定的标准.( )(2)频率分布直方图中,各小矩形的面积总和为 1.( )答案 (1) (2)知识点二 频率分布折线图与总体密度曲线1.频率分布折线图如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图,简称频率折线图.如图所示.2.总体分布的密度曲线如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.如图所示.2【预习评价】对于样本频率分布折线图与总体分布的密度曲线的关系,有下列说法:频率分布折线图与总
3、体分布的密度曲线无关;频率分布折线图就是总体分布的密度曲线;样本容量很大的频率分布折线图就是总体分布的密度曲线;如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限趋于总体分布的密度曲线.其中正确的是_(填序号).解析 总体分布的密度曲线通常都是用样本频率分布估计出来的.如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于一条光滑曲线,这条曲线就是总体分布的密度曲线.答案 题型一 基本概念的理解【例 1】 一个容量为 n 的样本分成若干组,已知某组的频数和频率分别为 30 和 0.25,则 n 等于_.解析 某一组的频率等于该组的频数与样本容量的比.由于
4、0.25,所以 n120.30n答案 120规律方法 频率 ,利用此式可知二求一.频 数样 本 容 量【训练 1】 一个容量为 80 的样本中数据的最大值是 140,最小值是 51,组距是 10,则应将样本数据分为_组.答案 9题型二 频率分布表及其应用【例 2】 下表给出了从某校 500 名 12 岁男孩中利用随机抽样得出的 120 人的身高(单位:cm):区间界限 122,126) 126,130) 130,134) 134,138) 138,142)人数 5 8 10 22 333区间界限 142,146) 146,150) 150,154) 154,158人数 20 11 6 5(1)
5、列出样本频率分布表;(2)估计身高小于 134 cm 的人数占总人数的百分比.解 (1)样本频率分布表如下:分组 频数 频率122,126) 5 0.04126,130) 8 0.07130,134) 10 0.08134,138) 22 0.18138,142) 33 0.28142,146) 20 0.17146,150) 11 0.09150,154) 6 0.05154,158 5 0.04合计 120 1(2)由样本频率分布表可知身高小于 134 cm 的男孩出现的频率为0.040.070.080.19,所以我们估计身高小于 134 cm 的人数占总人数的 19%.规律方法 1.绘制
6、频率分布表的基本步骤:(1)求全距,决定组数和组距,组距 ;全 距组 数(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.2.(1)由频率的定义不难得出,各组数据的频率之和为 1,因为各组数据的频数之和为样本容量,在列频率分布表时,可以利用这种方法检查是否有数据的丢失.(2)组数与样本容量有关,一般地,样本容量越大,分的组数也越多.当样本容量不超过100 时,按照数据的多少,常分成 512 组.(3)在确定分组区间的端点,即分点时,应对分点进行适当调整,使分点比数据多一位小数,并确保每个数据均能落在一个区间内,而不是处于区间的端点.(
7、4)组距与组数的确定没有固定的标准,将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.【训练 2】 某中学 40 名男生的体重数据如下(单位:kg):61 60 59 59 59 58 58 57 57 57 57 56 56 56 56 56 56 56 55 55 55 55 54 54 54 54 53 53 52 52 52 52 52 51 51 51 50 50 49 484请根据上述数据列相应的频率分布表.解 (1)计算最大值与最小值的差,614813;(2)确定组距与组数,取组距为 2, 6 ,所以共分 7 组;132 12(3)确定分点,使分点比数据多一位小
8、数,并把第一小组分点减小 0.5,即分成如下七组:47.5,49.5),49.5,51.5),51.5,53.5),53.5,55.5),55.5,57.5),57.5,59.5),59.5,61.5;(4)列出频率分布表如下:分组 频数 频率47.5,49.5) 2 0.0549.5,51.5) 5 0.12551.5,53.5) 7 0.17553.5,55.5) 8 0.2055.5,57.5) 11 0.27557.5,59.5) 5 0.12559.5,61.5 2 0.05合计 40 1.00【例 3】 为了了解一大片经济林的生长情况,人们随机测量其中的 100 株树木的底部周长(
9、单位:cm),得到如下数据:135 98 102 110 99 121 110 96 100 103125 97 117 113 110 92 102 109 104 112105 124 87 131 97 102 123 104 104 128109 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95
10、 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108(1)列出频率分布表;(2)绘制频率分布直方图、频率分布折线图.5解 (1)从数据中可以看出,这组数据的最大值为 135,最小值为 80,故极差为 55,可将其分为 11 组,组距为 5.列频率分布表如下:分组 频数 频率80,85) 1 0.0185,90) 2 0.0290,95) 4 0.0495,100) 14 0.14100,105) 24 0.24105,110) 15 0.15110,115) 12 0.12115,
11、120) 9 0.09120,125) 11 0.11125,130) 6 0.06130,135 2 0.02合计 100 1.00(2)画频率分布直方图、频率分布折线图如图所示.【迁移 1】 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为 24171593,第二小组的频数为 12.6(1)第二小组的频率是多少?样本容量是多少?(2)若次数在 110 以上(含 110 次)为达标,则该校全体高一年级学生的达标率约是多少?解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率
12、大小的,因此第二小组的频率为 0.08.42 4 17 15 9 3因为第二小组的频率 ,第 二 小 组 的 频 数样 本 容 量所以样本容量 150.第 二 小 组 的 频 数第 二 小 组 的 频 率 120.08(2)由直方图可估计该校全体高一年级学生的达标率约为 100%88%.17 15 9 32 4 17 15 9 3【迁移 2】 200 辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在50,60)内的汽车有_辆.解析 因为小长方形的面积即为对应的频率,时速在50,60)内的频率为 0.3,所以有2000.360(辆).答案 60【迁移 3】 为了解某地居民的月收入情况
13、,一个社会调查机构调查了 20 000 人,并根据所得数据画出样本的频率分布直方图如图所示(最后一组包含两端值,其他组包含最小值,不包含最大值).现按月收入分层,用分层抽样的方法在这 20 000 人中抽出 200 人进一步调查,则月收入在1 500,2 000)(单位:元)的应抽取_人.解析 月收入在1 500,2 000)的频率为 1(0.000 20.000 520.000 30.000 1)5000.2,故应抽取 2000.240(人).答案 407规律方法 1.频率分布直方图的性质:(1)因为小矩形的面积组距 频率,所以各小矩形的面积表示相应各组的频率.这频 率组 距样,频率分布直方
14、图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于 1.(3) 样本容量.频 数相 应 的 频 率2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.课堂达标1.已知一个容量是 40 的样本,把它分成六组,第一组到第四组的频数分别是 5,6,7,10,第五组的频率是 0.2,那么第六组的频数是_,频率是_.解析 因为频率 ,所以频数频率样本容量,因为第五组的频率是 0.2,样频 数样 本 容 量本容量是 40,所以频数是 0.2408,所以第六组的频数是 40(5
15、67108)4,所以第六组的频率是 0.1.440答案 4 0.12.某种树木的底部周长的取值范围是80,130,它的频率分布直方图如图所示,则在抽测的 60 株树木中,有_株树木的底部周长小于 100 cm.解析 由题意知在抽测的 60 株树木中,底部周长小于 100 cm 的株数为(0.0150.025)106024.答案 243.某学校组织学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为20,40),40,60),60,80),80,100.若低于 60 分的人数是 15,则该班的学生人数是_.8解析 因为第一、第二小组的频率分别是 0.005200.1,0.010200
16、.2,所以低于 60分的频率是 0.10.20.3.设该班的学生人数为 m,则 0.3,所以 m50.15m答案 504.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为12,13),13,14),14,15),15,16),16,17,将其按从左到右的顺序分别编号为第一组,第二组,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有 20 人,第三组中没有疗效的有 6 人,则第三组中有疗效的人数为_.解析 志愿者的总人数为 50,20 0.24 0.16 1所以第三组人数为 500.36118,所以有疗效的人数为 186
17、12.答案 125.下面是对一组数据的统计:范围 频数累计 频数 频率 频率累计10,8) 38,6) 66,4) 174,2) 282,0) 250,2) 20 0.202,4) 0.134,6) 86,8) 9898,10 0.02合计 100(1)完成表格;(2)画出频率分布直方图.解 由于样本数据已经给出,我们只要根据这些数据,按照列频率分布表的一般步骤操作即可.(1)表格如下:范围 频数累计 频数 频率 频率累计10,8) 3 3 0.03 0.038,6) 9 6 0.06 0.096,4) 17 8 0.08 0.174,2) 28 11 0.11 0.282,0) 53 25
18、0.25 0.530,2) 73 20 0.20 0.732,4) 86 13 0.13 0.864,6) 94 8 0.08 0.946,8) 98 4 0.04 0.988,10 100 2 0.02 1合计 100 1.00(2)频率分布直方图如图所示:课堂小结1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2.当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.基础过关1.已知样本 7,10,14,8,7,12,11,10,8,10,13,10,8,11,8,9,
19、12,9,13,20,那么这组数据落10在8.5,11.5)内的频率为_.解析 样本的总数为 20,数据落在8.5,11.5)内的个数为 8,故所求频率为 0.4.820答案 0.42.一个样本的容量为 72,分成 5 组,已知第一、五组的频数都为 8,第二、四组的频率都为 ,则第三组的频数为_.29解析 因为频率 ,所以第二、四组的频数都为 72 16.所以第三组的频数为频 数样 本 容 量 29722821624.答案 243.如图所示是一容量为 100 的样本的频率分布直方图,则由图形中的数据,样本落在15,20)内的频数为_.解析 样本数据落在15,20内的频数为 10015(0.04
20、0.1)30.答案 304.为了解宿迁市高三学生的身体发育情况,抽查了宿迁市 100 名高三男生的体重.根据抽样测量后的男生体重(单位:kg)数据绘制的频率分布直方图如图所示,则这 100 名学生中体重值在区间56.5,64.5)的人数是_.解析 根据频率分布直方图可知组距为 2,体重值在区间56.5,64.5)内的频率为(0.030.050.050.07)20.4,体重值在区间56.5,64.5)内的人数为1000.440.答案 405.对某种电子元件使用寿命跟踪调查所得样本频率分布直方图如图.由图可知这一批电子元件中寿命在 100300 h 的电子元件的数量与寿命在 300600 h 的电
21、子元件的数量的比是11_.解析 由题意知数量的比即为所对应的小矩形的面积和之比,即1001 10014.42 000 42 000答案 146.如图所示是总体的一个样本频率分布直方图,且在15,18)内频数为 8.(1)求样本在15,18)内的频率;(2)求样本容量;(3)若在12,15)内的小矩形面积为 0.06,求在18,33)内的频数.解 由样本频率分布直方图可知组距为 3.(1)由样本频率分布直方图得样本在15,18)内的频率为 3 .475 425(2)样本在15,18)内频数为 8,由(1)可知样本容量为 8 50.8425 254(3)在12,15)内的小矩形面积为 0.06,故
22、样本在12,15)内的频率为 0.06,故样本在15,33)内的频数为 50(10.06)47,又在15,18)内频数为 8,故在18,33)内的频数为 47839.7.新华中学高三年级参加市一轮验收考试的同学有 1 000 人,用系统抽样法抽取了一个容量为 200 的学生总成绩的样本,分数段及各分数段人数如下(满分 750 分):分数段/分 250,350) 350,450) 450,550) 550,650) 650,750人数 20 30 80 40 30(1)列出频率分布表;12(2)画出频率分布直方图;(3)一批本科模拟上线成绩为 550 分,试估计该校的一批本科上线人数.解 (1)
23、频率分布表如下:分数段/分 频数 频率250,350) 20 0.10350,450) 30 0.15450,550) 80 0.40550,650) 40 0.20650,750 30 0.15合计 200 1.00(2)频率分布直方图如图(3)由频率分布表知,在样本中成绩在 550 分以上的人数的频率为 0.200.150.35.由此可以估计,该校一批本科模拟上线人数约为 0.351 000350(人).能力提升8.某中学举行的电脑知识竞赛,满分 100 分,80 分以上为优秀,现将高一两个班参赛学生的成绩整理后分成五组,绘制成频率分布直方图,已知图中从左到右的第一、第三、第四、第五小组频
24、率分别为 0.30,0.05,0.10,0.05.第二小组频数为 40,则参赛的人数和成绩优秀的频率分别为_.解析 第二小组的频数为 40,第二小组的频率为 10.300.050.100.050.50,参赛人数为 80,400.50第四,五小组的频率为 0.100.050.15.答案 80,0.159.某路段检查站监控录像显示,在某段时间内有 2 000 辆车通过该站,现随机抽取其中的13200 辆进行车速分析,分析结果表示为如图所示的频率分布直方图,则图中 a_,估计在这段时间内通过该站的汽车中速度不小于 90 km/h 的约有_辆.解析 由于本题中的组距为 10,所以直方图中 5 组的频率
25、分别为 0.1,10a,0.4,0.25 和0.05,由频率和为 1 可得 a0.02.样本中不小于 90 km/h 的汽车所占的频率为0.250.050.3,故在这段时间内通过该站的汽车中速度不小于 90 km/h 的约有 2 0000.3600(辆).答案 0.02 60010.从某小区抽取 100 户居民进行月用电量调查,发现其用电量都在 50 到 350 度之间,频率分布直方图如图所示.(1)直方图中 x 的值为_;(2)在这些用户中,用电量落在区间100,250)内的户数为_.解析 (1)第一组的频率为 0.002 4500.12,第二组的频率为 0.003 6500.18,第三组的
26、频率为 0.006 0500.3,第五组的频率为 0.002 4500.12,第六组的频率为 0.001 2500.06,所以第四组的频率为 10.120.180.30.120.060.22,所以 x0.22500.004 4.(2)用电量落在区间100,250)内的户数为第二、三、四组的数据,所以(0.180.30.22)1000.710070.答案 (1)0.004 4 (2)7011.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98),98,100),100,102),102,1
27、04),104,106,已知样本中产品净重小于 100 克的个数是1436,则样本中净重大于或等于 98 克并且小于 104 克的产品的个数是_.解析 样本中产品净重小于 100 克的频率为(0.0500.100)20.3,频数为 36,样本总数为 120.360.3样本中净重大于或等于 98 克并且小于 104 克的产品的频率为(0.1000.1500.125)20.75,样本中净重大于或等于 98 克并且小于 104 克的产品的个数为 1200.7590.答案 9012.从某学校的 800 名男生中随机抽取 50 名测量身高,被测学生身高全部介于 155 cm 和195 cm 之间,将测量
28、结果按如下方式分成八组:第一组155,160),第二组160,165),第八组190,195,下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组的人数为 4 人.(1)求第七组的频率;(2)估计该校的 800 名男生的身高的中位数以及身高在 180 cm 以上(含 180 cm)的人数.解 (1)第六组的频率为 0.08,所以第七组的频率为45010.085(0.00820.0160.0420.06)0.06.(2)身高在第一组155,160)的频率为 0.00850.04,身高在第二组160,165)的频率为 0.01650.08,身高在第三组165,170
29、)的频率为 0.0450.2,身高在第四组170,175)的频率为 0.0450.2,由于 0.040.080.20.320.5,0.040.080.20.20.520.5,估计这所学校的 800 名男生的身高的中位数为 m cm,则 170 m175.由 0.040.080.2( m170)0.040.5,得 m174.5.15所以可估计这所学校的 800 名男生的身高的中位数为 174.5 cm.由(1)和直方图得后三组的频率为 0.080.060.00850.18,故身高在 180 cm 以上(含 180 cm)的人数为 0.18800144.13.(选做题)若某产品的直径长与标准值的差
30、的绝对值不超过 1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取 5 000件进行检测,结果发现有 50 件不合格品.计算这 50 件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:分组 频数 频率3,2) 0.102,1) 8(1,2 0.50(2,3 10(3,4合计 50 1.00(1)将上面表格中缺少的数据填在相应位置;(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3内的频率;(3)现对该厂这种产品的某个批次进行检查,结果发现有 20 件不合格品.据此估算这批产品中的合格品的件数.解 (1)如下表所示频率分布表.分组 频数 频率3,2) 5 0.102,1) 8 0.16(1,2 25 0.50(2,3 10 0.20(3,4 2 0.04合计 50 1.00(2)由频率分布表知,该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3内的频率约为0.500.200.70.(3)设这批产品中的合格品数为 x 件,依题意 ,解得 x 201 505 000 20x 20 5 0002050980.所以该批产品的合格品件数是 1 980.