1、1第一讲 频率分布直方图课程目标1. 掌握学会用频率分布表作频率直方图和频率折线图2. 能够用频率直方图对总体分布规律进行估计。3. 掌握茎叶图的意义及画法,并能在实际问题中用茎叶图进行数据统计。课程重点 能够用样本的数字特征估计总体的数字特征。课程难点 利用频率分布直方图、茎叶图解决概率统计的综合问题教学方法建议 首先了解统计的相关定义,掌握解频率分布直方图和茎叶图的画法,利用样本的数字特征估计总体的数字特征.然后通过历年真题对知识点进行细致梳理,对高考题型和常用方法进行详细讲解,最后利用不同层次的习题使学生得到有效强化巩固。课堂精讲例题 搭配课堂训练题 课后作业A 类 ( 2)道 (2)道
2、 (6 )道B 类 ( 2)道 (6)道 ( 8)道选材程度及数量C 类 ( 1)道 (1)道 ( 2)道一:考纲解读、有的放矢统计部分要求不太高,主要是考抽样方法与频率分布直方图和茎叶图有关的问题,最多一个小题(选择或填空)属容易题,但应充分注意以统计为载体、问题实质涉及期望与方差计算的综合解答题.二:核心梳理、茅塞顿开3 作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的 组 距频 率 ,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.4 频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起
3、,就得到一条折线,称这条折线为本组数据的频率折线图.5 作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.2三:例题诠释,举一反三知识点 1:利用频率分布直方图分析总体分布例题1:(2011中山期末A) 2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在 50,6)的汽车大约有 ( )A30辆 B60辆 C300 辆 D600 辆变式:(2009 山东卷理 B)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率
4、分布直方图,其中产品净重的范围是96,106,样本数据分组为96,98) ,98 ,100),100,102),102,104),104,106, 已知样本中产品净重小于100 克的个数是 36,则样本中净重大于或等于 98 克并且小于 104 克的产品的个数是 ( ).A.90 B.75 C. 60 D.45变式:(2011 杭州质检 B)某初一年级有 500 名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图) ,若要从身高在 120,3, ,140, ,5三组内的学生中,用分层抽样的方法选取 30 人参加一项活动,则从身高在 3140内的学生中选取的人数为 知识点 2:用样
5、本分估计总体例题 2(2010 安徽卷 B)某市 2010 年 4 月 1 日4 月 30 日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,() 完成频率分布表;()作出频率分布直方图;()根据国家标准,污染指数在 050 之间时,空气质量为优:在 51100 之间时,为良;在 101150 之间时,为轻微污染;在 151200 之间时,为轻度污染。请你依据所给数据和上述标准,对该市的空气质量给出一个
6、简短评价.96 98 100 102 104 106 0.150 0.125 0.100 0.075 0.050 克 频率/组距 100 110 120 130 140 150 身高频率|组距0.0050.0100.020a0.0353变式:(2009 湖北卷 B)下图是样本容量为 200 的频率分布直方图。 根据样本的频率分布直方图估计,样本数据落在【6,10】内的频数为 ,数据落在(2,10)内的概率约为 。 变式:( 2009 广 东 卷 理 B) 根据空气质量指数 API(为整数)的不同,可将空气质量分级如下表:对某城市一年(365 天)的空气质量进行监测,获得的 API 数据按照区间
7、 , , , , ,进行分组,得到频率分布直方图如图 5. (1)求直方图中 的值; (2)计算一年中空气质量分别为良和轻微污染的天数;(3)求该城市某一周至少有 2 天的空气质量为良或轻微污染的概率.4知识点 3:用样本的数字特征估计总体的数字特征例题 3(2011 华附月考 B)为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是 0.1,0.3,0.4,第一小组的频数为 5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内?变
8、式:(广东六校联考 B): 某校高一某班共有 64 名学生,下图是该班某次数学考试成绩的频率分布直方图,根据该图,估计该班同学数学成绩的平均数_知识点 4:茎叶图的应用例题 4(2011惠州三调 A)右图是 2010 年在惠州市举行的全省运动会上,七位评委为某跳水比赛项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A84,4.84 B84,1.6C85,1.6 D85,489467375变式:(2011 杭州质检 A) 如图,是某篮球运动员在一个赛季的 30 场比赛中得分的茎叶图,则得分的中位数与众数分别为( )A 3 与 3 B23 与 3 C3
9、与 23 D23 与 23变式:(2010 年高考天津卷 A)甲、乙两人在 10 天中每天加工零件的个数用茎叶图表示下图,中间一列的数字表示零件个数,两边的数字表示零件个数的位数。则这 10 天甲、乙两人日加工零件的平均数分别为 和 。知识点 5:综合应用例题 5(2011 佛山一检 C)某班同学利用国庆节进行社会实践,对 25,岁的人群随机抽取 n人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念的称为“低碳族”,否则称为“ 非低碳族 ”,得到如下统计表和各年龄段人数频率分布直方图:6()补全频率分布直方图并求 n、 a、 p的值;()从 40,5)岁年龄段的“低碳族”中采用
10、分层抽样法抽取 18人参加户外低碳体验活动,其中选取 3人作为领队,记选取的 3名领队中年龄在 40,5)岁的人数为 X,求X的分布列和期望 EX.变式:(2011 东莞期末 C)为了调查老年人的身体状况,某老年活动中心对 80 位男性老年人和 100 位女性老年人在一次慢跑后的心率水平作了记录,记录结果如下列两个表格所示,表 1:80 位男性老年人的心率水平的频数分布表(单位:次/分钟)心率水平 80,9)0,1)0,1)0,12频数 10 40 20 10表 2:100 位女性老年人的心率水平的频数分布表(单位:次/分钟)心率水平 80,9)0,1)0,1)0,12频数 10 20 50
11、20(1)从 100 位女性老人中任抽取两位作进一步的检查,求抽到的两位老人心率水平都在 0,)内的概率;(2)根据表 2,完成下面的频率分布直方图,并由此估计这 100 女性老人心率水平的中位数;700.010.020.030.040.050.06(3)完成下面 22 列联表,并回答能否在犯错误的概率不超过 0.001 的前提下认为“这 180位老人的心率水平是否低于 100 与性别有关”.表 3: 心率水平性别心率小于 100心率大于或等于100合计男性 ab女性 cd合计 180n附:22()(nadbKc20(Pk0.50.10.138416358280 90 100 110 120
12、心率女性老年人心率水平频率分布直方图频 率组 距8变式:(2010 广雅月考 B)下图甲是某市有关部门根据对当地干部的月收入情况调查后画出的样本频率分布直方图,已知图甲中从左向右第一组的频数为 4000在样本中记月收入在1000,1500) ,1500,2000) ,2000,2500) ,2500,3000) ,3000 ,3500) ,3500 ,4000的人数依次为A1、A 2、A 6图乙是统计图甲中月工资收入在一定范围内的人数的算法流程图,则样本的容量 n= _ ;图乙输出的 S= _ (用数字作答)则样本的容量 n= ;图乙输出的 S= (用数字作答)9四:方向预测、胜利在望1(A
13、级 ) 某班 50 名学生在一次百米测试中,成绩全部介于 13 秒与 19 秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于 13 秒且小于 14 秒;第二组,成绩大于等于 14 秒且小于 15 秒; 第六组,成绩大于等于 18 秒且小于等于 19 秒.右图是按上述分组方法得到的频率分布直方图.设成绩小于 17 秒的学生人数占全班总人数的百分比为 x,成绩大于等于 15 秒且小于 17 秒的学生人数为 y,则从频率分布直方图中可分析出 x 和 y 分别为 .2.(B 级)为了解某校高三学生的视力情况,随机地抽查了该校 100 名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎
14、,部分数据丢失,但知道前四组的频数成等比数列,后六组的频数成等差数列,设最大频率为 a,视 力在 4.6 到 5.0 之间的学生数为 b,则a,b 的值分别为 .3.(B 级)甲、乙两名同学在 5 次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩分别是 x 甲 、x 乙 ,则 x 甲 x 乙 , 比 稳定.4.(B 级)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为 10.5.若要使该总体的方差最小,则 a、b 的取值分别是 .5.(A 级)某教师出了一份共 3 道题的测试卷,每道题 1 分,全班得 3 分,2 分,1
15、分,0分的学生所占比例分别为 30%,40%,20%,10%,若全班 30 人,则全班同学的平均分是 分.6.(A 级)从某项综合能力测试中抽取 100 人的成绩,统计如表,则这 100 人成绩的标准差为 .分数 5 4 3 2 1人数 20 10 30 30 10107.(B 级)为了了解某地区高三学生的身体发育情况,抽查了该地区 100 名年龄为 17.5岁18 岁的男生体重(kg) ,得到频率分布直方图如下:根据上图可得这 100 名学生中体重在56.5,64.5)的学生人数是 .8.(A 级)某校高中生共有 900 人,其中高一年级 300 人,高二年级 200 人,高三年级400 人
16、,现分层抽取容量为 45 的样本,那么高一、高二、高三年级抽取的人数分别为 .9.(A 级)某牛奶生产线上每隔 30 分钟抽取一袋进行检验,则该抽样方法为;从某中学的 30 名数学爱好者中抽取 3 人了解学习负担情况,则该抽样方法为.那么,分别为 .10.(A 级)一个单位共有职工 200 人,其中不超过 45 岁的有 120 人,超过 45 岁的有 80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为 25 的样本,应抽取超过 45 岁的职工 人.11(B 级)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为 5 月1 日至 30 日,评委会把同学们上交
17、 作品的件数按 5 天一组分组统计,绘制了频率分布直方图(如图所示) ,已知从左到右各长方形高的比为 234641,第三组的频数为 12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有 10 件、2 件作品获奖,问这两组哪组获奖率高?1112(B 级)对某电子元件进行寿命追踪调查,情况如下:寿命(h)100200200300300400400500500600个数 20 30 80 40 30(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在 100 h400 h 以内的概率;(4)估计电
18、子元件寿命在 400 h 以上的概率.13(C 级)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔 30 min 抽取一包产品,称其重量,分别记录抽查数据如下:甲:102, 101, 99, 98, 103, 98, 99;乙:110, 115, 90, 85, 75, 115, 110.(1)这种抽样方法是哪一种?(2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定.1214.(B 级)某赛季甲、乙两名篮球运动员每场比赛得分情况如下:甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50;乙的得分:8,13,14,16,23,2
19、6,28,33,38,39,59.(1)制作茎叶图,并对两名运动员的成绩进行比较;(2)计算上述两组数据的平均数和方差,并比较两名运动员的成绩和稳定性;(3)能否说明甲的成绩一定比乙好,为什么?15.(B 级)从甲、乙两品种的棉花中各抽测了 25 根棉花的纤维长度(单位:mm ) ,结果如下:甲品种:271 273 280 285 285 287 292 294 295301 303 303 307 308 310 314 319 323325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312 313 315315 316 318 3
20、18 320 322 322 324 327329 331 333 336 337 343 356由以上数据设计了如下茎叶图:13根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论: ; .16.(C 级)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示) ,图中从左到右各小长方形面积之比为 24171593,第二小组频数为 12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在 110 以上(含 110 次)为达标,试估计该学校全体高一学生的达标率是多14少?(3)在这次测试中,学生跳绳次数的中位数
21、落在哪个小组内?请说明理由.知识点 1:利用频率分布直方图分析总体分布例题 1:(2011 中山期末 A)D变式:(2009 山东卷理 B)答案 A变式:(2011 杭州质检 B)学生中选取的人数为 10 知识点 2:用样本分估计总体例题 2(2010 安徽卷 B) ,略变式:(2009 湖北卷 B) 【答案】64变式:( 2009 广 东 卷 理 B) 略知识点 3:用样本的数字特征估计总体的数字特征例题 3(2011 华附月考 B)50 (人).(3)中位数落在第三小组内.变式:(广东六校联考 B):略知识点 4:茎叶图的应用例题 4(2011惠州三调 A)【解析】C 去掉最高分和最低分后
22、,所剩分数为 84,84,86,84,87,可以计算得平均数和方差.变式:(2011 杭州质检 A) ( D )变式:(2010 年高考天津卷 A)【答案】24,23知识点 5:综合应用例题 5(2011 佛山一检 C)解:()第二组的频率为 1(0.4.032.1)50.3,所以高为1500.010.020.030.040.050.060.365频率直方图如下:-2 分第一组的人数为 120.6,频率为 0.45.2,所以 01.2n由题可知,第二组的频率为 03,所以第二组的人数为 3,所以95.30p第四组的频率为 5.1,所以第四组的人数为 10.510,所以1.46a -5 分()因
23、为 0,)岁年龄段的“低碳族”与 45,)岁年龄段的“低碳族”的比值为6:32:1,所以采用分层抽样法抽取 18 人, 0,)岁中有 12 人, 45,0)岁中有6 人 -6 分随机变量 X服从超几何分布 0312685()4CP,126385()CPX,21638(),012638()4 -10 分所以随机变量 X的分布列为0 1 2 3P5245683685204-12 分数学期望 301204EX -变式:(2011 东莞期末 C) 解:(1)从 100 位女性老人中任抽取两位,共有 210C个等可能频 率组 距16的结果,抽到的两位老人心率都在 10,) 内的结果有 250C个,由古典
24、概型概率公式得所求的概率2501498Cp.4 分(2)根据表 2,作出女性老人心率水平的频率分布直方图如下:由 0.51(.02).可估计,这 100 女性老人心率水平的中位数约为104.5. 10 分(3)22 列联表,表 3: 12 分 22180(5730)19.5K.由于 .,所以有 99.9%的把握认为“这 180 位老人的心率水平是否低于 100与性别有关” 14 分变式:(2010 广雅月考 B)则样本的容量 n= 10000 ;图乙输出的 S= 6000 (用数字作答)四:方向预测、胜利在望1(A 级) 答案 0.9,352.(B 级)女性老年人心率水平频率分布直方图80 9
25、0 100 110 120 心率水平17答案 0.27,783.(B 级)答案 乙 甲 4.(B 级)答案 10.5、10.55.(A 级)答案 1.9答案 51027.(B 级).答案 408.(A 级)答案 15,10,209.(A 级)答案 系统抽样,简单随机抽样10.(A 级)答案 1011(B 级)解 (1)依题意知第三组的频率为= ,463251又因为第三组的频数为 12,本次活动的参评作品数为 =60.512(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有 60=18(件).1463(3)第四组的获奖率是 = ,18095第六组上交的作品数量为60 =3(件) ,
26、46321第六组的获奖率为 = ,显然第六组的获奖率高.329612(B 级)解 (1)样本频率分布表如下:寿命(h) 频数 频率100200 20 0.10200300 30 0.15300400 80 0.40400500 40 0.20500600 30 0.15合计 200 118(2)频率分布直方图(3)由频率分布表可以看出,寿命在 100 h400 h 的电子元件出现的频率为 0.65,所以我们估计电子元件寿命在100 h400 h 的概率为 0.65.(4)由频率分布表可知,寿命在 400 h 以上的电子元件出现的频率为 0.20+0.15=0.35,故我们估计电子元件寿命在 4
27、00 h 以上的概率为 0.35.13(C 级)解 (1)因为间隔时间相同,故是系统抽样. 2 分(2)茎叶图如下:5 分(3)甲车间:平均值:= (102+101+99+98+103+98+99)=100, 7 分1x7方差:s 12= ( 102-100) 2+(101-100 ) 2+(99-100) 23.428 6. 9 分乙车间:平均值: = (110+115+90+85+75+115+110)=100, 11 分2x7方差:s 22= ( 110-100)2+(115-100) 2+(110-100) 2228.571 4. 13 分1 = ,s 12 s22,甲车间产品稳定.
28、14 分1x14.(B 级)解 (1)制作茎叶 图如下:19从茎叶图上可看出,甲运动员发挥比较稳定,总体得分情况比乙好.(2) 甲 =33, 127.23, 乙 =27, 199.09,x2乙sx2乙s 甲 乙 , ,乙甲运动员总体水平比乙好,发挥比乙稳定.(3)不能说甲的水平一定比乙好,因为上述是甲、乙某赛季的得分情况,用样本估计总体也有一定的偶然性,并不能说一定准确反映总体情况.15.(B 级)答案 乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度).甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品
29、种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大).甲品种棉花的纤维长度的中位数为 307 mm,乙品种棉花的纤维长度的中位数为 318 mm.乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.16.(C 级)解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:=0.08.395742又因为频率= ,乙所以样本容量= = =150.乙08.12(2)由图可估计该学校高一学生的达标率约为100%=88%.391574(3)由已知可得各小组的频数依次为 6,12,51,45,27,9,所以前三组的频数之和为 69,前四组的频数之和为 114,所以跳绳次数的中位数落在第四小组内.