1、 2.2.1 用样本的频率分布估计总体分布【教学目标】1. 通过实例体会分布的意义和作用;2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。【教学重难点】教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图教学难点:w 能通过样本的频率分布估计总体的分布教学过程:【复习回顾】说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。类 别 共同点 各自特点 联 系 适用范围简单随机抽样 从总体中逐个抽取总体个数较少
2、系统抽样将总体均分成几部 分,按预先制定的规则在各部分抽取在起始部分样时采用简随机抽样总体个数较多分层抽样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成【引入】在统计中,为了考察一个总体的情况,通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况。这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。下面我们先通过案例来介绍总体分布的估计。【新知探究】我国是世界上严重缺水的国家
3、之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准 a,用水量不超过 a 的部分按平价收费,超出 a 的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准 a 定为多少比较合理呢 ?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?为了制定一个较为合理的标准 a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等。因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况。 (见课本 表 21)6P分析数据的一种基本方法是用图将它们画出来,或者用
4、紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。可以让我们更清楚的看到整个样本数据的频率分布情况。一、频率分布直方图频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数, 组 距极 差组 数 (3)将数据分组(4)列频率分布表(5)画频率分布直方图以课本 制定
5、居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。6P频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的总体趋势。(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。思考探究:(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以 0.1 和 1为组距重新作图,然后谈谈你对图的印象?(3)如果当地政府希望使 85%以上的居民每月的用水量不超出标准,根据频率分布表
6、 2-1和频率分布直方图 2.2-1, (见课本 )你能对制定月用水量标准提出建议吗?67P二、频率分布折线图、总体密度曲线1频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。2总体密度曲线的定义:在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。 (见课本 )69P思考探究:(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?(2)对于任何一个总体,它的密度曲线是否可以被非
7、常准确地画出来?为什么?答:实际上,尽管有些总体密度曲线是客观存在的,但一般很难想函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。三.茎叶图茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。 (见课本 例子)70P2茎叶图的特征:()用茎叶图表示数据的优点:一是既可以看出样本的分布情况又能看到原始数据;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。()茎叶图只便于表示两位
8、有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。【例题精析】例 1、下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位) 区 间 界 限 122,126) 126,130)130,134)134,138)138,142)142,146)人 数 5 8 10 22 33 20区 间 界 限 146,150) 150,154) 154,158)人 数 11 6 5(1)列出样本频率分布表;(2)画出频率分布直方图;(3)画出频率分布折线图;(4)估计身高小于 134的人数占总人数的百分比.。分析:根据样
9、本频率分布表、频率分布直方图的一般步骤解题。解:()样本频率分布表如下:(2、3)其频率分布直方图如下:分 组 频 数 频 率122,126) 5 0.04126,130) 8 0.07130,134) 10 0.08134,138) 22 0.18138,142) 33 0.28142,146) 20 0.17146,150) 11 0.09150,154) 6 0.05154,158) 5 0.04合 计 120 1(4)由样本频率分布表可知身高小于 134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于 134cm 的人数占总人数的 19%.变式训练:
10、为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为 12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在 110 以上(含 110 次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于 1。解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的
11、频率大小,因此第二小组的频率为:40.8217593由频率= ,得第 二 小 组 频 数样 本 容 量1250.8第 二 小 组 频 数样 本 容 量 第 二 小 组 频 率(2)由图可估计该学校高一学生的达标率约为 1759310%4(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之90 100 110 120 130 140 150 次数o0.0040.0080.0120.0160.0200.0240.028频率/组距0.0320.036和为 69,前四组的频数之和为 114,所以跳绳次数的中位数落在第四小组内。例 2、从两个班中各随机的抽取 10 名学生
12、,他们的数学成绩如下:甲班:76,74,82,96,66,76,78,72,52,68乙班:86,84,62,76,78,92,82,74,88,85画出茎叶图并分析两个班学生的数学学习情况。解析: 26 4 2 8 54 6 82622 4 6 6 86 82 56789乙乙由茎叶图可知,乙班的成绩较好,而且较稳定。【课堂小结】1、制作频率分布直方图分几个步骤?各步骤需要注意哪些问题?2、频率分布直方图和茎叶图相比有什么特点?答:1、步骤:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数, (组距是人为决定的)组 距极 差组 数 (3)将数据分组(4)列频率分布表(必须包
13、括分组、频数、频率三部分)(5)画频率分布直方图(注意纵坐标表示什么,各小长方形是连在一起的)3、频率分布直方图无法看到原始数据,而茎叶图能看出原始数据;但频率分布直方图所体现的内容比茎叶图多。【书面作业】导学案课后练习与提高【板书设计】一、频率分布直方图的步骤二、频率分布折线图和总体密度曲线三、茎叶图例题讲解例 1变式训练例 2小结临清三中数学组 编写人:耿华丽 审稿人: 郭振宇 李怀奎2.2.1 用样本的频率分布估计总体分布课前预习学案一、预习目标:在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;二、预习内容:阅读课本 56P70三完成下列问题:1. 一般用
14、频率分布直方图反映样本的频率分布。其一般步骤有哪些? 频率分布直方图的特征是什么?2.茎叶图的特征是什么?课内探究学案学习目标1. 通过实例体会分布的意义和作用;2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图;3. 通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计。重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图难点:能通过样本的频率分布估计总体的分布学习过程【复习回顾】说一说简单随机抽样、系统抽样、分层抽样各自的特点、操作步骤和适用的范围。类 别 共同点 各自特点 联 系 适用范
15、围简单随机抽样 从总体中逐个抽取总体个数较少系统抽样将总体均分成几部 分,按预先制定的规则在各部分抽取在起始部分样时采用简随机抽样总体个数较多分层抽样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成【新知探究】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准 a,用水量不超过 a 的部分按平价收费,超出 a 的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准
16、a 定为多少比较合理呢 ?你认为,为了了较为合理地确定出这个标准,需要做哪些工作?【自主学习】一、频率分布直方图1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。其一般步骤为:2.以课本 制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图。6P3.频率分布直方图的特征:思考探究:(1)在频率分布直方图中,各小长方形的面积表示什么?它们的总和是多少?(2)同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以 0.1 和 1为组距重新作图,然后谈谈你
17、对图的印象?(3)如果当地政府希望使 85%以上的居民每月的用水量不超出标准,根据频率分布表 2-1和频率分布直方图 2.2-1, (见课本 )你能对制定月用水量标准提出建议吗?67P二、频率分布折线图、总体密度曲线1频率分布折线图的定义:2总体密度曲线的定义:在样本频率分布直方图中,随着样本容量的增加,所分组数的增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。 (见课本 )69P思考探究:(1)对于任何一个总体,它的密度曲线是不是一定存在?为什么?(2)对于任何一个总
18、体,它的密度曲线是否可以被非常准确地画出来?为什么?三.茎叶图茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。 (见课本 例子)70P2茎叶图的特征:典型例题例 1、下表给出了某校 500 名 12 岁男孩中用随机抽样得出的 120 人的身高(单位) 区 间 界 限 122,126) 126,130)130,134)134,138)138,142)142,146)人 数 5 8 10 22 33 20区 间 界 限 146,150) 15
19、0,154) 154,158)人 数 11 6 5(1)列出样本频率分布表;(2)画出频率分布直方图;(3)画出频率分布折线图;(4)估计身高小于 134的人数占总人数的百分比.。变式训练:为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为 12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在 110 以上(含 110 次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由。例 2
20、、从两个班中各随机的抽取 10 名学生,他们的数学成绩如下:甲班:76,74,82,96,66,76,78,72,52,68乙班:86,84,62,76,78,92,82,74,88,85画出茎叶图并分析两个班学生的数学学习情况。当堂检测1.为了解一批数据在各个范围内所占的比例大小,将这批数据分组,落在各个小组里的数据个数叫做 ( )A、频数 B、样本容量 C、频率 D、频数累计2.在频率分布直方图中,各个小长方形的面积表示 ( )A、落在相应各组的数据的频数 B、相应各组的频率C、该样本所分成的组数 D、该样本的容量3.列样本频率分布表时,决定组数的正确方法是 ( )A、任意确定 B、一般分
21、为 512 组C、由组距和组数决定 D、根据经验法则,灵活掌握4.一个容量为 n 的样本,分成若干组,已知某组的频数和频率分别为 40,0、125,则n 的值为( )A、640 B、320 C、240 D、1605.为考察某种皮鞋的各种尺码的销售情况,以某天销售 40 双皮鞋为一个样本,把它按尺码分成 5 组,第 3 组的频率为 0、25,第 1,2,4 组的频率分别为 6,7,9,若第 5 组表示的是 4042 码的皮鞋,则售出的 200 双皮鞋中含 4042 码的皮鞋为( )A、50 B、40 C、20 D、306.一个容量为 20 的样本数据,分组后组距与频数如下:(10,20,2;(2
22、0,30,3;(30, 40 ,4;(40,50 ,4;(60,70 ,2。则样本在区间(-,50上的频率是( )A、5% B、25% C、50% D、70%7.将一批数据分成 5 组列出频率分布表,其中第 1 组的频率是 0、1,第 4 组与 第 5 组的频率之和是 0、3,那么第 2 组与第 3 组的频率之和是 。反思总结课后练习与提高1.从一群学生中收取一个一定容量的样本对他们的学习成绩进行分析,前三组是不超过 80 分的人,其频数之和为 20 人,其频率之和(又称累积频率)为 0、4,则所抽取的样本的容量是 ( )A、100 B、80 C、40 D、502.下列叙述中正确的是 ( )A
23、、从频率分布表可以看出样本数据对于平均数的波动大小B、频数是指落在各个小组内的数据C、每小组的频数与样本容量之比是这个小组的频率D、组数是样本平均数除以组距3.有一个数据为 50 的样本数据分组,以及各组的频数如下,根据累积频率分布,估计小于 30 的数据大约占多少( )12、5,15、5) ,3;15、5,18、5) ,8;18、5,21、5) ,9;21、5,24、5) ,11;24 、5,27、5) ,10;30、5,33、5) ,4A、10% B、92% C、5% D、30%4.在抽查某产品尺寸的过程中,将其尺寸分成若干组,a,b是其中一组,抽查出的个体数在该组上的频率为 m,该组上的
24、直方图的高是 h,则, a-b等于( )A、hm B、 h C、 m D、 与 m,h 无关5.已知一个样本75,71,73,75,77,79,75,78,80,79,76,74,75,77,76,72,74,75,76,78。在列频率分布表时,如果组距取为 2,那么应分成 组,第一组的分点应是 ,74、5 76、5 这组的频数应为 ,频率应为 。6.在求频率分布时,把数据分为 5 组,若已知其中的前四组频率分别为0、1,0、3,0、3,0、1,则第五组的频率是 ,这五组的频数之比为 。7.为了检测某种产品的质量,抽取了一个容量为 100 的样本,数据的分组及频率如下表:分组 频数 频率10、 75,10、85) 310、 85,10、95) 910、 95,11、05) 1311、 05,11、15) 1611、 15,11、25) 2611、 25,11、35) 2011、 35,11、45) 711、 45,11、55) 411、 55,11、65) 2合计 100完成上面的频率分布表;根据上表画出频率分布直方图;根据上表和图,估计数据落在10、95,11、35)范围内的概率约是多少?数据小于 11、20 的概率约是多少?