1、探索知识,享受快乐,20.1 数据的频数分布,复习回顾:,已知一个样本:27,23,25,27,29, 31,27,30,32,21,28,26,27,29, 28,24,26,27,28,30。 列出频数分布表, 并绘出频数分布直方图和频数折线图。,解:(1)计算最大值与最小值的差:32-23=9(2)决定组距为2,因为9/2=4.5,所以组数为5(3)决定分点:22.524.5,24.526.5,26.528.5,28.530.5,30.532.5.,例题:,解: (4)列频数分布表:,已知一个样本:27,23,25,27,29, 31,27,30,32,21,28,26,27,29, 2
2、8,24,26,27,28,30。 列出频数分布表, 并绘出频数分布直方图和频数折线图。,2,3,8,4,3,20,例题:,解: (5)画频数分布直方图和频数折线图:,已知一个样本:27,23,25,27,29, 31,27,30,32,21,28,26,27,29, 28,24,26,27,28,30。 列出频数分布表, 并绘出频数分布直方图和频数折线图。,例题:,某班一次数学测验成绩如下: 63,84,91,53,69,81,61,69,91,78,75,81,80,67,76,81,79,94,61,69,89,70,70,87,81,86,90,88,85,67,71,82,87,75
3、,87,95,53,65,74,77,问题,大部分同学处于哪个分数段? 成绩的整体分布情况怎样?,先将成绩按10分的距离分段,统计每个分数段学生出现的频数,填入表20.1.2,制作频数分布表,根据频数分布表绘制直方图,根据频数分布表绘制直方图,根据频数分布表绘制直方图,绘制频数折线图,将直方图中每个小长方形上面一条边的中点顺次连结起来,即可得到频数折线图,2.2.1 用样本的频率分布估计总体分布,1、用样本去估计总体,是研究统计问题的一个基本思想,2、前面我们学过的抽样方法有:简单随机抽样、系统抽样、分层抽样。要注意这几种抽样方法的联系与区别。,3、 初中时我们学习过样本的频率分布,包括频数、
4、频率的概念,频数分布表和频数分布直方图的制作。,随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.,用样本估计总体一般有两种方法: 1.用样本的频率分布估计总体的分布 2.是用样本的数字特征(如平均数、标准差等)估计总体特征。,二、样本估计总体的方法,思考:由上表,大家可以得到什么信息?,通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:,3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3
5、.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1
6、.0 1.2 1.8 0.6 2.2,显然:这个例子与前面抛掷硬币的问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有:频率分布表和频率分布直方图,1.极差:样本数据中的最大值和最小值的差称为极差,2.确定组距,组数:.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?,0.24.3,(4.3-0.2)0.5=8.2,1.求极差(即一组数据中最大值与最小值的差),2.决定组距与组数,组数=,4.3 - 0.2 = 4.1,3.将数据分组,0,0.5 ),0.5,1 ),4,4.5,组数:将数据分组,当数据在100个以内时,按数据多少常
7、分5-12组。 组距:指每个小组的两个端点的距离,,3 将数据分组,决定分点:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?,4 画频率分布表:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?,0,0.5),0.5,1),1,1.5), ,4,4.5.,分 组 频数累计 频数 频率0,0.5) 4 0.040.5,1) 正 8 0.081,1.5) 正 正 正 15 0.151.5,2) 正 正 正 正 22 0.222,2.5) 正 正 正 正 正 25 0.252.5,3) 正 正 14 0.14
8、3,3.5) 正 一 6 0.063.5,4) 4 0.044,4.5 2 0.02合计 100 1.00,4.列频率分布表,100位居民月平均用水量的频率分布表,频率=频数样本容量,频数=样本数据落在各小组内的个数,画频率分布直方图,小长方形的面积=,注意:, 这里的纵坐标不是频率,而是频率/组距;, 某个区间上的频率用这个区间矩形的面积表示;,直方图,0.08,0.16,0.30,0.44,0.50,0.28,0.12,0.08,0.04,23,问题 如果当地政府希望使80% 以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量标准提出建议吗?,24,问题
9、你认为3吨这个标准一定能够保证80以上的居民用水不超标吗?如果不一定,那么哪些环节可能导致结论的差别?,25,同样一组数据,如果组距不同,得到的图的形状也会不同。,26,问题10 你能从图中分析出样本的哪些信息?,问题 你认为频率分布直方图的优缺点是什么?,例:某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a , 用水量不超过a的部分按平价收费,超过a的部分按议价收费。,如果希望大部分居民的日常生活不受影响,那 么标准a定为多少比较合理呢?,为了较合理地确定这个标准,你认为需要做哪些工作?,三、样本分析,一般通过表、图、计算来分析数据,帮助我们找出样本
10、数据中的规律,使数据所包含的信息转化成直观的容易理解的形式。,频数分布表和频数分布图可以使我们能够清楚的知道数据分布在各个小组的个数。,频率分布表和频率分布直方图则是从各个小组数据在样本容量中所占比例的大小的角度,来表示数据分布的规律,它可以使我们看到整个样本数据的频率分布情况。,一、求极差,即数据中最大值与最小值的差,二、决定组距与组数 :组距=极差/组数,三、分组,通常对组内数值所在区间,取左闭右开区间 , 最后一组取闭区间,四、登记频数,计算频率,列出频率分布表,画一组数据的频率分布直方图,可以按以下的步骤进行:,五、画出频率分布直方图(纵轴表示频率组距),思考1:为了直观反映样本数据在
11、各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:频率分布直方图中各小长方形的宽度和高度在数量上有何特点?,知识探究(二):频率分布直方图,宽度:组距,思考2:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?,各小长方形的面积=对应频率,各小长方形的面积之和=1,小结:,频率分布直方图,1.求极差,2.决定组距与组数,3.将数据分组,4.列频率分布表,5.画频率分布直方图,频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.,必修3实验,例1.关于频率分布直方图中小长方形的高说法,正确的是( ) A. 表示该组上的个体在样本中出现的频率 B.
12、表示某数的频率 C. 表示该组上的个体数与组距的比值 D. 表示该组上的个体在样本中出现的频率与组距 的比值,应用举例:,D,2学校为了调查学生在课外读物方面的支出况,抽出了一个容量为n的样本,其频率分布直方图如右图所示,其中支出在 元的同学有30人,则n的值为,100,3统计某校1000名学生的数学水平测试成绩,得到样本频率分布直方图如图所示,若满分为100分,规定不低于60分为及格,则及格率是( ) A20% B25% C60% D80%,D,4:从高二学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分)40,50), 2;50,60),3;60,70),10;70,80),15;80,90),12;90,100),8; (1)列出样本的频率分布表; (2)画出频率分布直方图; (3)估计成绩在60,90)分的学生比例。,