1、第二章 统计 2.2 用样本估计总体 22.1 用样本的频率分布估计总体分布(一),了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点,基础梳理,1极差:最大值与最小值的差 例如:一组数据8,13,13,16,23,26,28的极差是多少?2组距:为了避免对数据逐一考察的麻烦,将数据分成若干组,一般情况要使组数为512组 3组数:不小于极差/组距的最小整数中学学习的问题一般分为512组,答案:20,例如:极差为15,组距为2,应该分为几组?4频数:每个(类)对象出现的次数称为频数各个(类)对象的频数之和等于数据总数 例如:某班有50人,一次数学考试
2、90100分的同学有10人,90100分的频数为_,10,5频率:每个(类)对象出现的频数与总数的比值称为频率各个(类)对象的频率之和等于1. 6频率分布表: 例如:200辆汽车通过某一段公路时的时速在40到80公里之间,4050公里的有20辆,5060公里的有60辆,6070公里的有80辆,7080公里的有40辆,共分四组,组距为10,列出频率分布表,解析:频率分布表为:,7频率分布直方图:频率分布表用图形表示出来的一种形式画频率分布直方图一般步骤为: (1)计算一组数据中最大值与最小值的差,即求极差 (2)决定组距与组数 (3)将数据分组 (4)列出频率分布表 (5)画频率分布直方图,注意
3、:频率分布直方图中,各小长方形面积之和等于1,各小长方形的面积等于相应各组的频率,各小长方形的高与该组频率成正比但不是频率,实际上是“频率/组距”,自测自评,1将容量为n的样本中的数据分成6组,绘制频率分布直方图若第一组至第六组数据的频率之比为234641,且前三组数据的频数之和等于27,则n等于_ 2一个容量为100的样本,其数据的分组与各组的频数如下:,60,则样本数据落在(10,40上的频率为( ) A0.13 B0.39 C0.52 D0.64,3.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如右图)由图中数据可知a_.若要从身高在 120 , 1
4、30),130 ,140) , 140 , 150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在140 ,150内的学生中选取的人数应为_,C,0.030,3,4.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间5,40中,其频率分布直方图如图所示,则在其抽测的100根中,有_根棉花纤维的长度小于20 mm.,30,题型一 认识频率分布直方图,例1 200辆汽车通过某一段公路时的时速在40到80公里之间,4050公里的有20辆,5060公里的有60辆,6070公里的有80辆,7080公里的有40辆,
5、以速度为x轴,分别以频数、频率、频率/组距为纵坐标画出直方图,指出哪个是频率分布直方图,解析:所求的直方图如下:,跟 踪训 练,1.某路段检查站监控录像显示,在某时段内,有1 000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如右图所示的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90 km/h的约有( ) A100辆 B200辆 C300辆 D400辆,C,题型二 列频率分布表,画频率分布直方图,例2 某班50名同学参加数学测验,成绩的分组及各组的频数如下: 40,50),2;50,60),3;60,70),10;70,80),15;80,90
6、),12;90,100,8; (1)列出样本的频率分布表; (2)画出频率分布直方图,解析:(1)样本的频率分布表如下:,(2)频率分布直方图如下:,点评:1.在列频率分布表时,极差、组距、组数有如下关系: (1)若为整数,则组数 (2)若不为整数,则的整数部分1组数,2组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为512组,一般样本容量越大,所分组数越多,跟 踪训 练,2某中学同年级40名男生的体重数据如下(单位:kg): 61 60 59 59 5
7、9 58 58 57 57 57 57 56 56 56 56 56 56 56 55 55 55 55 54 54 54 54 53 53 52 52 52 52 52 51 51 51 50 50 49 48 列出样本的频率分布表,绘出频率分布直方图,解析:(1)计算最大值与最小值的差:614813; (2)决定组距与组数,取组距为2,故共分成7组 (3)决定分点,使分点比数据多一位小数,并把第1小组的分点减小0.5,即分成如下7组: 47549.5,49.551.5,51.553.5,53.555.5,55.557.5,57.559.5,59.561.5.,(4)列出频率分布表如下:,(
8、5)绘出频率分布直方图如下:,题型三 日常生活中的数据处理,例3 为了了解中学生的身高情况,对广东某中学同龄的50名男学生的身高进行了测量,结果如下(单位:cm): 175 168 180 176 167 181 162 173 171 177 171 171 174 173 174 175 177 166 163 160 166 166 163 169 174 165 175 165 170 158 174 172 166 172 167 172 175 161 173 167 170 172 165 157 172 173 166 177 169 181 列出样本的频率分布表,画出频率分布
9、直方图,解析:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据题意列出样本的频率分布表如下:,频率分布直方图如下:,点评:频率分布直方图的性质 (1)因为小矩形的面积组距频率/组距频率,所以各小矩形的面积表示相应各组的频率,这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小 (2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数/相应的频率样本容量,跟 踪训 练,3某人在同一条件下射靶50次,其中射中6环5次,射中7环9次,射中8环21次,射中9环11次,射中10环4次 (1)列出频率分布表; (2)画出表示频率分布条形图
10、,解析:(1)频率分布表如下:,(2)频率分布的条形图如下:,题型四 用茎叶图提取有用数据进行分析,例4 甲、乙两个小组各10名学生的英语口语测试成绩(单位:分)如下: 甲组:76 90 84 86 81 87 86 82 85 83; 乙组:82 84 85 89 79 80 91 89 79 74. 用茎叶图表示两个小组的成绩,并判断哪个小组的成绩更整齐一些,分析:题中数据是首位分别为7,8,9的两位数,选择7,8,9为茎,绘制茎叶图 解析:茎叶图如下图所示(中间的茎为十位上的数字):,点评:画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数要先确定中间的数取数
11、据的哪几位,填写数据时边读边填比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较绘制茎叶图的关键是分清茎和叶,,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶,跟 踪训 练,4某中学高三(21)班甲、乙两名同学自高中以来每场数学考试成绩如下: 甲:95,81,75,91,86,89,71,65,76,88,94,110,107; 乙:83,86,93,99,88,130,98,114,98,79,101. 画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较,解析:两人数学成绩茎叶图如下:,从这个茎叶图上可看出,甲同学的得分情况是大致对称的,中位数是88;乙同学的得分情况除一个特殊得分外,也大致对称,中位数是98.因此乙同学发挥比较稳定,总体得分情况乙比甲好,