1、1用样本估计总体【考点梳理】1频率分布直方图(1)频率分布表的画法:第一步:求极差,决定组数和组距,组距 ;极 差组 数第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;第三步:登记频数,计算频率,列出频率分布表(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示 ,每个小矩形的面积表示样本落在该组内的频率频 率组 距2茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 3样本的数字特征数字特征 定义众数 在一组数据中,出现次数最多的数据叫做这组数据的众数 中位数将一组数据按大小依次排列,把处在最中
2、间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数在频率分布直方图中,中位数左边和右边的直方图的面积相等平均数 样本数据的算术平均数,即 x x1 x2 xnn方差 s2 (x1 )2( x2 )2( xn )2,其中 s 为标准差1n x x x【考点突破】考点一、茎叶图及其应用2【例 1】某市为了考核甲、乙两部门的工作情况,随机访问了 50 位市民.根据这 50 位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率;(3)根据茎叶图分析该市的市民
3、对甲、乙两部门的评价.解析 (1)由所给茎叶图知,50 位市民对甲部门的评分由小到大排序,排在第 25,26位的是 75,75,故样本中位数为 75,所以该市的市民对甲部门评分的中位数的估计值是 75.50 位市民对乙部门的评分由小到大排序,排在第 25,26 位的是 66,68,故样本中位数为67,所以该市的市民对乙部门评分的中位数的估计值是 67.66 682(2)由所给茎叶图知,50 位市民对甲、乙部门的评分高于 90 的比率分别为0.1, 0.16,故该市的市民对甲、乙部门的评分高于 90 的概率的估计值分别为550 8500.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中
4、位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.【类题通法】1茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2(1)作样本的茎叶图时先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.(2)根据茎叶图中数据数字特征进行分析判断考查识图能力,判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.【对点训练】3以下茎叶图记录了甲、乙两组各五名学生在一
5、次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x y 的值为_. 答案 13解析 由茎叶图及已知得 x5,又乙组数据的平均数为 16.8,即 16.8,解得 y8,因此 x y13.9 15 10 y 18 245考点二、频率分布直方图【例 2】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年 100 位居民每人的月均用水量(单位:吨),将数据按照0,0.5),0.5,1),4,4.5分成 9 组,制成了如图所示的频率分布直方图.(1)求直方图中 a 的值;(2)设该市有 30 万居民,估
6、计全市居民中月均用水量不低于 3 吨的人数,说明理由;(3)估计居民月均用水量的中位数.解析 (1)由频率分布直方图可知:月均用水量在0,0.5)内的频率为0.080.50.04.同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5等组的频率分别为 0.08,0.21,0.25,0.06,0.04,0.02.由 1(0.040.080.210.250.060.040.02)0.5 a0.5 a,解得 a0.30.(2)由(1)知,该市 100 位居民中月均用水量不低于 3 吨的频率为40.060.040.020.12.由以上样本的频率分布,可以估计 30 万
7、居民中月均用水量不低于 3吨的人数为 300 0000.1236 000.(3)设中位数为 x 吨.因为前 5 组的频率之和为 0.040.080.150.210.250.730.5.又前 4 组的频率之和为 0.040.080.150.210.48 y,因此可看出 A 药的疗效更好.(2)由观测结果可绘制如下茎叶图:A 药 B 药6 0 5 5 6 8 98 5 5 2 2 1 1 2 2 3 4 6 7 8 99 8 7 7 6 5 4 3 3 2 2 1 4 5 6 75 2 1 0 3 2 从以上茎叶图可以看出,A 药疗效的试验结果有 710的叶集中在茎 2,3 上,而 B 药疗效的试
8、验结果有 710的叶集中在茎 0,1 上,由此可看出 A 药的疗效更好.【类题通法】1平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式.2平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择.7【对点训练】某车间 20 名工人年龄数据如下表:(1)求这 20 名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这 20 名工人年龄的茎叶图;(3)求这 20 名工人年龄的方差.解析 (1)这 20 名工人年龄的众数为 30;这 20 名工人年龄的极差为 401921.(2)以十位数为茎,个位数为叶,作出这 20 名工人年龄的茎叶图如下:(3)这 20 名工人年龄的平均数为(1928329330531432340)2030;所以这 20 名工人年龄的方差为(3019) 2 (3028) 2 (3029) 2 (3030) 2 (3031) 2 (3032)120 320 320 520 420 3202 (3040) 212.6.120