1、2.2 用样本估计总体(一)知识探究(一): 频率分布表 【问题】 我国是世界上严重缺水的国家 之一,城市缺水问题较为突出,某市政 府为了节约生活用水,计划在本市试行 居民 生活用水定额管理,即确定一个居 民月用水量标准a,用水量不超过 a 的部 分按平价收费,超出 a 的部分按议价收费. 通过抽样调查,获得100 位居民 2007 年的 月均用水量如下表(单位:t):3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5
2、3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2思考 1:上述 100 个数据中的最大值和最小值
3、分别是什么?由此说明样本数据的变化范围是什么? 0.24.3思考 2:样本数据中的最大值和最小值的差称为极差.如果将上述 100 个数据按组距为 0.5进行分组,那么这些数据共分为多少组? (4.3-0.2)0.5=8.2思考 3:以组距为 0.5 进行分组,上述 100 个数据共分为 9 组,各组数据的取值范围可以如何设定?0,0.5),0.5 ,1),1,1.5),4 ,4.5.思考 4:如何统计上述 100 个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?思考 5:上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况,给市政
4、府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?用样本的频率分布估计总体分布.思考 6:如果市政府希望 85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即 a 的取值)有何建议?88%的居民月用水量在 3t 以下,可建议取 a=3. 1.0合 计 24, .5 .43, ) 6, . 0.12, 25, .5) .1, . 0.80, ) 4, .5频 率频 数频 数分 组合 计, , , , , 频 率频 数频 数分 组思考 7:在实际中,取 a=3t 一定能保证 85%以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?分组时,组距
5、的大小可能会导致结论出现偏差,实践中,对统计结论是需要进行评价的. 思考 8:对样本数据进行分组,其组数是由哪些因素确定的?思考 9:对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多. 思考 10:一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?第一步,求极差.第二步,决定组距与组数.第三步,确定分点,将数据分组.第四步,列频率分布表.知识探究(二): 频率分布直方图 思考 1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示: 思考 2:
6、频率分布直方图中 小 长 方 形 的 高 组 距频 率小长方形的面积表示什么?小长方形的面积表示该组的频率所有小长方形的面积和?所有小长方形的面积和1思考 3:频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来.你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.思考 4:样本数据的频率分布直方图是根据频率分布表画出来的,
7、一般地,频率分布直方图的作图步骤如何?第一步,画平面直角坐标系. 第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.月 均 用 水 量 /t频 率组 距0.54.320.1.5 1. 2.5 3. 4.5 O课堂练习1 有一个容量为 50 的样本数据的分组及各组的频数如下:12.5, 15.5) 3 24.5, 27.5) 1015.5, 18.5) 8 27.5, 30.5) 518.5, 21.5) 9 30.5, 33.5) 421.5, 24.5) 11列出样本的频率分布表和画出频率分布直方图;根据样本的频
8、率分布估计,小于 30.5 的数据约占多少? 2 (2006 年全国卷 II)一个社会调查机构就某地居民的月收入调查了 10 000 人,并根据所得数据画了样本的频率分布直方图(如下图) 为了分析居民的收入与年龄、学历、职业等方面的关系,要从这 10 000 人中再用分层抽样方法抽出 100 人作进一步调查,则在2500,3000 (元)月收入段应抽出 25 人3.某班 50 名学生在一次百米测试中,成绩全部介于 13秒与 19 秒之间,将测试结果按如下方式分成六组:第一组,成绩大于等于 13 秒且小于 14 秒;第二组,成绩大于等于 14 秒且小于 15 秒; 第六组,成绩大于等于 18 秒
9、且小于等于 19 秒右图是按上述分组方法得到的频率分布直方图设成绩小于 17 秒的学生人数占全班总人数的百分比为 x,成绩大于等于 15 秒且小于 17 秒的学生人数为 y,则从频率分布直方图中可分析出 x和 y分别为( A )A0.9,35 B0.9 ,45C0.1,35 D0.1 ,454 ( 2006 年重庆卷)为了了解某地区高三学生的身体发育情况,抽查了该地区 100 名年龄为 17.5 岁岁的男生体重(kg) ,得到频率分布直方图如下:0 13 14 15 16 17 18 19 秒频率/组距0.360.340.180.060.040.020.00010.00020.00030.00
10、040.00051000 1500 2000 2500 3000 3500 4000月收入(元)频率/组距0.30.14.3 4.4 4.5 4.6 4.7 4.8 4.9 5.0 5.1 5.2视力频 率组 距根据上图可得这 100 名学生中体重在56.5,64.5的学生人数是 ( C)(A)20 (B)30 (C)40 (D)505.(广东文 7、艺术理 6)下面左图是某县参加 2007 年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为 A1、 A2、A 10(如 A2 表示身高(单位:cm)(150,155)内的学生人数).右图是统计左图中身高在一定范围内学生人数的一个
11、算法流程图.现要统计身高在 160180cm(含 160cm,不含 180cm)的学生人数,那么在流程图中的判断框内应填写的条件是(B)A.i9 B. i8 C. i7 D. i66.为了解某校高三学生的视力情况,随机地抽查了该校 100 名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前 4 组的频数成等比数列,后 6 组的频数成等差数列,设最大频率为 a,视力在 4.6 到 5.0 之间的学生数为 b,则 a, b的值分别为( A )A0,27,78 B 0,27,83C2.7,78 D 2.7,83小结作业1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况.作业:习案作业十八