1、第五章 数据的收集与处理5.1 每周干家务活的时间一、教学目标:1、 经历调查、收集数据的过程,感受抽样的必要性。2、 了解普查、抽样调查、总体、个体、样本等概念,了解普查和抽样调查的应用,并选择合适的调查方法,解决有关现实问题。3、 进一步发展统计意识,培养学生热爱劳动、勇于实践的优良品质。二、教学过程:1、活动与探究同学们,你们每天在家都帮父母做家务活吗?主要做些什么呢?每周大约多长时间呢?你们每周干家务活时间的平均数、中位数、众数是什么?2、介绍新知识(1)普查:为了一定的目的而对考察对象进行的全面调查。(2)总体:所考察对象的全体。(如上述问题中的总体为“全班同学每周干家务活的平均时间
2、的全体”,注意这里“考查对象”不是学生而是学生干家务活的时间。)(3)个体:组成总体的每一个考察对象。(如上述问题中的个体为“全班每一个同学每周干家务活的平均时间”)3、想一想为了准确了解全国人口状况,我国每 10 年进行一次全国性人口普查,在这一事例中,你能说出总体、个体分别是什么吗?5.2 数据的收集一、教学目标1.会采取合理的调查方法收集数据,并能对数据进行加工、整理.2.进一步了解、掌握抽样调查与普查各自的优、缺点.二、教学过程1.例题讲解为了了解你所在地区老年人的健康状况,你准备怎样收集数据?下面分别是小明、小颖、小华三位同学的调查结果: 小明:在公园里调查了 1000 名老年人,他
3、们一年中生病的次数如下表:表(一)比较一下上述两种表示各自的优越性.小颖:在医院调查了 1000 名老年病人,他们一年中生病的次数如下表所示: (表一)比较一下小明与小颖所得数据的差别,是什么原因造成的?小华:调查了 10 名老年邻居,他们一年中生病的次数如下表所示: 小明调查的对象选自公园里的老年人.常去公园里活动的老年人,平时一定注意身体的保健,一定注意修身、养性、加强体育锻炼,所以身体较健康.另一方面,公园建在城市里,相对于农村中的老年人去公园的较少.这 1000 人中不同文化程度,不同职业,城市和乡村等等不同层次的老人是否都有所选取.选取人数的比例是否合理,是否具有代表性与广泛性都是我
4、们在收集数据中应该考虑的.所以,我认为小明收集的数据缺乏代表性和广泛性.小颖收集的数据来自医院看病的 1000 名老年人.这部分人相对体质较弱.我认为用这些数据得到的调查结果不准确.因为收集的数据缺乏代表性和广泛性.小华仅仅调查了 10 位老年人.因为样本太小了,所以不能据此推断某地区老年人的健康状况.抽样调查应注意什么?抽样时要注意样本的代表性和广泛性.在现实生活中,当我们所要考察的总体中包含的个体数很多,有时总体中个数较多且总体有明显差异的几个部分组成时,我们应注意抽出的样本就必须有较强的代表性.每个部分都应抽取到,而且应注意各部分的比例.广泛性是指总体中的每个个体均有被选的可能.5.3
5、频数与频率(一)一、教学目标1.掌握频数、频率的概念.2.会求一组数据的频数与频率.二、教学过程1.例题讲解下面是小亮调查的八(1)班 50 位同学喜欢的足球明星,结果如下: 根据上面结果,你能很快说出该班同学最喜欢的足球明星吗?他的数据表示方式是什么?你能设计出一个比较好的表示方式吗? (二)此种表示方式的优点是简单明了,一眼可以看出哪个最多、哪个最少.我们小组采用如下方式表示数据.此种表示方式的优点是直观,一目了然.不仅可以很快判断出哪个最多,哪个最少,还可比较出差别是否悬殊很大.从上表可以看出,A、B、C、 D 出现的次数有的多,有的少,或者说它们出现的频繁程度不同.我们称每个对象出现的
6、次数为频数(absolute,frequency).而每个对象出现的次数与总次数的比值为频率(relative frequency).分别计算 A、B、C、D 的频数与频率.A 的频数为 23,A 的频率为 .5023B 的频数为 8,B 的频率为 .4C 的频数为 13,C 的频率为 .5013D 的频数为 6,D 的频率为 .2三、课堂练习1.设计一个方案,了解你们班同学最喜欢的科目是哪科,为什么喜欢?分析:先列表,再统计,调查探讨喜欢的原因.调查不爱学的那门科目的原因.(课后完成)列表如下科目 语文 数学 英语 历史 地理 政治 物理 美体学生数频数频率你还能用什么方式表示上表所收集数据
7、的内容.可以用上例中的图(三)表示的形式,这种图叫频数分布直方图,可不可以用频率分布来表示,如何表示。阅读(利用频率绘制的图)2.议一议: 小明、小亮从同一本书中分别随机抽取了 6 页,在统计了 1 页、2 页、3 页、4 页、5页、6 页的“的”和“了”出现的次数后,分别求出了它们出现的频率,并绘制了下图随着统计页数的增加,频率在 0.05 至 0.06 之间变化的字是“的”字.“了”字的频率在 0.005 至 0.015 之间变化。的使用的频率比了字高3.做一做(1)为了了解中学生的身体发育情况,对某中学同年龄的 60 名女学生的身高进行了测量.结果如下.(单位:厘米)158 167 15
8、4 159 166 169 159156 166 162 159 156 166 164160 157 156 160 157 161 158158 153 158 164 158 163 158153 157 162 162 159 154 165166 157 151 146 151 158 160165 158 163 162 161 154 163165 162 162 159 157 159 149164 168 159 153我们知道,这组数据的平均数,反映了这些学生的平均身高.但是,有时只知道这一点还不够,还希望知道身高在哪个范围内的学生多,在哪个小范围内的学生少,也就是说,希望
9、知道这 60 名女学生的身高数据在各个小范围内所占的比的大小。 频率分布表落在各个小组内的数据的个数叫做频数.小结:整理数据时,可以按照下面的步骤进行.(1)计算最大值与最小值的差.(2)决定组距与组数.(3)决定分点(4)列频率分布表.频数与频率(二)一、教学目标1.如何收集与处理数据.2.会绘制频数分布直方图与频数分布折线图.3.了解频数分布的意义,会得出一组数据的频数分布.二、教学过程1.如何收集与处理数据.(1)首先通过确定调查目的,确定调查对象.(2)收集有关数据.(3)选择合理的数据表示方式统计数据.(4)根据所收集的数据进行数据计算.根据特征数字,估计总体情况,设计可行的计划与方
10、案,并不断实施与改进方案.2.例题你能否帮卖雪糕的李大爷设计一种方案,确定各种牌子的雪糕应进多少?首先应开展调查.统计一下李大爷每天卖出的 A、B、C 、D、E 五个牌子雪糕的数量。这是小丽统计的最近一个星期李大爷平均每天能卖出的 A、B、C、D、E 五个牌子雪糕的数量。雪糕 数量 频数 频率A 131 131 0.253B 182 182 0.351C 68 68 0.131D 39 39 0.075E 98 98 0.190合计 518 518 1.000根据上表绘制一张频数分布直方图.(如下)根据小丽的统计结果,为李大爷设计一个进货方案,A、B 两种雪糕卖出的较多,可以多进些,D 种雪糕
11、卖出的少,可以少进些。 A 占总数的 25%,B 占总数的 35%,C 占总数的 13%,D 占总数的 8%,E 占总数的 19%.确定进货的总数,还应考虑,当天气温情况,天气凉,气温低时少进货.天气热,气温高时多进货,即进雪糕总数应考虑当天气温变化.不能每天都进 518 支雪糕。3.做一做例学校要为同学们订制校服,为此小明调查了他们班 50 名同学的身高,结果(单位 cm).如下: 141 165 144 171 145 145 158150 157 150 154 168 168 155155 169 157 157 157 158 149150 150 160 152 152 159 1
12、52159 144 154 155 157 145 160160 160 158 162 155 162 163155 163 148 163 168 155 145172填写下表,并将上述数据用适当的统计图表示出来.5.4 数据的波动一、教学目标1经历通过数据离散程度表示数据波动的探索过程. 2了解刻画数据离散程度的三个量度极差、标准差和方差,能借助计算器求出相应的数值,并在具体问题情境中加以应用3通过实例体会用样本估计总体的思想二、教学过程 1极差实际生活中,除了关心数据的“平均水平”外,人们往往还关注数据的离散程度,即它们相对于“平均水平”的偏离情况极差就是刻画数据离散程度的一个统计量极
13、差是指一组数据中最大数据与最小数据的差2方差与标准差方差是各个数据与平均数之差的平方的平均数,即 S2= 221()()xxn21()x标准差是方差的算术平方根一般而言,一组数据的极差,方差或标准差越小,这组数据就越稳定方差是各个数据与平均数之差的平方的平均数,即 S2= 221()()xxn21()x21()x例 1 已知两组数据:甲 9.9 10.3 9.8 10.1 10.4 10 9.8 9.7乙 10.2 10 9.5 10.3 10.5 9.6 9.8 10.1分别计算这两组数据的方差与极差于是,s2 甲 81(9.910) 2( 10.310) 2(9.710) 2 (0.010
14、.090.09 ) 810.440.055;s2 乙 (10.210) 2( 1010) 2(10.110) 2 81(0.0400.01) 0.840.105极差:甲的极差:10.49.70.7 乙的极差:10.59.51由方差与极差可以看出甲组数据比乙组数据波动小例 2 甲、乙两班举行电脑汉字输入速度比赛,参加学生每分钟输入汉字的个数经统计计算后填入下表:班级 参加人数 中位数 方差 平均字数甲班 55 149 191 135乙班 55 151 110 135(1)根据上表分析甲、乙两班学生成绩的平均水平;(2)根据上表分析甲、乙两班优秀的人数并进行比较(每分钟输入汉字数150 个为 优秀
15、) ;(3)根据上表分析甲、乙两班的成绩哪个更稳定?谁的波动大?解:(1)平均水平相同(2)甲班优秀的人数少于一半,而乙班的优秀人数多于一半(3)乙班更稳定,甲班的波动大三、课堂练习迁移运用本节内容解决下面问题:甲、乙两位同学本学年每个单元的测验成绩如下(单位:分):甲:98,100,100,90,96,91,89,99,100,100,93乙:98,99,96,94,95,92,92,98,96,99,97(1)他们的平均成绩分别是多少?解: x甲 (98100100909691899910010093)96乙 1(9899969495929298969997)96(2)甲、乙的 11 次单
16、元测验成绩的标准差分别是多少?解: s2 甲 (9896) 2(10096) 2(9396) 217.82 s 甲 4.221s2 乙 1(9896) 2(9996) 2(9796) 25.817 s 乙 2.412(3)这两位同学的成绩各有什么特点?解:乙较甲稳定,甲虽然状态不稳定,但发挥好时成绩比乙优秀(4)现要从中选出一人参加“希望杯”竞赛,历届比赛成绩表明,平时成绩达到 98分以上才可能进入决赛,你认为应选谁参加这项竞赛,为什么?解:选甲去,甲比乙更有可能达到 98 分发散本节课用到了平均数、中位数、众数等概念,你还记得吗?1平均数: x n1( x1 x2 xn)2中位数:把一组数据从小到大排列、中间位置的一个数据(或最中间的两个数据的平均数)叫这组数据的中位数3众数:一组数据中出现次数最多的数据叫这组数据的众数