1、2.3 总体特征数的估计2.3.1 平均数及其估计整体设计教材分析教科书中着重介绍了利用频率分布直方图估计总体众数,总体中位数和总体平均数,为我们提供了估计总体分布数字特征的新思路.在教学过程中,结合实际问题要着重分析引导学生注意对样本平均数概念的理解.与众数和中位数相比,平均数代表了数据的更多信息.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息.三维目标1.通过具体事例体会平均数的意义,掌握平均数等数据代表的概念,能根据所给信息求出相应的数据代表.2.能
2、用样本的平均数估计总体的平均数,并结合实际,对问题作出合理判断,制定解决问题的有效方法.3.通过观察事例和解决实际问题的过程,让学生感知样本的特征数据,引出概念,并在这一基础上培养学生正确认识客观世界,使学生体会知识之间的有机联系,感受数学的整体性,激发学生的学习兴趣.4.通过对有关数据的搜集、整理、分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.5 初步体会、领悟“用数据说话”的统计思想方法.重点难点教学重点:1.对样本平均数的意义的理解,及如何用样本数据计算其平均值.2.根据实际问题在样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征.教学难点:体会样本数字特征
3、的随机性.课时安排1 课时教学过程导入新课设计思路一:(实例导入)某校高一(1)班同学在老师的布置下,用单摆进行测试,以检查重力加速度.全班同学两人一组,在相同条件下进行测试,得到下列实验数据(单位:m/s 2):问题:怎样利用这些数据对重力加速度进行估计?设计思路二:(情境导入)根据课本第 2.2 节开头的数据,还可以求出北京地区近年来 7 月 25 日至 8 月 10 日的日最高气温的样本平均值为 34.02,我们可将其作为北京地区近年来 7 月 25 日至 8 月 10 日的日最高气温平均值的估计.推进新课新知探究我们常用算术平均数 其中 ai(i=1,2,,n)为 n 个实验数据作为重
4、力加速度ni1的“最理想”的近似值,它的依据是什么呢?处理实验数据的原则是使这个近似值与实验数据之间的离差最小.设这个近似值为 x,那么它与 n 个实验数据 ai(i=1,2,n)的离差分别为 xa 1, xa 2,xa 3,xa n.由于上述离差有正有负,故不宜直接相加.可以考虑离差的平方和,即(x-a 1) 2+(x-a2)2+(x-an)2.因为(x a1)2+(xa 2)2+(xa n)2=nx22(a 1+a2+an)x+a12+a22+an2,所以当 x=时,离差的平方和最小,故可用 作为表示这个物理量n. .的理想近似值.若给定一组数据 x1,x2,xn,则称 = (i=1,2,
5、,n)为这组数据 x1,x2,xn 的平xni1均数(average)或均值(mean ).当所给数据中没有重复数据时,我们一般用此公式来求这组数据的平均数.这里= (x1+x2+xn).平均数反映了一组数据的集中趋势,我们常用一组数据的平均nix1数来衡量这组数据的水平.当一组数据中的重复数据过多时,若用上面过程求这组数据的平均数,其过程就会显得比较复杂和冗长,为了简化计算过程,我们引入下面这种计算平均数的方法:一般地,若取值为 x1,x2,xn 的频率分别为 p1,p2,pn,则其平均数为x1p1+x2p2+x npn.这一公式实质上就是公式的一个变形,它主要用于含有重复数据的数据组求平均
6、数.应用示例例 1 如果 a,b,c,d 的平均值为 10,则数据 2a+1,2b+1,2c+1,2d+1 的平均值为_.分析:根据平均数的定义可求得.解:因为 ,所以 a+b+c+d=40,又4dba40+1=21.214)(21)2()1(2 dcbac答案:21点评:由此可推得平均数的一些性质:数据 x1,x2,xn 的平均数为 .x(1)数据 x1a,x 2a,x na 的平均数为 a.(2)数据 kx1,kx2,kxn 的平均数为 k .x(3)数据 kx1+b,kx2+b,kxn+b 的平均数为 k +b.x例 2 某校高一年级的甲、乙两个班级(均为 50 人)的语文测试成绩如下(
7、总分:150 分) ,试确定这次考试中,哪个班的语文成绩更好一些.甲班 分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的平均分即可.解:用计算器分别求出甲班的平均分为 101.1, 乙班的平均分为 105.4,故这次考试乙班成绩要好于甲班.点评:此例是应用数学理论进行统计分析的第一个实例(前面的内容没有充分体现数学知识和方法在统计分析中的作用) ,要让学生充分感受这一点.例 3 下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该学生的日平均睡眠时间.分析:要确定这 100 名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡眠时间只是一个
8、范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为 6.255+6.7517+7.2533+7.7537+8.256+8.752=739(h) ,故平均睡眠时间约为 7.39 h.解法二:求组中值与对应频率之积的和6.250.05+6.750.17+7.250.33+7.750.37+8.250.06+8.750.02=7.39(h).答:估计该校学生的日平均睡眠时间约为 7.39 h.点评:通过此例介绍“组中值”的概念,使学生掌握在连续型分布问题中,用样本估计总体的方法.教学时要由频率分布直方图作密度曲线的方法,启发学生发现用“组中值”对某区间段进行估计的思路.同时,还应让学生了
9、解, “组中值”只是一种近似估计.此例作为连续型分布的平均水平的估计的实例,实际上是对用“积分”研究统计问题的思想方法的渗透,教师对此应有认识.例 4 某单位年收入(单位:元)在 10 000 到 15 000、15 000 到 20 000、20 000 到 25 000、25 000 到 30 000、30 000 到 35 000、35 000 到 40 000 及 40 000 到 50 000 元之间的职工所占的比分别为 10%,15%,20%,25% ,15%,10%和 5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组的频率.解:估计该单位职工的平均年收入为 12 50
10、010%+17 50015%+22 50020%+27 50025%+32 50015%+37 50010%+45 0005%=26 125(元).答:估计该单位人均年收入约为 26 125 元.点评:充分体会利用第二个求平均数公式的简便之处.例 5 个体户李某经营一家快餐店,下面是快餐店所有工作人员 8 月份的工资表:(1)计算所有人员 8 月份的平均工资;(2)计算出的平均工资能否反映打工人员这个月收入的一般水平?为什么?(3)去掉李某的工资后,在计算平均工资时,这能代表打工人员当月的收入水平吗?(4)根据以上计算,以统计的观点,你对(3)的结果有什么看法?分析:此题与生活关系比较密切,所
11、以由学生自主讨论.解:(1)平均工资 =464.3(元) ;741032403530x(2)计算出的平均工资不能反映打工人员这个月收入的一般水平,可以看出,打工人员的工资都低于该平均工资,因为这 7 个值中有一个异常值(李某的工资特别高) ,所以他的工资对总的平均工资的影响较大,同时他也不是打工人员.(3)去掉李某的平均工资 (450+350+400+320+320+410)=375(元).612x该平均工资能代表一般打工人员当月的收入水平.(4)从本题的计算可见,个别特殊值对平均数有很大的影响,因此在选择样本时,样本中尽量不用特殊数据.点评:由本例可知选择样本要注意一般性. 知能训练课本本节
12、练习解答:1.留给学生去探究.2.估计这批灯泡的平均使用寿命为:5001%+6004%+7008%+80015%+90020%+1 00024%+1 10018%+1 2007%+1 3002%+1 4001%=947(h).3. (102+105+98+97)=108.25.201x4.(1)2 (2)2 (3)2课堂小结1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数) ,会用样本的基本数字特征估计总体的基本数字特征;2.平均数对数据有“取齐” 的作用,代表一组数据的平均水平;3.形成对数据处理过程进行初步评价的意识.作业课本习题 2.3 1、2、4、6.设计感想此概念学生比较熟悉,所以需教师点拨之处不多,只要在“处理实验数据的原则是使这个近似值与实验数据之间的离差最小.设这个近似值为 x,那么它与 n 个实验值 ai(i=1,2,n)的离差分别为 xa 1,xa 2,x a 3,xa n.由于上述离差有正有负,故不宜直接相加.可以考虑离差的平方和,即(x a1)2+(xa 2)2+(xa n)2=nx22(a 1+a2+a n)x+a12+a22+an2,所以当 x= 时,离差的平方和最小,此处需教师加以解.释,其他基本上可以以学生自主学习为主.