1、总体特征数的估计,复习回顾,1.算术平均数的概念,2.平均数的计算方法,定义法,已知频数求平均数,在给定的一组数据中,已知数据出现的频数,或有些数据重复出现,则选用频数平均数公式:,已知频率求平均数,3.平均数的意义,平均数反映了一组数据的集中趋势,它是一组数据的“重心”,是度量一组数据波动大小的基准.,4.平均数的性质,课堂练习,问题背景,有甲、乙两种钢筋,现从中各抽取一个样本检查它们的抗拉强度(单位:kg/mm),哪种钢筋的质量较好?,通过计算发现,两个样本的平均数均为125.,将甲、乙两个样本数据分别标在数轴上,如图所示,可以看出,乙样本的最小值100低于甲样本的最小值110,最大值14
2、5高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定,我们把一组数据的最大值与最小值的差称为极差.,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.,运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论,还可以考虑每一抗拉强度与平均抗拉强度的离差,离差越小,稳定性就越高.结合上节有关离差的讨论,可用各次抗拉强度与平均抗拉强度的差的平方和表示.由于两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差.,2.方差与标准差,(1)方差的定义,在一组数据 中,各数据与它们平均数
3、的差的平方和的平均数,叫做这组数据的方差.,通常用“s2”表示方差:,基本公式,(2)方差的计算,简化计算公式:,设一组样本数据 ,其平均数 为 ,则称 为这个样本的方差, 其算术平方根 为样本的 标准差,方差可以刻画数据的稳定程度,标准差也可以刻画数据的稳定程度.,两者单位不同,标准差的单位与原数据的单位相同.,例1:甲、乙两种冬水稻试验品种连续年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定,乙品种的样本平均数也为10,样本方差为(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)25=0.24,因
4、为0.240.02,所以,由这组数据可以认为甲种水稻的产量比较稳定,解: 甲品种的样本平均数为10,样本方差为(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)25=0.02,例2.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差,分析用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命,答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天,(1)数据x1+a,x2+a,xn+a的平均数为_ ,方差为_.,已知数据x1,x2,x
5、n的平均数为 ,方差为s2.,(2)数据2x1,2x2,2xn的平均数为_ ,方差为_.,s2,4s2,(3)数据2x1-5,2x2-5,2xn-5的平均数为_ ,方差为_.,4s2,(4)数据kx1-b,kx2-b,kxn-b的平均数为_ _ ,方差为 _ _,标准差为_.,k2s2,拓展延伸:,应用,1.从两个车间生产的长度为8mm的零件中各抽样检查10个零件,甲车间的为:8.11, 8.22, 7.89, 7.98, 8.01, 7.82, 8.05, 8.03, 7.90, 7.78乙车间的为:7.95, 8.02, 8.11, 8.03, 8.20, 7.98, 8.01, 8.02
6、, 7.95, 7.94,(1)计算样本的平均长度;,(2)哪个两个车间生产的稳定性高?,(3)若允许这种零件有0.5的离差,那么两个车间产品的合格率约为多少?,8(1 0.5 )7.96 , 8(1 +0.5 )8.04,2.为了了解灯泡(10000只)的使用寿命,从中抽取100只进行测试,其使用寿命如下表:,(1)制作频率分布表;(2)绘制频率分布直方图;(3)根据样本的频率分布,估计使用寿命不低于1000h的灯 泡约有多少只.(4)根据样本的频率分布,估计使用寿命低于850h的灯泡 约有多少只.,作业: 上本作业 P69: 3,5 课时作业 P43-44,新数据法,当所给的一组数据都在某一个常数a的上下波动,一般选用简化公式: ,其中常数 a 通常取接近于这组数据的平均数的较“整”的数.,是新数据的平均数.,