1、6.32 方差与标准差平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断,某地区的统计报表显示,此地区的年平均家庭收入是 10 万元,给人的印象是这个地区的家庭收入普遍较高.但是,如果这个平均数是从 200 户贫困家庭和 20 户极富有的家庭收入计算出来的,那么,它就既不能代表贫困户家庭的年收入,也不能代表极富有家庭的年收入.因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.案例探究甲、乙两班学生各 50 人,其语文平均成绩都是 80 分,但甲班最高成绩 98 分,最低42 分,而乙班最高成绩 8
2、6 分,最低 60 分.初步看出,两班语文成绩是不一样的,甲班学生的语文成绩个别差异程度大、水平参差不齐;而乙班学生的语文成绩差异程度小,语文水平整齐度大些.如果你是老师,你应当如何对这两个班的成绩作出评价呢?分析:我们把一组数据的最大值与最小值的差称为极差,由数据可知甲班的极差较大,数据点较分散,乙班的极差较小,数据点分布较集中,这说明乙班成绩比甲班稳定,运用极差对两组数据进行比较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.我们还可以考虑每一个学生的成绩与平均成绩的离差,离差越小,稳定性就越高.结合上节有关离差的讨论,可用每个同学的成绩与平均成绩的差的平方和表示.由
3、于两组数据的容量可能不同,因此应将上述平方和除以数据的个数,我们把由此所得的值称为这组数据的方差(variance).因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差开方后的值称为这组数据的标准差(standard deviation).标准差也可以刻画数据的稳定程度 .一般地,设一组数据 x1,x 2,x n,其平均数为 x,则称 S2= 为这个niix12)(样本的方差,其算术平方根S= (*)nxnii12)(为样本的标准差,分别简称样本方差、样本标准差.根据上述方差计算公式可算出甲、乙两个班样本的方差,从而比较哪个班成绩好些.计算标准差时,首先要计算数据的平均数
4、,接着要计算各数据与平均数之间的离差x平方,即(x i- ) 2,最后由公式(*)计算标准差 S.x例如,4 名儿童的身高分别是 110 厘米,100 厘米,120 厘米和 150 厘米,若求 4 名儿童身高数据的标准差时,其基本步骤如下:(1)求平均数: = =120(厘米)x4150210(2)求离差平方和:(x i- ) 2=(110120) 2+(100120) 2+(120120) 2+(150120) 2=100+400+0+900=1 400(平方厘米)(3)求标准差 S:S= = =18.71(厘米)41035这样,我们大体可认为,这 4 名儿童身高差异程度,从平均角度来看,约
5、相差 18.71厘米.自党导引1天气预报说今天最高气温 7 ,最低气温2 ,则今天气温的极差为多少?答案:92据统计,某小区居民中年龄最大的为 89 岁,年纪最小的为 1 岁,那么小区人口年龄的极差为多少?答案:88 岁3你认为下面几种说法中正确的是( )A一组数据的平均值总是正数B一组数据的方差有可能是负数C用一组数据中的每个数分别减去平均值,再将得到的差相加,和一定为零D一组数据的标准差一定比方差小答案:C4我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围.用这种方法得到的差称为极差.5方差实际上是一种表示一组数据的离散程度的量,我们可以用“先平均,再求差,然后平方,
6、最后再平均”的方法得到.6标准差与方差有什么关系?这二者与原数据在单位上有什么关系?答案:标准差是方差的算术平方根,标准差与原数据具有相同的单位,方差的单位是原单位的平方.7反映数据离散程度的指标是什么?在一次数学测试中,甲、乙两班的平均成绩相同,甲班成绩的方差为 42,乙班成绩的方差为 35,这样的结果说明两个班的数学学习状况各有什么特点?答案:反映数据离散程度的指标是方差和标准差甲班的方差大于乙班的方差,说明甲班的学生成绩较分散,优生和成绩差的学生较多而乙班的学生成绩较集中,优生和成绩差的学生较少.8观察下面的折线图,回答问题:(1)a 组数据的极差较大.(2)a 组数据的方差较大.9比较
7、下面两幅频数分布图中的数据,哪组的平均值较大?哪组的标准差较大?答案:b 组的平均值较大,a 组的标准差较大.10观察下面的几组图,分别指出各组中哪一组的标准差较大,并说说为什么.(1)(2)(3)答案:(1)标准差相同,因为虽然数据排列不同,但其实是相同的两组数据;(2)b 组的标准差较大,因为 a 组有一些数距离平均值较近;(3)b 组的标准差较大,因为 b组中每个数据都是 a 组中的两倍,因此标准差也是它的两倍.疑难剖析【例 1】 某校团委举办了英语口语竞赛甲、乙两个团小组成绩如下:甲组:76 90 84 86 81 87 86乙组:82 84 85 89 80 94 76(1)分别求出
8、甲、乙两个团小组的平均分、标准差(精确到 001) ;(2)说明哪个团小组成绩比较稳定?思路分析:由于所给数据较整,用定义公式求 x 及 S再由所学统计知识即可作此判断.解:(1) =84.29,786186490761 x=84.29,77694805842x ,23.4)86()7()81()()()9()76( 12122212111 xxxxxxS ,7.57)()94()0()98()5()84()2( 222222 xxxx(2)S 1S 乙 2,虽然甲乙两人的平均成绩相同,但乙的成绩较稳定,应选乙选手参加比赛.思维启示:在显示数据离散程度(波动大小)的一类数中,方差是刻画总体或样
9、本波动大小的一个重要特征数据,其定义是用各偏差的平方的平均数建立起来的,对于一组数据,除需了解它们的平均水平外,还常常需要了解它们的波动大小(即偏离平均数的大小).对于两组可比的数据,平均数只能反映它们的集中趋势,而比较它们的波动大小,就要通过计算标准差或方差的大小来确定.还应注意,只有当两组数据的平均数相等或比较接近时,方差或标准差才能反映数据波动大小的实际情况方差或标准差越大(小) ,波动也越大(小).【例 3】 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的 100 只日光灯在必须更换掉前的使用天数如下表:天数 151181181210211240241270
10、271300301330331360361390灯管数 1 11 18 20 25 16 7 2(1)试估计这种日光灯的平均使用寿命;(2)若定期更换,可选择多长时间统一更换合适?思路分析:总体的平均数与标准差往往是很难求,甚至是不可能求的,通常的做法就是用样本的平均数与标准差去估计总体的平均数与标准差,只要样本的代表性好,这种做法就是合理的.解:(1)各组中值分别为 165,195,225,255,285,315,345,375,由此可算得平均数约为+ =267.926810258258956 102375463(天).(3)将组中值对于此平均数求方差:=2 128.60(天 2)2222)
11、68375()68345(71201)9()(0故标准差为 46(天).答:估计这种日光灯的平均使用寿命约为 268 天,故可在 222 天到 314 天左右统一更换较合适.思维启示:(1)在刻画样本数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.(2)平均数和标准差是工业生产中检测产品质量的重要指标,当样本的平均数或标准差超过了规定界限的时候,说明这批产品的质量可能距生产要求有较大的偏离,应该进行检查,找出原因,从而及时解决问题.在 Excel 中,可分别用函数 “VARP( ) ”和“STDEVP( ) ”计算方差和标准差.也可用计算器,在“统计” 模式下输入
12、数据,按“SHIFT SVAR 2”键,得标准差,再按 x2 键即为方差.拓展迁移【拓展点 1】 标准差的取值范围是什么?标准差为 0 的样本数据有什么特点?答案:非负,标准差为 0 意味着所有的样本数据都相等.【拓展点 2】 甲乙两人同时生产内径为 25.4mm 的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各抽取 20 件,量得其内径尺寸如下(单位 mm):甲25.46 25.32 25.45 25.39 25.36 25.3425.42 25.45 25.38 25.42 25.39 25.4325.39 25.40 25.44 25.40 25.42 25.3525.41
13、 25.39乙25.40 25.43 25.44 25.48 25.48 25.4725.49 25.49 25.36 25.34 25.33 25.4325.43 25.32 25.47 25.31 25.32 25.3225.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?思考:两个总体的平均数与标准差知不知道?25.40 mm 是不是它们的平均数?答案:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出(内径 25.40mm) ,生产质量可以从总体的平均数与标准差两个角度来衡量 .总体的平均数与内径标准尺寸 25.40 mm 的差异大时质量低,差异小时质量高,当总体的平均数与标准尺寸很接近时,总体的标准差小时质量高,标准差大时质量低.这样,比较两人的生产质量,只要比较他们所生产的零件尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值. 甲 =25.400 5, 乙 =25.405 5,xxS 甲 0.037,S 乙 0.068,S 甲 S 乙 .因此,甲生产的质量较高.