1、2014 年高中数学 第一章 统计 知识解析数据的数字特征素材 北师大版必修 3数据的数字特征-课文知识点解析 要点提炼1.众数、中位数、平均数在教材所给问题中,甲组数据的中位数是 (18+22)21=20;众数是 10、18、30;平均数是 22.2.乙组数据的中位数是(27+31)=29;众数是 23、24;平均数是 28.6.21我们再看下面的例子:假设我们通过抽样,获得了某城市 100 位居民 2003年的月均用水量(单位:t).3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2. 2 1.5 1.2 0.2 0.4 0.3 0.4
2、3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.42 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32. 6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1
3、.2 1.8 0.6 2.2作出这些样本数据的频率直方图. 频 率 组 距月 均 用 水 量 (t)0.500.400.300.200.100.5 1 1.5 2 2.5 3 3.5 4 4.50如果有 n 个数 x1,x2,xn,那么它们的平均数为 x= (x1+x2+xn).1全析提示一组数据的众数、中位数、平均数既可以由计算得出,也可以在数据的频率直方图中显现出来.在图151 中我们能更容易地理解它们的意义和作用.图 141从图 141 中可以看出月均用水量的众数是 2.25 t(最高矩形的中点).这组数据的中位数可经计算求得为 2,那能否从频率分布直方图中估计中位数呢?我们知道在这组数
4、据中有50%的数小于或等于中位数,也有 50%的数大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.由此可以估计中位数的值(如图 142 虚线处代表中位数的估计值).由图 142 显示,大部分居民的月均用水量在中部,但也有少数居民的月均用水量特别高,因此,应该对这部分居民的用水量作出合理限制. 频 率 组 距月 均 用 水 量 (t)0.500.400.300.200.100.5 1 1.5 2 2.5 3 3.5 4 4.50图 142居民月均用水量的平均数可由公式x= (x1+x2+x100)求得 x=1.973.在频率分布直方图中,0平均数是“重心” ,
5、也可以显示出来,如图 143.频 率 组 距月 均 用 水 量 (t)0.500.400.300.200.100.5 1 1.5 2 2.5 3 3.5 4 4.50图 143平均数与每一个数据都有关,因此,任何一个数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.由图 143 可以看出,用水量最多的几个居民对平均数影响较大,因为他们的用水量与平均数相差太大了.作为刻画一组数据集中趋势的统计量,平均数、中位数、思维拓展中位数不受少数几个极端值的影响.思维拓展众数,它们各有各自代表的角度,各有优缺点,也各有各的用处.平均数是刻画一组数据集中趋势最常用的统计量.2.标准差有两位射击运
6、动员在一次射击测试中各射靶 10 次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4乙 9 5 7 8 7 6 8 6 7 7如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?如果看两人本次射击的平均成绩,由于 x甲=7, 乙=7,两人射击的平均成绩是一样的,那么,是否两个人的水平就没有什么差异呢?频 率 0.40.30.20.1环 数4 5 6 7 8 9 10频 率 0.40.30.20.1 环 数4 5 6 7 8 9 10(1) (2)0 0图 144直观上看,还是有差异的.例如,甲成绩比较分散,乙成绩相对集中(如图 144
7、所示).因此,我们还需要从另外的角度来考察这两组数据.例如,在作统计图、表时提到过的极差.甲的环数极差=104=6, 乙的环数极差=95=4.它们在一定程度上表明了该组数据的分散程度.显然,极差对极端值非常敏感,注意到这一点,我们就可以理解“去掉一个最高分,去掉一个最低分”的统计策略.考察一组数据的分散程度的大小,最常用的统计量是标准差.标准差是数据到平均数的平均距离,一般用 S 表示.假设一组数据是 x1,x2,xn, x表示这组数据的平均与中位数、众数比起来,平均数可以反映出更多的关于数据全体的信息.21 世纪教育网全析提示从不同的角度出发,对同一组数据所表达的信息也不同.教练员要分析两名
8、运动员的优缺点,以便有针对性地训练;若是选拔性考核,就要看两名运动员谁的成绩更好一些.数.xi 到 x的距离是|xi |(i=1,2,n). 于是 x1,x2,xn 到 x的“平均距离”是S= nxn|21 .由于上式含有绝对值,运算不太方便,因此,常改用如下公式来计算标准差.S=)()()(1222xxxnn.一组数据中每个数与平均数之间的距离关系可用图155 表示.x x x x x x m m nm = 2 21 11 S图 155显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.用计算机电子表格软件(如 Excel)或科学计算器可以求得S 甲=2,S 乙=1.095. 由 S 甲S 乙,可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙的射击成绩比甲的稳定.此外,上面两组数据的离散程度与标准差之间可用图146 直观地表示出来.21.095SS= = 甲 乙 4 5 6 7 8 9 10* * * * * *要点提炼计算数据 x1,x2,xn 的标准差的算法:(1)算出数据的平均数 x;(2)算出每个数据与平均数 的差xi x;(3)算出(2)中 xi x的平方;(4)算出(3)中 n 个平方数的平均数,即为方差;(5)算出(4)中平均数的算术平方根,即为标准差.图 146