1、5.4 数据的波动,第五章 数据的收集与处理,(一)问题导入,提出问题2001年7月3日,我国加入“WTO”.当我们欣喜若狂的时候,为了提高农副产品的国际竞争能力,一些行业协会对农副产品的规格进行了划分.某外贸公司要出口一批规格为75g的鸡腿,现有两个厂家提供货源,他们的价格相同,鸡腿品质相近.,问题1: 如果只考虑鸡腿的规格,你认为外贸 公司应该购买哪个厂的鸡腿?,甲厂:75 74 74 76 73 76 75 77 77 7474 75 75 76 73 76 73 78 77 72 乙厂:75 78 72 77 74 75 73 79 72 75 80 71 76 77 73 78 71
2、 76 73 75,质检员分别从甲、乙两厂的产品中抽样调查了20只鸡腿的质量(单位:g)如下:,问题2:你能从图中估计出甲、乙两厂被抽查鸡腿平均质量吗?,请你写出甲、乙两厂被抽查鸡腿平均质量,并在图中画出表示平均质量的直线.,问题3: 观察两幅图表,看看被抽查的鸡腿质量的分布情况你有什么发现?,问题4: 你能求出甲厂抽查的这20只鸡腿质量的最大值是多少吗?,最小值呢?,它们差几克?,乙厂呢?,问题5 : 现在你认为外贸公司应该购买哪个厂的鸡腿?为什么呢?,甲厂鸡腿规格比较稳定,最大值和最小值只相差6克;乙厂鸡腿规格比较不稳定,最大值和最小值相差9克.,平均质量只能反映总体的集中趋势,并不能反映
3、个体的变化情况.从图中看,甲厂的产品更符合要求.,现实生活中,除了关心数据的“平均水平”外,人们还关注数据的离散程度,即它们相对于平均水平的偏离情况.极差就是刻画数据离散程度的一个统计量.,极差是指一组数据中最大和最小数据的差.,定义:,从这个问题中我们发现:,1. 平均数对于数据分析只能反映他们的平均值,在实际问题的研究中,还有很大的局限性.,如上面这个问题中,平均数都是75,事实上甲厂的产品更符合要求.,2. 讨论数据的离散程度可以用“极差”这个统计量来刻画.,极差大,偏离平均数越大,产品的质量(性能)越不稳定.,如果丙厂也参与了竞争,从该厂也抽查20只鸡腿,,问题6: 丙厂这20只鸡腿质
4、量的平均数和极差分别是多少?,平均数:,极差:,问题7:在甲、丙两厂中,你认为外贸公司应该购买哪个厂的鸡腿?,问题8:在甲、丙两厂中,你能写出每个鸡腿质量与平均数之间差的绝对值 , 你有什么发现?,平均数不能刻画数据的离散程度,而极差只能局部反映数据的离散程度.,为了从整体上反映数据的波动大小,办法不止一个:,求各数据与其平均数的差距的和或平均数;,26,甲厂:,丙厂:,36,求各数据与平均数之差的平方的平均数.,甲厂:,丙厂:,2.5,4.2,定义:,方差是一组数据中各个数据与平均数之差的平方的平均数.,其中, 是 的平均数,s2是方差.,标准差是方差的算术平方根 (S).,一般而言,一组数
5、据的极差、方差或标准差越小,这组数据就越稳定.,注意:,问题9:分别求出甲厂和丙厂的方差和标准差:,甲厂:,丙厂:,2.5,4.2,根据计算结果,你认为哪家产品更符合规定?,甲厂更符合规定.,练习:,1.甲、乙两支仪仗队队员的身高(单位:)如下: 甲队: 乙队: ,哪支仪仗队更为整齐?你是怎么判断的?,2.八年级某班的五个同学每人投掷铅球一次,测得成绩如下(单位:m):5,6,9,7,8,这组数据的方差是_.,2 m2,标准差是 _.,3.对甲,乙两个小麦品种各100株小麦的株高进行测量,算出 于是可估计株高较整齐的小麦品种是_.,因为这两组数据的平均数相同,所以比较方差,方差越小,株高越整齐
6、.,甲种,如果准备从两位短跑运动员中选一位参加男子米赛跑,他们平时的次抽查成绩为(单位:秒) 甲:11.21 11.05 10.00 11.72 11.04; 乙:9.72 12.04 9.99 11.97 12.00. 那么你会选谁呢?,数据是不是越稳定越好呢?,极差:指一组数据中最大和最小数据的差.,数之差的平方的平均数,方差:各个数据与平均,一般而言,一组数据的极差、方差或标准差越小, 这组数据就越稳定.,练习,据统计,某学校教师中年龄最大的为54岁,年龄最小的为21岁 那么学校教师年龄的极差是 若一组数据的方差为0.16,那么这组数据的标准差为 已知一个样本1、3、2、3、1,则这个样
7、本的标准差是_,阅读书本第201页 ()这一天A、B两地的平均气温分别是多少? (2)A地这一天气温的极差、标准差分别是多少?B地呢? (3)A、B两地的气温各有什么特点?,某校要从甲乙两名跳远运动员中挑选一人参加一项校际比赛。在最近的10次选拔赛中,他们的成绩(单位:cm)如下: 甲:585 596 610 598 612 597 604 600 613 601 乙:613 618 580 574 618 593 585 590 598 624,(1)他们的平均成绩分别是多少?,(2)甲、乙这10次比赛成绩的方差分别是多少?,(3)这两名运动员的运动成绩各有什么特点?,(4)历届比赛表明,成
8、绩达到5.96m的就很可能夺冠,你认为为了夺冠应选谁参加这项比赛?如果历届比赛表明,成绩达到6.10m的就很可能夺冠,那么你认为为了夺冠应选谁参加这项比赛?,某校要从甲乙两名跳远运动员中挑选一人参加一项校际比赛。在最近的10次选拔赛中,他们的成绩(单位:cm)如下: 甲:585 596 610 598 612 597 604 600 613 601 乙:613 618 580 574 618 593 585 590 598 624,练一练,1甲、乙两个样本,甲的样本方差是2.15,乙的样本方差是2.21,那么样本甲和样本乙的波动大小是( )(A)甲、乙的波动大小一样 (B)甲的波动比乙的波动大
9、(C)乙的波动比甲的波动大 (D)无法比较,有甲、乙两种水稻,测得每种水稻各10穴的分孽数后,计算出样本方差分别为11,=3.4,由此可以估计( )。(A)甲比乙种水稻分蘖整齐 (B)乙种水稻分蘖比甲种水稻整齐(C)分蘖整齐程度相同 (D)甲、乙两种水稻分孽整齐程度不能比,练一练,甲、乙 两名学生中选拔一人参加电脑知识竞赛,在相同条件下对他们的电脑知识进行了10次测验,成绩如下:(单位:分),回答下列问题: (1)甲学生成绩的极差是 (分),乙学生成绩的极差是 (分); (2)若甲学生成绩的平均数是x,乙学生成绩的平均数是y,则x与y的大小关系是 ; (3)经计算知: =13.2, =26.36,这表明 ;(用简明的文字语言表述),注:一般情况下,一组数据的极差、方差、 标准差越小,这组数据就越稳定,做一做,两人一组,在安静的环境中,一人估计 min的时间,另一人记录实际时间,将结果记录下来 在吵闹的环境中,再做一次这样的实验 将全班的结果汇总起来,并分别计算安静状态和吵闹状态下估计结果的平均值和方差 两种情况下的结果是否一致?说说你的理由,小结,一般情况下,一组数据的极差、方差、标准差越小,这组数据就越稳定,极差、方差、标准差都能刻画一组数据的离散程度;,