1、高考数学知识模块复习指导系列学案概率与统计【知识拓展】1 “偶然” 、 “随机”应用的妙处在某些国家的天气预报节目中,你会看到画面下方有一行注释性的文字:“降水概率 82%”,关于这些注释,不用解说员过多解释人们也能明白:“今天下雨的可能性很大” 或人们常说的:“八成要下雨了,带上伞比较好 ”但如果说降水概率为 20%,你要不要为下雨作准备呢?一般人可能会想:“算了,下雨的可能性不大,不用带伞了 ”可有时就因为这 20%,你就会被雨淋一下子,这时你能怪气象台吗?天气预报并没有说不下雨,只是下雨的“概率”很小而已太阳从东方升起,这是必然现象,永远也不会改变,但明天是否下雨,一般来说就没有必然性了
2、,可能下,也可能不下,是偶然事件在数学上,把偶然事件又称作随机事件,可事件的发生与否会随机而定吗?必然事件发生的可能性是 100%,不发生的可能性为 0%,而随机事件就不是这样了,发生的可能性可以为 1%,也可以为 99%,发生的大小可以用一个小数来衡量,这个数就叫做概率,概率的最大值取 1,最小值取 0随机事件大量存在,自然界刮风下雨,社会中的彩票,炒股等等,都是随机现象今天的股票是涨还是跌?那可没准,既可能疯狂飚升,也可能一落千丈其他如某城市一天中交通事故的数目、学生某次考试的成绩等都具有随机性人们常说的“风险”就是随机事件的一种认识人活于世,不可能事事顺心,样样如意,有时候必须去搏,敢于
3、冒险,对随机事件做出自己的判断,把“不一定”发生的事情变成现实,这就是我们的“胜利” 如果老是想干十拿九稳的事,大概成就不了大事业说了这么多,究竟“偶然” 、 “随机”有什么用处呢?概率论能帮我们去处理随机事件吗?回答是肯定的,概率论就是用数学方法来计算各种随机事件发生的概率的大小,并用于指导人们的行动,虽说“天有不测风云” ,气象台还是要给出各种天气现象发生的概率1999 年的冬天,中央气象台没有预报内蒙古的一次大的降雪过程(即得出降雪的概率为 0)结果那里下了大雪,为此天气预报主持人还表示道歉,由此表明,中央电视台的预报准确率还是比较高的,由于偶然出错,才需要道歉同样,尽管股市风险无常,股
4、评家仍然在电视台上做各种预测,只不过其准确性远不如气象预报,股评不准,电台就不会负责任了如此看来,概率确实和人们的生活息息相关,从而我们都应去了解概率的知识, “偶然” 、“随机”各有自己的妙处,在各种场合的中奖问题中,这一点尤为突出为了筹措特殊的资金,比如用于社会福利和体育事业,我国已经开始发行福利彩票和体育彩票了,这种彩票的面值不大,中奖后的奖金却高达上百万元例如,上海的福利彩票,每期的发行量在 1000 万元左右,如果仅拿出价值的一半做为奖金,头奖的金额就可达 100万元,而剩余的一半可用于上海的福利事业这样既可满足许多人寻求中大奖,发大财的心理需求,又能解决上海市的福利资金问题,可以说
5、是一举两得的善事,又由于彩票的面值较小,多数人不能中奖,就当是为国家的福利事业做了贡献正是由于这种彩票采取了公开的“幸运抽奖”的方式,且有国家公证机关来保证抽奖的公正性,因而又不同于一般的赌搏,因此受到了政府的支持和人民的信任,这可以说是“偶然” 、 “随机”为国家做的大贡献,关于其他方面的知识,请读者自己去查阅相关资料2 “街头摸奖”可信吗?你相信那些用摸彩来吸引人去碰“运气”的游戏吗?我们不妨来试试下面的彩球游戏准备一个布袋,内装 6 个红球与 6 个白球,除颜色不同外,六个球完全一样,每次从袋中摸 6 个球,输赢的规则为:6 个全红 赢得 100 元5 红 1 白 赢得 50 元4 红
6、2 白 赢得 20 元3 红 3 白 输 100 元2 红 4 白 赢得 20 元1 红 5 白 赢得 50 元6 个全白 赢得 100 元如果你摸出了 3 红 3 白则输 100 元而对于其他六种情况,你均能赢利相应的钱数,而不用花其他的钱,怎么样?动心了吗?注:这个规则有时称为“袋子”模型乍一看,此规则似乎处处对顾客有利,许多人都难免动心去碰碰“运气” ,甚至有人连连试了数次然而,顾客一个个都免不了扫兴而去,一连十几个人各试了 5 次,结果都以失败告终,每人输的钱在 60 元到 130 元不等,而且试的次数越多,则输的越多其实,我们想一想也该明白,天下哪有免费的午餐呢?但要知道为什么会输就
7、要用到我们的概率的知识了,要弄清这个问题并不难,我们不妨逐一计算顾客中奖的可能性,也就是输赢规则中 7 种情况各自出现的概率大小用概率论的语言说,假如 7 种情况是等可能的,则赢的机会为 ,输的机会仅为 ,摸76717 次有 6 次都应该赢但游戏的妙处就在于这 7 种情况的发生不是等可能的由于球的形状、大小、重量等完全一样,所以我们无法看到的情况下是无法区分红球和白球的,任意摸 6 个球,不论红或白,共有 种可能,由此就可以计算出摸到 5 红 1 白的概率为924C61而摸到 3 红 3 白的概率为 可见,输钱的可能%.3/C61256 %2.43C/6136性约占 ,正是由于各种情况出现的概
8、率不均等,才导致了人们上当受骗,这 7 种情况出现的概率如下所示:结果 出现的概率6 个全红 0.1%5 红 1 白 3.9%4 红 2 白 24.4%3 红 3 白 43.2%2 红 4 白 24.4%1 红 5 白 3.9%6 个全白 0.1%很显然,上面 7 种情况的概率加起来是 1,它们把全部的可能性 100%进行了不均等的概率分配,从中还可以看出,要想摸出“6 个全红”或“6 个全白”的可能性仅为 0.1%,相当于 1000 次中只有 1 次会赢 100 元,这是一个概率很小的事件,根据实际推断原理,在一次摸取中,基本上是不会发生的,而摸到 3 红 3 白的可能性为 43.2%,即几
9、乎每两次就有一次可能出现,几乎有一半的机会输掉 100 元,这就是摸得越多,输得越多的原因为了进一步分析,我们设随机变量 表示赢的钱数,则 的分布列应为 100 50 20 100P 0.002 0.078 0.488 0.432表 1-33所以,我们赢钱的数学期望为 432.012.039.501.02E 2(0.11.954.88)43.229.34由期望的实际意义可知,我们每摸一次,平均就输掉 29.34 元事实上,这种摸彩是一种“机会游戏” ,它不过是概率论这门学科的低极表现形式而已,并不是什么新鲜的玩意儿,但若涉及到金钱,它就变成了赌搏这就告诉我们,遇到诱惑时要谨慎行事,一般来说,诱
10、惑越大的游戏,就越能使人输钱,以至于倾家荡产3 “同年同月同日生”真的很稀奇吗?如果你学过概率,你就能得出一些使人吃惊的结论来,让我们来看一个著名的数学问题:生日的相合,367 个人中间,肯定有两个人的生日相同注:这里我们只讨论出生的月份及日期,而不考虑年份这是根据抽屉原理得来的(因为一年最多只能有 366 天)抽屉原理可叙述为:假如有 n1 个(或更多)物体装入 n 个盒子,那么一定有某个盒子至少装有两个物体生日问题也许令人困惑:23 个人中有两人生日相同的概率便超过 你也许认为这是巧21合其实,这个奥妙也可以用概率的方法推断出来为了简单,我们不记闰年,一年按 365天算某年级有 n 个人(
11、n365),问至少有两个人的生日在同一天的概率有多大?试验是对人数为 n 的年级进行生日调查,试验的基本结果是 n 个人生日的一种具体分布由于生日出现的随机性,保证了 n 个生日种种分布的等可能性基本事件的数学结构构造性处理:把 365 天设想为 365 个“房间” ,然后按 n 个人的生日“对号人室” 这相当于 n 个可辨质点的每一个都以相同的概率,等可能地被分配到某一“室”内形象示意图如下:表示人 表示日子 1 2 3 4 5 6 7 8 9 364 365图 1-13基本结果总数就是把 n 个人安排进这 365 个“房间”的所有可能的不同方法数基本结果的差异不仅依“人” 、依“房” ,而
12、且还依“房”内的“人数”相鉴别因而基本事件总数恰为从 365 个不同元素中每次取出 n 个的允许重复的排列数 (乘法原理)n365所关心的事件 A至少有两人的生日在同一天有两个人的生日在同一天U有三个人的生日在同一天UUn 个人的生日在同一天这是一个比较复杂的事件,我们应从反面去考虑原事件的逆事件 的结构:一一n 个人的生日全不相同365 个不同元素,每次任取 n 个依一定的顺序排成一列这样就抓住了事件 的数学结构的本质,从而可知 的基本事件数为 !由互AAnC365逆事件的概率关系,即知 .!n3651365!nC1Pnn 具体地计算可有下面的结果:n 人中有两个生日相同的概率n 15 20
13、 23 24 25 30 40 50 55P 0.25 0.41 0.51 0.54 0.57 0.71 0.89 0.97 0.99表 1-34从表 1-34 中可知,只要人数 n55,则有 2 人生日相同的概率已相当接近 1 了不少团体人数都在 23 人以上,若有 2 人生日相同,可能彼此觉得真有缘分,备感亲切而我们现在知道这其实是一件很容易发生的事件中国人有十二种属相,这由某人生于何年而定可能会令你不解的是:任意四个人中,有两人属相一样的可能约有一半而在一个 6 口之家中,几乎可以断定有两个人属相一样这种问题也是概率论研究的对象有人曾查阅资料发现:美国前 36 任总统中有两个人生日一样,
14、3 人死在同一天(当然年份不同)概率论这个数学工具是和人们“朝夕相处”的4小概率事件都可以被忽略吗?概率论的目的就在于从偶然性中探求必然性,从无序中探求有序概率论是机遇的数学模型你使用过号码锁吗?如果使用过,那你应该知道,一定不能忘了开锁的号码比如你家门上的号码锁(如图 1-14)有 6 个拨盘由于每个拨盘上都有 10 个数字,因此一共可以组成 个不同的 6 位数码,组成每个数码的可能性是相等的,其中只有惟一的一610个数码(例如图中的 408226)对准开锁线时,锁才能打开如果你忘记了开锁的号码,想试着拨一个数码就把锁打开,其概率仅有: .01.16这个概率是很小的,因此,你想一次就把锁打开
15、几乎是不可能的做个有心人,我们会发现,生活中有不少这类发生的可能性很小的事情我们称这类随机事件为小概率事件人们从长期的实践中总结出:一件事件如果发生的概率很小的话,那它在一次试验中几乎是不会发生的数学上称这个结论为小概率原理例如,虽然飞机也有发生事故的时候,但据统计,发生事故的概率为 ,可能性很401小,因此,人们可以放心地乘坐飞机又如骗人的摸彩,桌上放有 10 张外表相同的扑克牌,其中 5 张“梅花” ,5 张“方块” ,一次让你翻 5 张牌,如果 5 张牌同花色(全是“梅花” ,或全是“方块”)就算中彩你很想碰运气,中彩的概率有多大呢?根据组合数公式可知,从 10 张牌中一次翻 5 张有种
16、不同的等可能取法,而翻到 5 张牌同花色只有两种可能因此,2!10C5你中彩的概率为 即你如果翻 126 次,通常才可能中彩一次(还不能保证一定会有,165一次)这个概率很小,按小概率原理,要想翻一次就中彩几乎是不可能的概率小到怎样才算很小呢?这可没有绝对的标准只有相对于具体要讨论的事情而定,这正像人们说“这老鼠真大”和“这牛太小”一样,我们是让老鼠与老鼠比,牛与牛比在生产中,比如一批铅笔的废品率为 1%,可以认为 1%很小而准许出售;但是,若一批注射用的针药有 1%不合要求,使用后会危害人的健康,就不能认为 1%小了如果是发射宇宙飞船,100 次有一两次失败,则“发射失败”就不是小概率事件了
17、,尽管其概率也不超过 0.02又如,根据某地近数十年来的气象资料,查知发生极大的风暴仅一两次,因而在建造普通平房时,此小概率事件就可以认为是实际上的不可能事件而不予考虑但在建造高楼大厦时,同一事件就必须加以重视,不能看成小概率事件,因而就不是实际上的不可能事件,不加以重视就会犯错误!在一般的问题中,一个事件发生的概率低于 2%都可以看做是很小的需要注意,一个小概率事件虽然在一次试验中几乎不会发生,但在多次试验中,常常也会发生比如在开号码锁的问题中,虽然试开一次几乎不可能把锁打开,但试开很多次时,也有可能把锁打开相反地,如果一个事件发生的概率很大(比如在 99%以上),那在一次试验中此事几乎一定
18、会发生一个小概率事件,不管其概率多么小,其值总是个确定的正数设某试验中出现事件A 的概率为 ,不管 0 如何小,如果把此试验不断独立地重复下去,那么 A 必然会出现1 次,从而也必然会出现任意多次这是因为,第 1 次试验中 A 不出现的概率为 1,前n 次 A 都不出现的概率为 ,因此,前 n 次试验中 A 至少出现 1 次的概率为 ,n1 n当 n时此概率趋于 1这表示 A 迟早出现 1 次的概率为 1出现 A 以后,把下次试验当作第 1 次,重复上述推理,可见 A 必然再次出现如此继续,可知 A 必然出现任意多次,例如,在城市闹区乱放爆竹,就一次而论,引起火灾的可能性并不大,但如果很多人都
19、这样乱放爆竹,则“迟早会引起火灾”这事件发生的可能性就很大这正是人人皆知的常识在理论上的依据庞加莱说:“最大的机遇莫过于一个伟人的诞生 ”之所以如此,一是由于某人的诞生是一系列随机事件的复合:父母、祖父母、外祖父母的结合,异性的 2 个生殖细胞的相遇,而这 2 个细胞又必须含有某些产生天才的因素;二是婴儿出生以后,各种偶然遭遇在整体上必须有利于他的成功,他所处的时代,他所接受的教育,他的各项活动,他所接触的人、事与物,都需为他提供好的机会所以,某个特定的人要成为伟人,可能性是极小的不过,尽管如此,各个时代仍然伟人辈出一个人成功的概率虽极小,但几十亿人中总有佼佼者,这就是所谓“必然寓于偶然之中”
20、的一种含义应用小概率原理于伟人问题,一个人成为伟人的概率固然非常小,但千百万人中至少有一个伟人就几乎是必然的了“必然寓于偶然之中”的另一含义是大数定律,它的特殊情形是频率的稳定性,即频率趋于概率设某试验中事件 A 出现的概率为 p0,将此试验独立地重复 n 次,其中 A 出现了m 次,于是频率为 根据大数定律,当 n时,必然有 因此,当 n 充分大时,n得 mnp我们不能确切预知一个婴儿的性别,只知他是男性的概率为 但由于上述定律,我们21可以断言,100 万婴儿中,约有 即 50 万个男婴,这几乎是必然的215抓阄的方法是公正的吗?概率应用大则可指导生产、科研,小则在日常生活中也大有用处比如
21、,人们常乐于在分配短缺的情况下用抓阄的办法来解决问题,其合理性保证当然得归功于“概率” 事实上,抓阄的结果是一随机现象,而所谓合理性,无非是说明每个人“中阄”的可能性相等而已!果真如此吗?我们看看下面的问题某校校庆,给每个班级 5 张电影票,初三(2)班是一个团结的集体,共有 50 个同学,都不愿把电影票占为已有,王老师只好用抽签(抓阄)来决定他制作了 50 张小卡片,在其中5 张上写上电影票字样,让 50 个人轮流抽签,抽到的则当仁不让去看电影但问题是同学们都犹豫了!小华提出了一个问题:“抽签也有先后,第一个人抽到的概率是 ,如果第一个50人抽到,第二个人抽到的概率只有 ;如果第一人没有抽到
22、,第二人抽到的概率就是 ,49 49抽签未必机会相等!”小陈听到这些话,愣住了,心想:“抽签明明是公平合理的方法,为什么还会有这个奇怪的分析结果呢?”此刻,两人不约而同地把目光转向了王老师,请他解答王老师指出,小华的分析虽然有道理,但是,他计算出来的两个数 与 不是第二人495抽到的概率,而是在第一人抽到或抽不到的条件下第二人抽到的条件概率实际上,在抽签时不必争先恐后,先抽与后抽的概率是相等的这可以用全概率公式计算得知我们也可以用适当的数学语言来描述这个抓阄试验:“5 张电影票,50 人抓阄” ,其相应的样本空间的样本点可认定是 50 个阄按抓阄顺序在直线上的一次排列(5 个代表有票的阄在这
23、50 个位置的某 5 个位置上)由于事先阄混合得充分均匀,50 个阄在直线上的每种排列的可能性是相等的,因而属于古典概型我们所关心的第 k 个人抓中有票的阄这一事件可如下构造之:设想从 5 个代表有票的阄中任取一个放在第 k 个位置上,然后再把剩下的阄安排在剩下的位置上作全排列,如图 1-15(在第 k 个位置先安排“有票的阄” ,再安排余下的阄)从而由乘法原理知,有票的基本事件数为 ,以 表示第 k 个人抓中阄的概率,即知!150C1kP此值不依赖于 k,即说明每个人抓中阄的概率都等于 ,而与抓.!49P15k 10阄顺序无关从而“试验”结束后的“倒霉”者也就不会怨天尤人了!可见,抽签的方法
24、是公平合理的这个例子可以推广到 n 个人抓阄分物的情况n 个阄,其中 1 个“有” ,(n1)个“无” ,n 个人排队抓阄,每个人抓到“有”的概率都是 n1若 n 个阄中,有 m(mn)个“有” ,(nm)个“无” ,则每个人抓到“有”的概率都是 .nm6如何应用期望值?美好的愿望是人类生存的精神支柱为一个特定的目标而奋斗,通过艰苦的努力去战胜各种风险,以至终于达到预先的期望,这种成功的喜悦是最激动人心的场面之一:期望!伟大的期望!期望与风险并存数学家从期望值来观察风险,分析风险,以便作出正确的决策古典概率论可以说发源于此帕斯卡(Pascal)首先提出了数学期望值的概念如果卖出彩票 1000
25、张,奖金总额为 500元,那么帕斯卡会说,你每购买一张彩票的期望值为 .50.150一如果你买了 600 张,那么期望值将是 .306. 一一般地,定义期望值 E 为概率 P 乘以奖金数 A,即 EPA我们也可以把期望值看成是一长串统计试验的结果例如上例中,买 600 张彩票,不妨看做在 5000 次摸彩中,3000 次中奖,2000 次落空(概率是 ),奖金为 500 元,故53.0025050302 一一一 我们可以说,摸奖落空的概率是 (奖金为 元),获奖的概率是 (奖P1A1 53P2金为 元),所以期望值 E 可以定义为A2. PE21再看一个复杂些的例子假如有一场竞赛,规则如下:如
26、掷一个骰子,出现 1,你赢 10元;出现 2 或 3 或 4,你输 2 元;出现 5 或 6,不输不赢这场竞赛对你是否有利?我们还是算期望值出现 1 的概率是 ,出现 2,3,4 的概率是 即 ,出现 5,6 的概率是 即6,321,2所以期望值 E 为31. 3201206因此,这场竞赛对你是有利的以上我们举的是掷骰子、摸彩票的例子,好像如果不去赌博的人永远不会碰到期望值问题,其实不然,我们天天在和期望值打交道例如,有一家个体户,有一笔资金,如经营西瓜,风险大但利润高(成功的概率为 0.7,获利 2000 元);如经营工艺品,风险小但获利小(95%会赚,但利润为 1000 元)究竟该如何决策
27、?于是计算期望值若经营西瓜,期望值 即 1400 元而经营工艺品为207.E1所以权衡下来,情愿“搏一搏” ,去经营西瓜,因它的期望值. 9501.0E2一高期望值这个概念,并不是很容易接受的在有些人看来,如中奖就拿 1000 元,不中奖就一分钱也没有,这个期望值 1 元(中将概率 0.001 乘以 1000)是什么“东西”?应该说我国的广大干部和群众对这一数学知识的理解和认识是很差的,远不及“平均数”和“百分比”那样普及但是在商品经济不断发展的今天,风险处处存在,决策时时要作如无“期望值”的概念,作为领导者连经济人员写的可行性报告也看不懂,那怎么进行工作?这里我们不妨举一个某省关于某工程的投
28、资决策的实例某新工艺流程如投产成功可收益 300 万元但投产之前,必须有小试和中试两步,每次分别需 2 万元和 36 万元小试的成功率为 0.7如做两次小试,则成功率可提高到 0.8,小试基础上的中试的成功率为 0.7,如直接搞中试的成功率为 0.5于是有三种决策:(1)一小试一中试,此时工程投资获益的期望值为 . 8.197.0367.0E1 一(2)两小试一中试,此时期望值为 . 2.35.8.42 一(3)有些领导急于求成,想省去小试,直接搞中试,那么期望值将是-360.5300114(万元)显然,这时采取第二方案最有利但是,如果一位领导者没有概率知识,对期望值概念一无所知,那么他对这份
29、决策报告也许看不懂,不理解,这就很成问题了让我们再举一个用期望值进行决策的例子某投资者有 10 万元,有两种投资方案:一是购买股票,二是存入银行获取利息买股票的收益取决于经济形势,假设可分三种状态:形势好、形势中等、形势不好(即经济衰退)若形势好可获利 40000 元,若形势中等可获利 10000 元,若形势不好要损失 20000 元如果是存入银行,假设年利率为 8%,即可得利息 8000 元又设经济形势好、中、差的概率分别为 30%、50%和 20%试问若采用某一标准,应选择哪一种方案?下面给出采用期望标准的解法设 为购买股票, 为存银行, 为经济形势好, 为经济形势中等, 为经济衰退,1a
30、2a123为三种形势的概率, 为第 种方案和第 种状态结合的结果,把它们列3,iPijai j成一张表(称之为报偿表),即:从上表可以看出,如果购买股票在经济形势好 和经济形势中等 的情况下是合算12的,但如果经济形势衰退 时,则采取存银行的方案比较好因为这三种状态都有可能出3现,采用期望值标准似乎是合理的所谓期望值标准就是将各种情况下的收益分别乘以其概率之和根据本例的数字, 和 的期望值标准分别为:1a2.80aEMV1302.05.03421 , 一 一 因为 ,所以 方案期望的收益比 大按最大收益原则,取期21a12a望收益高的方案,淘汰期望收益低的方案,所以应采用购买股票的方案对上面的
31、结果,有人提出疑问,购买股票方案在经济形势好和经济形势中等时获益自然是高,但若出现经济衰退,岂不损失惨重,他觉得从风险小的角度出发,无论如何也能赚进8000 元,似乎存银行方案更优些下面我们将从机会损失的角度出发,采用最小期望机会损失的标准选择最优方案,看存银行和购买股票两种方案孰优孰劣!这里的机会损失顾名思义就是指采用该方案的实际权益与采取能获得最高收益的方案时收入相比较的差额将问题按机会损失列表如下:两个方案的期望机会损失分别为: . 元106.2052.30aEOL ,元821 所以按最小期望机会损失的标准,还是应选择 方案a说到这里要提另外一个问题:商业情报的价值几何?大家知道,商场如
32、战场,商业情报可能会挽救一个企业,也可能搞垮一个巨大的集团于是在现代信息技术高度发达的今天,一些信息咨询公司、市场调查机构就应运而生了他们手中有某些商品的市场供求情报、市场需求预测,如现在普通市民对 VCD 的需求如何,DVD 大量涌入中国市场的销售前景分析,今年夏天女式服装会流行什么款式等等如果一个市场预测机构能够对市场经济作出准确的预测,经济的决策者一般是愿意支付咨询费来获取这一信息的如某时装公司准备明年夏天的上市女装,而一家信息公司经过市场调查对明年夏天女装流行款式有绝对的把握,时装公司是选择盲目生产还是瞄准时机而上呢?显然是后者,如果付一笔小钱就能赚大钱,何乐而不为呢?这基本上道出了商
33、业情报的价值,说白了就是:我付的咨询费应该小于或等于我能获取的利润超过了能获取利润的价值的信息是不可取的那么,从理论上讲,按期望标准,商业情报价值理论上到底是多少呢?以上述 10 万元钱的投资方案为例,如果知道准确的市场信息,总能选择最优的组合状态,即(400000.3100000.580000.2)130005600(元)7为什么要去掉一个最高分和一个最低分?在我们收看各种体育比赛时,当一个运动员表演完毕后,先由 10 个(或若干个)评委亮分,裁判长用这 10 个数据判分时,总要去掉最高分和最低分,再用其余的 8 个数据的平均值作为该演员的最后得分现在这已是人们的常识了这一常识背后的数学就是
34、数据处理中的代表数问题算术平均数是最常用的技巧,在我国也是最普及的数学知识之一任何一个干部和工人,至少都懂得平均数和百分比这两个概念 “我厂工人平均工资是多少,这次有百分之几的人可以加工资 ”这类话人人都能懂学生的成绩用总分来衡量,也会用总平均来衡量比较两班学生的某科成绩,也用各班该科得分数的平均数作为衡量标准至此,人们将平均值奉为至宝,似乎是金科玉律、无可更改的科学定则实际上不尽然,用算术平均数来作为代表数,有两个缺点:一是容易受异常值的影响;二是计算比较复杂,不能一眼看出前面所说的去掉最高分和最低分就是为了避免第一个缺点让我们看一个极端的例子如果一个班级有 30 个学生,其中两个学生逃学旷
35、课,数学考试只得 2 分和 10 分此外,有 5 个学生得 90 分,22 个得 80 分,1 个得 78 分此时该班数学成绩的平均分是: . 67.230780291023 一确实,如以 76.67 分作为该班平均分,太受那两个得 2 分和 10 分的同学牵连了结果不能反映大多数人的真实状况从直观上看,应在 80 分或 80 分以上才对于是我们就去掉一个最低分,总平均约是 分;如果去掉两个最低分,总平均约是.7829分这似乎比较符合实际了7.812但是这种去掉最高分或最低分的方法,在计算全班总成绩时未免有“弄虚作假”之嫌明明是本班学生,为何不计入总分呢?所以去掉最高分和去掉最低分的方法,不见得都合适上述的以平均数作为代表数,由于异常值的影响往往不能反映中等水平,一般以为的平均数就是中等水平,乃是误解上述 30 个学生的数学成绩中,总平均约是 76.67 分某同学得 78 分,超过平均数,似乎该是“中上”水平了,其实他是倒数第三名!那么我们用什么办法来刻画“中等水平”呢?这就是数据的中位数其定义为:设有 n个数据,将它们从小到大依次排列为 如果 n 是奇数,则第 项.x,x,k21 21是中位数;若 n 是偶数,则取第 项 和第 项 的平均值作为中位数中位21nx n212n