1、概率统计中的反例前言第一章 随机事件及其概率1 同一问题的概型未必唯一2 事件间的关系(1) 由 CBA推不出 CBA(2) 由 推不出 (3) )()(3 概率为零的事件未必是不可能的事件4 由概率关系推不出事件间关系5 试验次数多概率就一定大吗?6 概率与抽样方式是否有关7 事件概率与试验的先后次序是否有关第二章 随机变量极其分布1 离散型分布的最可能值是否唯一2 单调不降右连续是分布函数的必要而非充分条件3 既非离散型又非连续型的分布函数是否存在4 具有无记忆性的离散型分布是否存在5 不几乎相等的随机变量是否有相同的分布6 联合分布与其边缘分布未必是同类型分布7 边缘分布不能决定联合分布
2、8 不同的联合分布可具有相同的边缘分布9 正态边缘分布可由非正态联合分布导出10. 均匀分布不具有可加性11. 分布函数之和不是分布函数第三章 独立性与相关性相容性1 两两独立但不相互独立2 P(ABC)=P(A)P(B)P(C)成立,但 A,B,C 不两两独立3 独立关系不具有传递性4 随机变量不独立,但其函数可以独立5 X 与 Y 不独立,但 2X与 Y独立6 X 与 Y 不独立,但有相同分布7 既不相关也不独立的随机变量8 随机变量独立但它们的函数未必独立9 独立性与相容性10. 独立同分布的随机变量是否必相等11. 有函数关系的随机变量是否一定不独立第四章 随机变量的数字特征1 随机变
3、量的数学期望未必都存在2 随机变量的方差未必都存在3 数学期望存在但方差不存在4 X 的函数的期望是否等于 X 的期望的函数5 X 的各阶矩都存在也不能确定 X 的分布函数6 满足 E(XY)=E(X)E(Y)的 X,Y 未必独立 第五章 参数估计与假设检验1 矩估计是否有唯一性2 矩估计不具有“不变性”3 极大似然估计是否有唯一性4 似然方程的解未必是极大似然估计5 参数估计的无偏性与一致性有无关系6 无偏估计是否唯一7 零假设与备择假设是否处于对等的地位前 言数学是由两个大类证明和反例组成数学发现主要是提出证明和构造反例从科学性来讲反例就是推翻错误命题的有效手段从教学上而言反例能够加深对正
4、确结论的全面理解【美】B.R.盖尔鲍姆曾说“一个数学问题用一个反例予以解决给人的刺激犹如一出好的戏剧”相信读了概率统计中的反例后我们大家都会有这一同感第一章 随机事件及其概率1 同一问题的概型未必唯一概型(Schema)是随机现象的数学形式,它不是实际本身,而是实际的数学抽象。对于现实世界中的随机现象,要想进入数学理论的研究,首先必须确定其概型。由于我们的认识水平以及现实问题的复杂性,使得所选定的概型往往不是唯一的。概率论中著名的“n 个球在 n 个盒子中的分布问题” (见王梓坤概率论基础及其应用P12-13 科学出版社)就说明了这一情况,这是一个典型概型的问题,内容是:设有 r 个球,每个都
5、能以相同概率 1/n 落到 n 个盒子(n=r)的每一个盒子中,求指定的某 r 个盒子中各有一个球的概率。如果我们把 r 各球视作 r 个人,而把 n 个盒子视为一年的天数: n=365.这时上述问题就成为了概率论中一个颇为著名问题的概型。此问题是求参加某次集会的几个人中,没有 n 个人生日相同的概率。众所周知,关于球彼此间可以认为是有区别,也可以认为无区别;一个盒子可以假定仅能容纳一个球,也可以允许它能容纳许多球,如此一来,就可以分为以下几种概型:(1) 马克斯威尔波尔茨曼 认为球彼此之间有区别,且对每盒中可容纳球数不加限制;(2) 玻色爱因斯坦 认为球彼此不能区别,且对每盒中可容纳球数不加
6、限制;(3) 费密狄雷克 认为球彼此无区别,且限制每盒中不能同时容纳二个球。后来,为了统一以上三种情况,又产生了第四种情况(4) 布里龙 认为球彼此可以区别,且增加了一些其他条件限制(见杨宗磐概率论入门 P.13 科学出版社)以上四种情况,形成了统计物理学中的四种统计:球可看作为质点,盒子看作状态。再看一例:n 个人围成一个圆周,求其中甲、乙两人之间恰有 r(1)维正态随机变量,可由坐标轴的旋转转变为一组几个独立的正态随机变量.(参见丁寿田译的前苏联概率论教程 P157)例如 n=2,即使 X,Y 不独立,当(X,Y)服从二维正态分布,令sincoYXZ, cossinYXW,则(Z,W)仍服
7、从二维正态分布,其联合密度函数为:)2()1221 2),( CWBZAef 只要适当地选择 :tg则 B=0,此时 Z 与 W 独立5 X 与 Y 不独立,但 2X与 Y独立若随机变量 X 与 Y 独立,则 2与 必相互独立,其逆不真例如:设(X,Y)的联合密度函数为其 他01|,|)1(4),( yxyyxf 110)4(0)()22 xduyxXPFxX10)(2yyY1,10,),(2 yxyyxxFYX或对于一切 x,y 恒有 )(),(222FYXYX所以 2与 相互独立。其 他0|)(xfX其 他0|)(yfY显然 )(,yfyxYx,所以 X 与 Y 不独立 .6 X 与 Y
8、不独立,但有相同分布观察如下的(X,Y)的联合分布及其边缘分布0 1 2 Y 的分布0 1/19 1/6 1/9 7/181 1/6 1/3 0 1/22 1/9 0 0 1/9X 的分布 7/18 1/2 1/9由于 3,21,jiPjij、故 X 与 Y 不独立,但 X 与 Y 的分布显然相同.7 既不相关也不独立的随机变量若随机变量 X,Y 相互独立,则 X,Y 不相关,反之不真,这方面的反例很多,离散型与连续型各举一例.例 1 设(X,Y)的分布为:-1 0 1-1 1/8 1/8 1/80 1/8 0 1/81 1/8 1/8 1/8容易验证 不 相 关YXEXY,)()(),cov
9、( 不 独 立jiPij ,3,21.例 2 设(X,Y 服从单位圆域上的均匀分布,但其密度函数 10),(2yxyxf容易验证 不 相 关YXEXY,0)()(),cov( 不 独 立ff ,.8 随机变量独立但它们的函数未必独立设 ).,(),(YgWXfZX,Y 为相互独立的随机变量(1) Z,W 独立的例子设 X,Y 独立且有相同分布 ),0(2N,取 2YXZ,则(Z,W)的联合密度为XYXY00),()1(22zezwf 边缘密度为 )(2zzfZwwfW,)1()2则 ,(fzzWZ故 Z 与 W 独立(2) Z,W 不独立的例子设 X,Y 不独立,且都服从如下分布 6/1/61
10、/5432取 YXZ,此时 Z 与 W 或者同为奇数或者同为偶数,所以 Z 与 W 不独立 .9 独立性与相容性独立性是问题间的概率属性,相容性是事件间本身的关系。由第一章 4 可知,由概率关系推不出事件间关系,所以由独立性推不出不相容性。看如下一个命题:若 A,B 为两个独立事件,且 0)(,)(BPA,且 A,B 不能不相容,用反证法证明此命题。若 AB,则 0)(P,由 A,B 独立,且 0)(得)()(P,矛盾,因而 可见在题设条件下,A 与 B 独立同 A 与 B 互不相容不能同时成立。但若 A,B中有一个概率为 0,则 A 与 B 独立同 A 与 B 互不相容可同时成立。10 独立
11、同分布的随机变量是否必相等设 X,Y 互相独立,且都服从两点分布2/1则未必有 X=Y事实上,由 X,Y 的独立性有214)(1()()1( , YPXYPXP显然 X=Y 不是必然事件 .11 有函数关系的随机变量是否一定不独立考验如下三个随机变量 X,Y 和 Z:假定 X 与 Y 独立且都服从参数为 p 的(01)分布,令 Z 为 X 与 Y 的函数为 奇 数为 偶 数YXZ10由于 X,Y 独立,可得(X,Y)的联合分布律0 10 2)1(p)(p1 2Z 的概率分布为:22)1(0pp(X,Z)的联合分布率为0 1 Z 的分布0 2)1(p2p22)1(p1 )1(X 的分布 )(显然
12、当 P=1/2,Z 与 X 相互独立可见,尽管 Z 与 X 之间存在函数关系,但它们可以相互独立.第四章 随机变量的数字特征1 随机变量的数学期望未必都存在在数学期望的定义中,要求级数绝对收敛或积分绝对可积,我们知道,绝对收敛的级数一定收敛,绝对可积的函数一定可积。反之都不真,故有数学期望不存在的随机变量存在。(1) 离散的例子设随机变量 X 取值,21,)(1kxkk,相应的概率为,21,pk由于11|kkx,所以 X 的数学期望不存在然而2ln4132)( pkk若把上式左边级数中的各项进行重排,会收敛到不同的数例如:l715231XYXZ2ln1863142一个随机变量的数学期望只能是一
13、个数,因此数学期望定义中要求的绝对收敛是必要的,它们可以保证 kx顺序的变化不影响数学期望中级数的收敛性(2) 连续的例子,见教材 P.141 例 5 柯西(Cauchy)分布2 随机变量的方差未必都存在按定义 2)()(XED,由于方差被定义为一种特殊形式(即随机变量X 的函数)的数学期望,而随机变量及随机变量函数的数学期望都未必存在,所以随机变量的方差也未必存在。本章 1 中所举两例中的随机变量的方差都不存在.3 数学期望存在但方差不存在参数为 n 的 t 分布的密度函数是xnxxfn ,)1(2)(21设随机变量 tX,则其密度函数232)1(4)(xxf0)()(2dxfXE的数学期望
14、不存在,所以 X 的方差不存在关于 t 分布,其矩有一个特点,当 r2 时, 0)(XE, 2)()2nD,故在 n=2 时,)(XD.4 X 的函数的期望是否等于 X 的期望的函数一般 )()(ff例如:设 X 服从如下分布:4/1/4120再设 ,)(3xf 于是随机变量函数/6故得 2)(XfE,由于 2/1)(XE,可得 8321)(3XEf,所以)(f5 X 的各阶矩都存在也不能确定 X 的分布函数若已经 X 属于某个分布,且又知道其某些矩,便可确定 X 的分布函数,比如知道一阶原点矩(即数学期望)就能确定(01)分布的泊松分布,指数分布的分布函数,若进一步还知道二阶中心矩,便能确定
15、二项分布,均匀分布,正态分布的分布函数。由此是否能推断:知道 X 的各阶矩,就一定能确定 X 的分布函数呢?回答是否定的,事实上,存在着不同的分布函数,其各阶矩都一样。例如 设随机变量 X 与 Y 的密度函数分别是0)(cosxexfax)in(1faY其中 0a1/2,)(cos1a显然 )(xffYX,从而 X 与 Y 各自的分布函数 )(xFYX,但它们却有相同的各阶矩:,21)()(cos)1)( 00 ndxfandfx YnnXn 结论:由随机变量的分布函数可以确定随机变量的数字特征,反之不然.6 满足 E(XY)=E(X)E(Y)的 X,Y 未必独立 若随机变量 X,Y 独立,且
16、各自数学期望存在,则 )()(YEX,反之不真。例如:设随机变量 Z 服从 2,0上的均匀分布)2cos(cosZYX0)2cos(1)(,021)( 00 dzEzdE 2cos)(2dzzY于是 EX ,即 X,Y 不相关,而 X,Y 满足 12YX,所以X,Y 不独立.第五章 参数估计与假设检验1 矩估计是否有唯一性以样本矩阵作为相应的总体矩的估计量,以样本矩的连续函数作为相应的总体矩的连续函数的估计量。这种估计的方法被称为矩估计法我们知道矩有原点矩与中心矩之分,如果样本原点矩与样本中心矩都可作为相应总体矩的估计,则显然矩估计不具有唯一性即使规定只用样本的 k 阶原点矩作为相应总体 k
17、阶矩的估计,那么参数的矩估计也不是唯一的社,例如设总体 X 服从参数为 的泊松( Poisson)分布,由于 )(XDE,故由矩估计法知:2121 )(, XnXii都为参数 的矩估计量.2 矩估计不具有“不变性”所谓极大似然估计具有“不变性” ,是指:若 为 的一个极大似然估计,则当函数 )(g具有单值反函数时, )(g为 的一个极大的似然估计,对矩估计而言,“不变性”不成立,例如:对反射正态分布)0(012)(2xexfx用矩估计法分别对 和 2作估计0)()(dxfXE220222 dtef设 ),(1n 为取自反射正态总体的样本,由矩阵令212)(,(XEnXEii得: ii2,2由此
18、可见 nii12)(2所以矩估计不满足不变性.3 极大的似然估计是否有唯一性极大似然估计不具有唯一性,例如设均匀分布的密度函数为 待 估 参 数其 他 02121);( )()(nxxf似然函数: 其 他其 他 其 他021210)1(21;);,()()()()1(xxnixfxLnniniin显然区间,)1()(n中的每一点均为 )(L的最大值点于是1012)()()( tXtXn, 均为 的极大似然估计量注: 当1)()(n时, 的极大似然估计唯一当 2)1()(时, 的极大似然估计不存在.4 似然方程的解未必是极大似然估计设 ),(21nX 是取自柯西(Cauchy)分布 xxxf )
19、(1;(2的样本当 1n时,似然函数为 )(12L)(ln)(ln21x似然方程为 0122x故 1X是 的极大似然估计量当 2n时,似然函数为1)(1)(1)( 22xxL要使 )(达到最大,只要(1)的分母最小,令其分母的变量部分为)(2fx由 )2(01)()22121 得三个解: /4)(, 223 XXX通过 )(f的正负可判得:当 1为 的极大似然估计时, 3,2不是 的极大似然估计;反之,当 3,2为 的极大似然估计时, 不是 的极大似然估计。而无论发生什么情况,似然方程(2)的三个解不全是 的极大似然估计极大似然估计就是求似然函数的极大值点,似然函数是样本的联合分布密度,似然方
20、程是似然函数的导函数为零的函数。我们知道,导函数为零的点是函数的驻点,而驻点未必是函数的极大值点,所以似然方程的解未必是极大似然估计.5 参数估计的无偏性与一致性有无关系两者间没有一定的关系,下表中所列的四种情况均可以发生无偏性 有偏性一致性 非一致 以均匀分布为例 ),(21nX 为如下均为总体的一个样本其 他01;(xxf由极大似然估计法可得 )n( 的总体参数 的一个极大似然估计,且唯一)(nX的概率密度为 其 他0(1) xxfnXn )1()( nn XEdfEn(可见 )(不是 的无偏估计, )(1n是 的无偏估计222)(2)()( )1()1( nXEXDnn 由切贝雪夫不等式
21、的推广(Bienayme 不等式的特例) )(0)1( /)()|(| 22) 2)2)() nnXPnnnn由切贝雪夫不等式)()()()|1(| 2)( nXDnPn由此知有偏估计 )(X和无偏估计 )(1n都是 的一致估计再引进 的两个估计 12与)2()( 101 XEdxE可见 1X是 的有偏估计, 12X是 的无偏估计对任意 0,有 ndxxfPx 0);()|(| 0|1 )(1);()|2(| 220|2|1 dfXx由此得有偏估计 1和无偏估计 1X都不是 的一致估计.6 无偏估计是否唯一的仅由估计量的数学期望等于被估计的参数这一要求并不能保证估计量的唯一性例如: 设 ),(
22、21n 是来自参数为 的泊松分布的总体的一个简单随即样本,则21211 )( XnSXiinii 都是 的无偏估计,事实上,由基本统计量的性质知)()()( 221 DEEE又如,设总体 ,0U的一个简单随机样本为 ,1n ,则 的估计量,max2 211 nXnX与均为 的无偏估计,事实上, ydn01)()()()其中 ,21nY ,其密度函数为其 他0)(1yyfY7 零假设与备择假设是否处于对等的地位在假设检验中,首先要针对具体问题提出零假设 0H和备择假设 1,由于零假设是作为检验的前提而提出来的,因此,零假设通常应受到保护,没有充足的证据是不能备拒绝的,而备择假设只有当零假设备被拒
23、绝后,才能被接受,这就决定了零假设与备择假设不是处于对等的地位下面举例说明交换零假设与备择假设可能会得出截然相反的检验结论问题 某厂方断言,本产生产的小型电动机在正常负载条件下平均电流不会超过0.8A,随机抽取该型号电动机 16 台,发现其平均电流为 0.92A,而由该样本求出的标准差是 0.32A,假定这种电动机的工作电流 X 服从正态分布,问根据这一抽样结果,能否否定厂方断言?(取显著性水平 05.)解:本题假定 ),(2NX, 未知,以厂方断言作为零假设,则得假设检验问题: 8.:;8.0: 10 HH此时 05,32,9.,6Sxn,由 t 检验法可知拒绝域为4.750.)1(632.
24、805. tX,由于 94.02.x,故不应该拒绝零假设 0H,即在所给数据和检验水平下,没有充分理由否定厂方的断言现在若把厂方断言的对立面(即 8.0)作为零假设,则得假设检验问题:8.0:;8.: 1H由 t 检验法,此时的拒绝域为6)(632.5.tX,因为观测值6.092.x,所以应接受零假设,即接受厂方断言的对立面由此可见,随着问题提法的不同,得出了截然相反的结论,这一点会使初学者感到迷惑不解,实际上,这里有个着眼点不同的问题,当把“厂方断言正确”作为零假设时,我们根据该厂以往的表现和信誉,对其断言已有了较大的信任,只有很不利于它的观察结果才能改变我们的看法,因而一般难以拒绝这个断言,反之,当把“厂方断言不正确”作为零假设时,我们一开始就对该厂产品抱怀疑态度,只有很有利于该厂的观察结果,才能改变我们的看法,因此,在所得观察数据并非决定性地偏于一方时,我们的着眼点(即最初立场)决定了所得的结论打一个通俗的比喻:某人是嫌疑犯,有些不利于他的证据,但并非是起决定性作用的,若我们要求“只有决定性的不利于他的证据才能判他有罪“,则他将被判为无罪,反之,若要”只有决定性的有利于他的证据才能判他无罪“,则他将被判有罪,在这里,也是着眼点的不同决定了看法,这类事件在日常生活中并不少见,原本不足为奇.