1、考研数学知识点 -概率统计 Edited by 杨凯钧 2005 年 10 月 1一 . 随机事件和概率 1、概率的定义和性质 (1)概率的公理化定义 设为样本空间,A为事件,对每一个事件A都有一个实数 P(A),若满足下列三个条件: 1 0P(A)1, 2 P() =1 3 对于两两互不相容的事件1A,2A,有 =11)(iiii APAP常称为可列(完全)可加性。 则称P(A)为事件A的概率。 (2)古典概型(等可能概型) 1 n 21,= , 2 nPPPn1)()()(21= 。 设任一事件A,它是由m 21, 组成的,则有 P(A)=)()()(21 m = )()()(21 mPP
2、P + nm=基本事件总数所包含的基本事件数A= 2、五大公式(加法、减法、乘法、全概、贝叶斯) (1)加法公式 P(A+B)=P(A)+P(B)-P(AB) 当 P(AB)0 时,P(A+B)=P(A)+P(B) (2)减法公式 P(A-B)=P(A)-P(AB) 当B A 时,P(A-B)=P(A)-P(B) 当 A=时,P( B )=1- P(B) (3)条件概率和乘法公式 定义 设 A、B 是两个事件,且 P(A)0,则称)()(APABP为事件A 发生条件下,事件 B 发生的条件概率,记为=)/( ABP)()(APABP。 条件概率是概率的一种,所有概率的性质都适合于条件概率。 (
3、4)全概公式 设事件nBBB , 21 满足 1nBBB , 21 两两互不相容,),2,1(0)( niBP i =, 2niiBA1=, 则有 )|()()|()()|()()( 2211 nn BAPBPBAPBPBAPBPAP += 。 此公式即为全概率公式。 (5)贝叶斯公式 设事件1B,2B,nB及A满足 1 1B,2B, ,nB两两互不相容,)(BiP0,=i1,2,n, 2 niiBA1=,0)( AP, 则 =njjjiiiBAPBPBAPBPABP1)/()()/()()/( ,i=1,2,n。 此公式即为贝叶斯公式。 )(iBP ,(1=i,2, ,n) , 通常叫先验概
4、率。 )/( ABPi,(1=i,2,n) ,通常称为后验概率。如果我们把A当作观察的“结果” ,而1B,2B,nB理解为“原因” ,则贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。 3、事件的独立性和伯努利试验 (1)两个事件的独立性 设事件A、B满足)()()( BPAPABP =,则称事件A、B是相互独立的(这个性质不是想当然成立的) 。 若事件A、B相互独立,且0)( AP,则有 )()()()()()()|( BPAPBPAPAPABPABP =所以这与我们所理解的独立性是一致的。 若事件A、B相互独立, 则可得到A与B、A与B、A与B也都相互独立。 (证明) 由定
5、义,我们可知必然事件和不可能事件 与任何事件都相互独立。 (证明) 同时, 与任何事件都互斥。 (2)多个事件的独立性 设 ABC 是三个事件,如果满足两两独立的条件, 考研数学知识点 -概率统计 Edited by 杨凯钧 2005 年 10 月 2P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A) 并且同时满足 P(ABC)=P(A)P(B)P(C) 那么 A、B、C 相互独立。 对于 n 个事件类似。 两两互斥互相互斥。 两两独立互相独立? (3)伯努利试验 定义 我们作了n次试验,且满足 null 每次试验只有两种可能结果,A发生或A不发生; nu
6、ll n次试验是重复进行的,即A发生的概率每次均一样; null 每次试验是独立的, 即每次试验A发生与否与其他次试验A发生与否是互不影响的。 这种试验称为伯努利概型,或称为n重伯努利试验。 用p表示每次试验A发生的概率,则A发生的概率为qp =1,用)(kPn表示n重伯努利试验中A出现)0( nkk 次的概率, 二. 随机变量及其分布 1、随机变量的分布函数 (1)离散型随机变量的分布率 设离散型随机变量X的可能取值为 X k(k=1,2,)且取各个值的概率,即事件(X=X k)的概率为 P(X=xk)=pk,k=1,2,, 则称上式为离散型随机变量X的概率分布或分布律。有时也用分布列的形式
7、给出: ,|)( 2121kkk pppxxxxXPX=。 显然分布律应满足下列条件: (1)0kp,,2,1=k, (2)=11kkp。 (2)分布函数 对于非离散型随机变量,通常有 0)( = xXP ,不可能用分布率表达。 例如日光灯管的寿命 X , 0)( 0 = xXP 。所以我们考虑用 X 落在某个区间 ,( ba 内的概率表示。 定义 设 X 为随机变量, x 是任意实数,则函数 )()( xXPxF = 称为随机变量 X 的分布函数。 )()()( aFbFbXaP = , 2,1,0=k , 则称随机变量 X 服从参数为 的泊松分布,记为)( X 或者P( )。 泊松分布为二
8、项分布的极限分布(np=,n) 。 超几何分布 ),min(,2,1,0,)(nMllkCCCkXPnNknMNkM=随机变量 X服从参数为 n,N,M 的超几何分布。 几何分布 ,3,2,1,)(1=kpqkXPk,其中p0,q=1-p。 随机变量 X服从参数为 p 的几何分布。 均匀分布 设随机变量X的值只落在a,b内,其密度函数)(xf在a,b上为常数k,即 =,0,)(kxf其他, 其中k=ab 1, 则称随机变量X在a,b上服从均匀分布,记为 XU(a,b)。 分布函数为 0, x,则称随机变量 X服从参数为的指数分布。 X 的分布函数为 记住几个积分: ,10=+dxxex,202
9、=+dxexx)!1(01=+ndxexxn+=01)( dxexx , )()1( =+ 正态分布 设随机变量X的密度函数为 222)(21)(=xexf , +为常数,则称随机变量X服从参数为、的正态分布或高斯(Gauss)分布,记为),(2NX。 )(xf具有如下性质: 1 )(xf的图形是关于=x对称的; 2 当=x时,21)( =f 为最大值; 3 )(xf以ox轴为渐近线。 特别当固定、改变时,)(xf的图形形状不变,只是集体沿ox轴平行移动,所以又称为位置参数。当固定、改变时,)(xf的图形形状要发生变化,随变大,)(xf图形的形状变得平坦,所以又称为形状参数。 若),(2NX,
10、则X的分布函数为 dtexFxt=222)(21)(。 。 参数0=、1=时的正态分布称为标准正态分布,记为)1,0( NX,其密度函数记为 2221)(xex=, +b。 =)(xf,xe0x, 0, 0 yfxfYX分别为 X,Y 的边缘分布密度。 (3)常见的二维分布 均匀分布 设随机向量(X,Y)的分布密度函数为 =其他,0),(1),(DyxSyxfD其中 S D为区域 D 的面积,则称(X,Y)服从 D 上的均匀分布,记为(X,Y)U(D) 。 正态分布 设随机向量(X,Y)的分布密度函数为 ,121),(2222121211221)(2)1(212 + =yyxxeyxf其中 1
11、|,0,0,2121 ,共 5 个参数,则称(X,Y)服从二维正态分布, 记为(X,Y)N( ).,2221,21 由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,反推则错。 即XN( ).(),22,2211 NY (5)二维随机向量联合分布函数及其性质 设(X,Y)为二维随机变量,对于任意实数 x,y,二元函数 ,),( yYxXPyxF = 称为二维随机向量(X,Y)的分布函数,或称为随机变量 X 和Y 的联合分布函数。 分布函数是一个以全平面为其定义域,以事件)(,)(|),(2121yYxX x1时, 有F (x 2,y) F(x 1,y);当 y 2y1时,
12、有 F(x,y 2) F(x,y1); (3)F(x,y)分别对 x和 y 是右连续的,即 );0,(),(),0(),( +=+= yxFyxFyxFyxF (4).1),(,0),(),(),( =+= FxFyFF 2、随机变量的独立性 (1)连续型随机变量 f(x,y)=fX(x)fY(y) 联合分布边缘分布f(x,y)=f X(x)fY(y) 直接判断,充要条件: 可分离变量 正概率密度区间为矩形 (2)二维正态分布 ,121),(2222121211221)(2)1(212 + =yyxxeyxf=0 (3)随机变量函数的独立性 若 X 与Y 独立,h,g 为连续函数,则:h(X)
13、和 g(Y)独立。 四. 随机变量的数字特征 (1)一维随机变量及其函数的期望 设 X 是离散型随机变量,其分布律为 P(kxX = ) pk,k=1,2, ,n, =nkkkpxXE1)( 期望就是平均值。 设 X 是连续型随机变量,其概率密度为 f(x), += dxxxfXE )()( 数学期望的性质 ( 1) E(C)=C ( 2) E(CX)=CE(X) ( 3) E(X+Y)=E(X)+E(Y),=niniiiiiXECXCE11)()( ( 4) E(XY)=E(X) E(Y),充分条件: X 和 Y 独立; 充要条件: X 和 Y 不相关。 ( 5) Y=g(X) 离散:=ni
14、kkpxgYE1)()( 连续:+= dxxxfXE )()( += dxxfxgYE )()()( (2)方差 D(X)=EX-E(X)2,方差 )()( XDX = ,标准差 离散型随机变量 =kkkpXExXD2)()( 连续型随机变量 += dxxfXExXD )()()(2方差的性质 ( 1) D(C)=0; E(C)=C ( 2) D(aX)=a2D(X); E(aX)=aE(X) ( 3) D(aX+b)= a2D(X); E(aX+b)=aE(X)+b ( 4) D(X)=E(X2)-E2(X) ( 5) D(X+Y)=D(X)+D(Y),充分条件: X 和 Y 独立; 充要条
15、件: X 和 Y 不相关。 D(X Y)=D(X)+D(Y) 2E(X-E(X)(Y-E(Y),无条件成立。 E(X+Y)=E(X)+E(Y),无条件成立。 (3)常见分布的数学期望和方差 分布名称符号 均值 方差 0-1分布),1( pB p )1( pp 二项分布),( pnB np )1( pnp 泊松分布)(P 几何分布)( pG p121pp考研数学知识点 -概率统计 Edited by 杨凯钧 2005 年 10 月 7超几何分布 ),( NMnH NnM11NnNNMNnM均匀分布 ),( baU 2ba +12)(2ab 指数分布 )(e 121正态分布 ),(2N 2 01
16、分布 X 0 1 q p E(X)=p,D(X)=pq 二项分布 X B(n,p),knkknnqpCkP=)( , (k=0,1,2n) E(X)=np,D(X)=npq 泊松分布 P() P(X=k)=!kexk ,k=0,1,2 E(X)= , D(X)= 超几何分布 nNknMNkMCCCkXP= )( E(X)=NnM几何分布 1)(=kpqkXP ,k=0,1,2 E(X)=p1, D(X)=2pq均匀分布 X Ua,b, f(x)=ab 1, a, b E(X)=2ba +, D(X)=12)(2ab 指数分布 f(x)= xe,(x0)E(X)=1, D(X)=21正态分布 X
17、 N(,2),222)(21)(=xexf E(X)= , D(X)= 2 2、二维随机变量的数字特征 (1)协方差和相关系数 对于随机变量 X 与 Y,称它们的二阶混合中心矩11 为X与 Y 的协方差或相关矩,记为 ),cov( YXXY或 ,即 ).()(11YEYXEXEXY= 与记号XY 相对应, X 与 Y 的方差 D( X)与 D( Y)也可分别记为XX 与YY 。 协方差有下面几个性质: (i) cov (X, Y)=cov (Y, X); (ii) cov(aX,bY)=ab cov(X,Y); (iii) cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);
18、(iv) cov(X,Y)=E(XY)-(E(X)(E(Y). 对于随机变量 X 与Y,如果 D(X)0, D(Y)0,则称 )()( YDXDXY为 X 与Y 的相关系数,记作XY (有时可简记为 ) 。 | |1,当| |=1 时,称 X与 Y 安全相关: 完全相关=时,负相关,当时,正相关,当11而当 0= 时,称 X 与Y 不相关。 与相关系数有关的几个重要结论 (i) 若随机变量 X 与 Y 相互独立,则 0=XY ;反之不真。 (ii) 若(X,Y)N( ,222121) ,则 X与 Y 相互独立的充要条件是 0= , 即X和Y不相关。 (iii) 以下五个命题是等价的: 0=XY
19、 ; cov(X,Y)=0; 考研数学知识点 -概率统计 Edited by 杨凯钧 2005 年 10 月 8E(XY)=E(X)E(Y); D(X+Y)=D(X)+D(Y); D(X-Y)=D(X)+D(Y). (2)二维随机变量函数的期望 =+为连续型。,为离散型;,),(),(),(),(),(),(YXdxdyyxfyxGYXpyxGYXGEijijji(3)原点矩和中心矩 对于正整数 k,称随机变量 X 的 k 次幂的数学期望为 X 的k 阶原点矩,记为 v k,即 uk=E(Xk), k=1,2, . 于是,我们有 =+. ,)( 续型时为连当为离散型时,当XdxxpxXpxuk
20、iikik对于正整数 k,称随机变量 X 与E(X)差的 k 次幂的数学期望为 X 的k 阶中心矩,记为k ,即 .,2,1,)( = kXEXEkk 于是,我们有 =+. ,)()()(续型时为连当为离散型时,当XdxxpXExXpXExukiikik对于随机变量 X 与Y,如果有 )(lkYXE 存在,则称之为 X与Y的 k+l阶混合原点矩,记为klu ,即 ).()( YEYXEXEukkl= 五. 大数定律和中心极限定理 1、切比雪夫不等式 设随机变量 X 具有数学期望 E(X)=,方差 D(X)=2,则对于任意正数,有下列切比雪夫不等式 22)( XP 切比雪夫不等式给出了在未知 X
21、 的分布的情况下,对概率 )( XP 的一种估计,它在理论上有重要意义。 2、大数定律 (1)切比雪夫大数定律 (要求方差有界) 设随机变量 X 1,X 2,相互独立,均具有有限方差,且被同一常数 C所界:D( Xi) npn 时 ,则 ekpPCkknkkn!)1( ).( n 其中 k=0,1,2,n,。 六. 数理统计的基本概念 1、总体、个体和样本 (1)总体与样本 总体 在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体) ;而把总体中的每一个单元称为样品 (或个体) 。 在以后的讨论中,我们总是把总体看成一个具有分布的随机变量(或随机向量) 。 (2)样本函数
22、与统计量 设nxxx ,21 为总体的一个样本,称 = (nxxx ,21 ) 为样本函数,其中 为一个连续函数。如果 中不包含任何未知参数,则称 (nxxx ,21 )为一个统计量。 2、统计量 (1)常用统计量 样本均值 .11=niixnx 样本方差 =niixxnS122.)(11(与概率论中的方差定义不同) 样本标准差 .)(1112=niixxnS 样本 k 阶原点矩 =nikikkxnM1.,2,1,1 样本 k 阶中心矩 =nikikkxxnM1.,3,2,)(1 (二阶中心矩=niiXXnS122)(1* 与概率论中的方差定义相同) (2)统计量的期望和方差 =)(XE ,n
23、XD2)(= , 考研数学知识点 -概率统计 Edited by 杨凯钧 2005 年 10 月 1022)( =SE ,221)*( nnSE= , 其中=niiXXnS122)(1* ,为二阶中心矩。 3、三个抽样分布(2、t、F 分布) (1)2分布 设 n 个随机变量nXXX ,21 相互独立,且服从标准正态分布,可以证明:它们的平方和 =niiXW12的分布密度为 2) (3)F分布 设 )(),(2212nYnX ,且 X与Y 独立,可以证明:21/nYnXF = 的概率密度函数为 + +=+,0,1222)(2211222121212111yyynnynnnnnnyfnnnn我们
24、称随机变量 F 服从第一个自由度为 n 1,第二个自由度为 n 2的F分布,记为 Ff(n 1, n2). 正态分布 =1, )()(1ntnt=, ),(1),(12211nnFnnF=4、正态总体下统计量的分布和性质 注意一个定理: X 与2S 独立。 (1)正态分布 设nxxx ,21 为来自正态总体 ),(2N 的一个样本,则样本函数 ).1,0(/Nnxudef(2) t-分布 设nxxx ,21 为来自正态总体考研数学知识点 -概率统计 Edited by 杨凯钧 2005 年 10 月 11),(2N 的一个样本,则样本函数 ),1(/ntnSxtdef其中 t(n-1)表示自由
25、度为 n-1 的t分布。 (3)2 分 布 设nxxx ,21 为来自正态总体 ),(2N 的一个样本,则样本函数 ),1()1(222nSnwdef其中 )1(2n 表示自由度为 n-1的2 分布。 (4)F分布 设nxxx ,21 为来自正态总体),(2N 的一个样本,而nyyy ,21 为来自正态总体),(22N 的一个样本,则样本函数 ),1,1(/2122222121 nnFSSFdef其中 ,)(11211211=niixxnS ;)(11212222=niiyynS )1,1(21 nnF 表示第一自由度为 11n ,第二自由度为12n 的 F 分布。 七. 参数估计 1、点估计
26、的两种方法 (1)矩法 所谓矩法就是利用样本各阶原点矩与相应的总体矩,来建立估计量应满足的方程,从而求得未知参数估计量的方法。 设总体 X 的分布中包含有未知数m ,21 ,则其分布函数可以表成 ).,;(21 mxF 显示它的 k 阶原点矩),2,1)( mkXEvkk= 中也包含了未知参数m ,21 ,即 ),(21 mkkvv = 。又设nxxx ,21 为总体 X 的 n 个样本值,其样本的 k 阶原点矩为 =nikik xnv11).,2,1( mk = 这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有 =nimimmniimniimxnvxnvxn
27、v121122121211.1),(,1),(,1),(由上面的 m 个方程中,解出的 m 个未知参数),(21m 即为参数(m ,21 )的矩估计量。 (2)最大似然法 所谓最大似然法就是当我们用样本的函数值估计总体参数时,应使得当参数取这些值时,所观测到的样本出现的概率为最大。 当总体 X 为连续型随机变量时,设其分布密度为),;(21 mxf ,其中m ,21 为未知参数。又设nxxx ,21 为总体的一个样本,称 ),;(),(11122=nimimnxfL 为样本的似然函数,简记为 Ln. 当总体 X 为离型随机变量时,设其分布律为),;(21 mxpxXP = ,则称 ),;(),
28、;,(1111222=nimimnxpxxxL 为样本的似然函数。 若似然函数 ),;,(2211 mnxxxL 在m ,21 处取到最大值,则称 m ,21 分别为考研数学知识点 -概率统计 Edited by 杨凯钧 2005 年 10 月 12m ,21 的最大似然估计值,相应的统计量称为最大似然估计量。我们把使 Ln达到最大的 m ,21 分别作为m ,21 的估计量的方法称为最大似然估计法。 由于 lnx 是一个递增函数, 所以 Ln与 lnLn同时达到最大值。我们称 miLiiin,2,1,0ln=为似然方程。由多元微分学可知,由似然方程可以求出),2,1)(,(21mixxxni
29、i = 为i 的最大似然估计量。 容易看出,使得 Ln达到最大的 i 也可以使这组样本值出现的可能性最大。 2、估计量的评选标准 (1)无偏性 设 ),(21 nxxx = 为求知参数 的估计量。若 E ( ) = ,则称 为 的无偏估计量。 若总体 X 的均值 E( X)和方差 D( X)存在,则样本均值 x 和样本方差 S2分别为 E( X)和 D( X)的无偏估计,即 E( x ) =E( X) , E( S2) =D( X) 。 (2)有效性 设 ),(2111nxxx = 和 ),(2122nxxx =是未知参数 的两个无偏估计量。若 21 )( nnP 则称 n 为 的一致估计量(
30、或相合估计量) 。 3、区间估计 (1)置信区间和置信度 设总体 X 含有一个待估的未知参数 。如果我们从样本nxxx ,21 出发,找出两个统计量),(2111 nxxx = 与),(2122 nxxx = )(21 , 使得区间 ,21 以)10(1 的概率包含这个待估参数 ,即 ,121 =P 那么称区间 ,21 为 的置信区间, 1 为该区间的置信度(或置信水平) 。 (2)单正态总体的期望和方差的区间估计 设nxxx ,21 为总体 ),(2NX 的一个样本,在置信度为 1 下,我们来确定2和 的置信区间 ,21 。具体步骤如下: ( i)选择样本函数; ( ii)由置信度 1 ,查
31、表找分位数; ( iii)导出置信区间 ,21 。 下面分三种情况来讨论。 已知方差,估计均值 (i)选择样本函数 设方差202 = ,其中20 为已知数。我们知道是=niixnx11的一个点估计,并且知道包含未知参数 的样本函数。 ).1,0(/0Nnxu= (ii) 查表找分位数 对于给定的置信度 1 ,查正态分布分位数表,找出分位数 ,使得 = )|(| uP 1 。 即 考研数学知识点 -概率统计 Edited by 杨凯钧 2005 年 10 月 13.1/2 =nxP ( iii)导出置信区间 由不等式 2)( nx推得 ,00nxnx + 这就是说,随机区间 +nxnx00, 以
32、 1 的概率包含 。 未知方差,估计均值 ( i)选择样本函数 设nxxx ,21 为总体 ),(2N 的一个样本,由于2 是未知的,不能再选取样本函数 u。这时可用样本方差 =niixxnS122)(11来代替2 ,而选取样本函数 ).1(/= ntnSxt(ii)查表找分位数 对于给定的置信度 1 , 查 t 分位数表, 找出分位数 ,使得 = )|(| uP 1 。 即 .1/ =nSxP ( iii)导出置信区间 由不等式 2)( nx推得 ,nSxnSx + 这就是说,随机区间 +nSxnSx , 以 1 的概率包含 。 方差的区间估计 ( i)选择样本函数 设nxxx ,21 为来自总体 ),(2N 的一个样本,我们知道=niixxnS122)(11是2 的一个点估计,并且知道包含未知参数2 的样本函数 ).1()1(222= nSn ( ii)查表找分位数 对于给定的置信度 1 ,查2 分布分位数表,找出两个分位数21 与 ,使得由于2 分布不具有对称性,因此通常采取使得概率对称的区间,即 .1)(21 =P 于是有 .1)1(2221 =SnP ( iii)导出置信区间 2221)1( Sn由不等式 12222)1()1(SnSn 以 1 的概率包含2 ,而随机区间 SnSn121,1以 1 的概率包含 。