1、- 1 -第一章 随机事件及其概率一、基本概念1 事件的关系与运算、运算规律因为事件是样本空间的一个集合, 故事件之间的关系与运算可按集合之间的关系和运算来处理。事件间的关系及运算与集合的关系及运算是一致的表 1.1 没 有 相 同 的 元 素与互 不 相 容和 事 件事 件 的 差 集与不 发 生发 生 而 事 件事 件 的 交 集与同 时 发 生与 事 件事 件 的 和 集与至 少 有 一 个 发 生与 事 件事 件 的 相 等与相 等与 事 件事 件 的 子 集是发 生发 生 导 致事 件 的 余 集的 对 立 事 件 子 集事 件 元 素基 本 事 件 空 集不 可 能 事 件 全 集
2、必 然 事 件样 本 空 间 集 合 论概 率 论记 号 BABAAB BABABA,对偶律: ,2、概率的定义频率 :,其中 为试验次数, 为事件 发生的次数Anf()nA概率的统计定义:在相同条件下重复进行 n 次试验,若事件 发生的频率 随着试验次数 n 的增大而稳定地在某个常数 ( 附近摆动,则称 为事件的概率,记为Anf()p)10p)(AP古典概型:具有下列两个特征的随机试验模型:1. 随机试验只有有限个可能的结果;2. 每一个结果发生的可能性大小相同.概率的古典定义:在古典概型的假设下,设事件 包含其样本空间 中 个基本事件, 即 则事件 发生的概率ASk ,21 kiii ee
3、AA.)()()11 中 基 本 事 件 的 总 数包 含 的 基 本 事 件 数nePAPkjikjijj 概率的公理化定义:设 是随机试验, 是它的样本空间,对于 的每一个事件 赋于一个实数, 记为 , 若 满足下列三个条件:ESEA)(AP1. 非负性:对每一个事件 ,有 ;0)(2. 完备性: ;1)(P3. 可列可加性:设 是两两互不相容的事件,则有 则称 为事件 的概率.,2A.)()(11iii)(A概率的基本性质: 1 0P;- 2 -设 是两两互不相容的事件,则有 2 1nA, 11nniiiP(A)(). 3 P;特别地,若 ,则 4 BB;BPA;PB;对任一事件 A 有
4、 5 1对于任意两个事件 A,B 有 6 PAP3、条件概率与独立性条件概率:( ) ,在事件 发生的条件下,事件 的条件概率.)(|(APB0B事件的独立性:, 相互独立 ()P相互独立nA,21 111j jkkiijjk,n,AP事件独立的性质:当 , 时, , 相互独立与 , 互不相容不能同时成立. 但 与 既相互独立又互不相容(自证). 1 0)(P)(BBS设 , 是两事件, 且 ,若 , 相互独立, 则 . 反之亦然. 2 0A)(|(伯努利概型(试验的独立性)设随机试验只有两种可能的结果:事件 发生(记为 )或事件 不发生(记为 ),则称这样的试验为伯努利(Bermourlli
5、)试验。A将伯努利试验独立地重复进行 次,称这一串重复的独立试验为 重伯努利试验。nn二、基本公式1、加法公式: 1 PABP,B、 2 11 1nniiiji()(),Ai,j,n、 3 4 PABCPBCPABCPBAC若 ,则 5 ; 6 12、乘法公式, 相互独立, 1 ABP()(AB)- 3 -( ) ,或 ( ) 2P(B|A)P(B)0(AP(|B)P(A)0(B, 31212112nnnnn| 121nA3、全概率公式设 是一个完备事件组,且 则对任一事件 ,有 ,21nA,0)(iAP,21B |)|()(1nnBBP注: 全概率公式可用于计算较复杂事件的概率, 公式指出
6、: 在复杂情况下直接计算 不易时,可根据具体情况构造一组完备事件 , 使事件 发生的概率是各事件 发生条件下)(PiAB),21(iA引起事件 发生的概率的总和。4、贝叶斯公式设 是一完备事件组,则对任一事件 , ,有 ,21nAB0)(,21,)|()()|( iAPBPj jjiiii注: 公式中 , 和 分别称为原因的验前概率和验后概率 . 是在没有进一步信息(不知道事件 是否发生)的情况下诸事件发生的概率.当获得新的信息(知道iA|i ),)(iPB发生),人们对诸事件发生的概率 有了新的估计. 贝叶斯公式从数量上刻划了这种变化.)|(i第二章 随机变量及其分布一、基本概念分布函数:定
7、义: 即 x 是任意实数FxPXx()性质:值域(有界性):对于任意实数 x, ,01F ;1)(lim)(,0)(lim)( xFFxx单调非减性: 若 , 则 ;21)(21x右连续性: ).(lim00xx计算概率:对于任意实数 ,且 ,有12,21221PxXFx二、离散型随机变量性质:; 012ip, 12ip,分布律与分布函数:设离散型随机变量 的概率分布为 ,则 的X ni ppxx21 X分布函数为 i iixxF(x)PXPp常见的离散型随机变量:- 4 -二项分布 :Bn,p1012nkkknPXxCp,n泊松分布 :012ke,!三、连续性随机变量定义:是连续型随机变量
8、存在非负可积函数 ,使得对于任意实数 成立:X)(xfx.)()(xdtfXPF概率密度函数:是连续型随机变量的概率密度函数 ,且)(xf 0f .xtf性质:,对一切 x 成立 1 0f(确定待定常数) 2 .1)(d对于任意实数 ,且 ,有 3 2x,2x211xPXf()d若 在点 处连续, 则 4 )(f )(fF连续型随机变量 取任一指定值 的概率为 0 5 XRa设 充分小,则随机变量 X 取区间 上值的概率近似等于 6 ,xf常见的连续型随机变量均匀分布:若连续型随机变量 的概率密度为 (记住密度函数)X其 它,01)(bxabxf则称 在区间 上服从均匀分布, 记为 .)(ba
9、(UX正态分布:定义 :若随机变量 的概率密度为X.,21)(2)( xexfx其中 和 都是常数, 则称 服从参数为 和 的正态分布. 记为。)0(2参数意义:, 的概率密度 关于直线 对称,由对称性可以得到 , X 落在 左右两个相同大小区域内的概率相等EXfx 1 2F() 2PhPXh- 5 -, 决定了概率密度 的形状,最大值2DXfxmax1()2f标准正态分布正态分布当 时称为标准正态分布, 此时, 其密度函数和分布函数常用 和 表示: 10 )(x,21)(2xexxtde21)(标准正态分布的重要性在于, 任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.正态分布化
10、为标准正态分布:设 则 ),(2NX).1,0(NXY标准正态分布表的使用: 标准正态分布表中给出的是 时 的数值, 当 时, 利用正态分布的对称性,有 1 0x)(x );(1)(x若 则 2 ),( );(abaP若 , 的分布函数 3 2NX ;)( xXPF 4 Yba .a正态分布的线性函数:若 ,则随机变量 ,),(2NX2,aXbN0四、随机变量的函数的分布计算:例 3,习题 2-5第三章 多维随机变量及其分布一、二维随机变量及其分布定义定义在 上的两个随机变量 所组成的向量S)(),(eYX分布函数:对任意实数 , 二元函数 ,称为二维随机变量 的分布函数或称为随机变量 和 的
11、联合分yx ,)()(),( yYxXPyYxPyxF记 为),(YXXY布函数几何意义: 在 处的函数值是随机点 落在以点 为顶点而位于该点左下方的无穷矩形区域内的概率。(,),),(X,性质:且对任意固定的 对任意固定的 1 ,1)(0yxF,y,0),(F,0),(xF;1),(,0),(F关于 和 均为单调非减函数, 即对任意固定的 当 对任意固定的 当 2 , ,1212yxx);,(122yxFy关于 和 均为右连续,即 3 )( ).,()(),( yx二、离散型二维随机变量定义若二维随机变量 只取有限个或可数个值, 则称 为二维离散型随机变量。 为二维离散型随机变量当且仅当 均
12、为离散型随机变量.)(YX),(YX),(YXYX,联合分布律:若二维离散型随机变量 所有可能的取值为 则称 为二维离散型随机变量 的概率分布),(),(jiyx,21 ),21,(,jipyxPijji ),(YX- 6 -(分布律), 或 的联合概率分布(分布律).YX与计算概率取值于任何区域 上的概率,即 ,),DDyxijjipYXP),(),(性质: ijp,0ijijp1分布函数 .,),( ,yxijipYxXPyxF三、连续型二维随机变量定义:二维连续型随机变量 若存在一个非负可积的二元函数 ,使对任意实数 , 有(,)Y)(yxf)(yx ,),()(xydstfF概率密度:
13、为 的概率密度(密度函数) 非负,且对任意实数 , 成立),(yxf,X),(f ),( ,),(),xytf性质: ;0),(1f(确定待定常数);1),(2Fdxy(3)设 是 平面上的区域 ,点 落入 内的概率为DOYXD(积分限的确定 )(3.1 节,例 3,例 4,习题 3-1 的 5 题)DdxyfyxP),(),( 0X,Yfxy(4)若 在点 连续, 则有 ),(f)( ).,(),(2F四、二维离散型随机变量的边缘分布关于 的边缘律),(YX1iijp,关于 的边缘律 2jij五、二维连续型随机变量的边缘分布关于 的边缘分布 .),(YX,YxXPxxF ,),(),( xx
14、 dstfdstf(选择使得 的区域积分),)()(dyffX f(,y)0关于 的边缘分布 .,Y(),FyPXYy(,)(,),yfstdfstd- 7 -,(选择使得 的区域积分)dxyfyfY)()(f(,y)0二维正态分布的边缘分布,则 ,21,XN21,XN2,Y七、相互独立的随机变量判断方法:离散型随机变量的独立性和 相互独立 对 的所有可能取值 有 即 XY),(YX),(jix ,jiji yYPxXyYxXP,21,jipiij ,),(yFxy连续型随机变量的独立性若对任意的 , 有 几乎处处成立, 则称 相互独立.)()(yfxfYXYX,判断独立:例 3、例 4、例
15、7八、二维随机变量的函数的分布例:例 5 习题 3-3 的 4 题、5 题第四章 随机变量的数字特征一、随机变量的数学期望1.离散型设 是离散型随机变量的概率分布为 如果 绝对收敛, 则定义 的数学期望(又称均值)为 X,21,ipxXPi 1iipxX.)(1iipxXE2.连续型设 是连续型随机变量, 其密度函数为 ,如果 绝对收敛, 定义 的数学期望为 )(xfdxf)( .)()(dxfE性质 1. 设 是常数, 则C;)(E2若 是常数,则k)(Xk3. ;)(2121X4. 设 独立, 则 ;Y)(YE注:由 不一定能推出 独立,)(E,数学期望的应用 4.1 节例 7二、随机变量
16、的方差定义设 是一个随机变量, 若 存在,则称它为 的方差, 记为X2)(XE .)()(2XED方差的算术平方根 称为标准差或均方差, 它与 具有相同的度量单位, 在实际应用中经常使用.)(D方差刻划了随机变量 的取值与数学期望的偏离程度,它的大小可以衡量随机变量取值的稳定性.- 8 -从方差的定义易见:(1)若 的取值比较集中 ,则方差较小;X(2)若 的取值比较分散 ,则方差较大;(3)若方差 , 则随机变量 以概率 1 取常数值,此时 也就不是随机变量了.0)(DXX计算方法利用数学期望的性质, 易得计算方差的一个简化公式: . 22)()ED性质1. 设 常数, 则 ;C()01PX
17、C2. 若 是随机变量, 若 是常数, 则X);()(23. 设 是两个随机向量,则 Y 2()()(),DYDYEXYEXcov特别地, 若 相互独立, 则 X.)(注: 对 维情形, 有: 若 相互独立, 则nn,21 .)(,)(12111 niininiini XDCX三、协方差定义设 为二维随机向量,若 存在, 则称其为随机变量 和 的协方差, 记为 ,即)(YX)()(YEXEXY)(YXCov.)(covY计算方法利用数学期望的性质, 易将协方差的计算化简.(,)()().特别地, 当 与 独立时, 有 XY.0,covYX协方差的性质 );(,c()1D,2,其中 是常数;)c
18、ov,ov3YabYba为任意常数;CX0)()4 ).,cov(),(,c52121 YX(6) 若 与 相互独立时 ,则Y.0covY随机变量和的方差与协方差的关系),c()()(DXD特别地, 若 与 相互独立时, 则 .X四、相关系数定义设 为二维随机变量, 称 )(YX,0)(,)(YDX(,),()()XYEXYCovXYCovDD为随机变量 和 的相关系数.有时也记 为 . XY- 9 -特别地,当 时,称 与 不(线性)相关.0XY性质1. ;1|XY2. 若 和 相互独立, 则 .0XY3. 若 ,则 当且仅当存在常数 使 , 而且当 时, ;当 时, D1|XY).0(,a
19、b1baXYP0a1XY0a.1XY注: 相关系数 刻画了随机变量 Y 与 X 之间的“ 线性相关”程度.Y的值越接近 1, Y 与 X 的线性相关程度越高;|X的值越近于 0, Y 与 Y 的线性相关程度越弱.|Y当 时, Y 与 X 的变化可完全由 X 的线性函数给出 .1|X当 时, Y 与 X 之间不是线性关系.0X,Y0X,Y1X,Y1、Pab10、越 接 近 0, 线 性 关系 程 度 越 弱说 明 相 关 系 数 定 量 地 刻 画 了 X与 Y的 相 关 程 度 , 表 征 了 两 者 的 线性 关 系 的 紧 密 程 度 。 Pab1ab1X、YX、YX、Y、2、不 相 关
20、与 相 互 独 立 的 关 系 :、若若 X、Y相 互 独 立 , 则相 互 独 立 , 则 X,Y不 相 关不 相 关 、即 没 有 任 何 关 系 , 也 就即 没 有 任 何 关 系 , 也 就不 存 在 线 性 关 系不 存 在 线 性 关 系 、2、若若 ,不 相 关不 相 关 则 不 一 定 相 互 独 立则 不 一 定 相 互 独 立。3若若 、相 关相 关 ( 指 存 在 线 性 关 系 ) , 则 一 定 不 独 立( 指 存 在 线 性 关 系 ) , 则 一 定 不 独 立 、(线性)相关、不相关与相互独立的关系 正态分布的相关、不相关与相互独立的关系若 ,则 X 和 Y
21、 相互独立 X 和 Y 不相关21,XYN0五、切比雪夫不等式和中心极限定理切比雪夫不等式 (计算)随机变量具有数学期望 E(X )=,方差 D(X )= 2,则对于任意正数 ,不等式或 ,2PX21PX- 10 -中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布.林德伯格 勒维定理 (计算)设 是独立同分布的随机变量序列, 且 ,21nX ,2,1)(,)( niXDEii 则 211i xt/inlmPedx注: 定理表明 : 当 充分大时 , 个具有期望和方差的独立同分布的随机
22、变量之和近似服从正态分布 . 虽然在一般情况下 , 我们很难求出 的分布的确切形式, 但当 很大时, n nX21 n可求出其近似分布. 由定理结论有 .),/,()1,0(/1),0( 121 niiniinii XNXXNX 近 似近 似故定理又可表述为: 均值为 , 方差的 的独立同分布的随机变量 的算术平均值 , 当 充分大时近似地服从均值为 ,方差为 的正态分布. 这一结22n n/2果是数理统计中大样本统计推断的理论基础.计算:例 2,例 3,习题 4-4第五章 数理统计的基础知识一、矩统计量,简称为样本矩设 为总体 的一个样本nX,211. 样本均值 ii12. 样本方差 nii
23、XS22)(3. 样本标准差 nii12二、分位数正态分布的分位数 :上侧 分位数、双侧分位数的意义,以及如何得到分位数三、单正态总体的抽样分布(置信区间、假设检验中使用)定理 1 设总体 是取自 X 的一个样本, 与 分别为该样本的样本均值与样本方差, 则有),(2NXn,21 2S(1) ; (2) /,n).10(/NU第六章 参数估计一、评价估计量的标准1. 无偏性; 设 是未知参数 的估计量, 若 则称 为 的无偏估计量.),(1nX,)(E2. 有效性; 一个参数 常有多个无偏估计量,在这些估计量中,自然应选用对 的偏离程度较小的为好,即一个较好的估计量的方差应该较小.由此引入评选
24、估计量的另一标准有效性.设 和 都是参数 的无偏估计量, 若 ,则称 较 有效.),(11n),(12nX )(21D123. 相合性(一致性).设 为未知参数 的估计量, 若 依概率收敛于 , 即对任意 , 有 或 则称 为 的),(1nX0,|limPn ,0|limPn(弱)相合估计量.例:习题 6-1 的 6 题,总习题六的 3 题- 11 -二、单正态总体的置信区间置信区间长度与置信度的关系1. 置信度 的含义: 在随机抽样中, 若重复抽样多次, 得到样本 的多个样本值 , 对应每个样本值都确定了一个置信区间 , 每个这样的区间要么1 nX,21 ),(21nx )(包含了 的真值,
25、 要么不包含 的真值. 根据伯努利大数定理, 当抽样次数充分大时, 这些区间中包含 的真值的频率接近于置信度(即概率) , 即在这些区间中包含 的真值的区间大约有 1个,不包含 的真值的区间大约有 个.)%(0%02. 置信区间 也是对未知参数 的一种估计, 区间的长度意味着误差, 故区间估计与点估计是互补的两种参数估计.3. 置信度与估计精度是一对矛盾.置信度 越大 , 置信区间 包含 的真值的概率就越大, 但区间 的长度就越大, 对未知参数 的估计精度就越差. 反之, 对参数 的估计精度越高, 1),()(置信区间 长度就越小, 包含 的真值的概率就越低, 置信度 越小. 一般准则是: 在
26、保证置信度的条件下尽可能提高估计精度.)(),(1单正态总体均值的置信区间 (1)设总体 其中 已知, 而 为未知参数, 是取自总体 X 的一个样本. 对给定的置信水平 , 的置信区间为),(2NX2nX,21 1/2/ nunu因此 的置信区间长度为 2/例:6.3 节例 1,习题 6-3 的 3 题,6.4 节例 1,2;习题 6-4 的 1,2 题第七章 假设检验一、总体均值的假设检验当检验关于总体均值 (数学期望)的假设时,该总体中的另一个参数,即方差 是否已知,会影响到对于检验统计量的选择,故下面分两种情形进行讨论.2方差 已知情形2设总体 ,其中总体方差 已知, 是取自总体 X 的
27、一个样本, 为样本均值.)(2NX2nX,21双侧检验:检验假设 .其中 为已知常数.0100:,:H由第五章第三节知, 当 为真时, ),1(/NnU故选取 作为检验统计量, 记其观察值为 u. 相应的检验法称为 u 检验法.因为 是 的无偏估计量, 当 成立时, 不应太大, 当 成立时, 有偏大的趋势, 故拒绝域形式为 ( 待定).X0|1H|uknxu/|0对于给定的显著性水平 ,查标准正态分布表得 , 使2/k|2/UP由此即得拒绝域为 。即/0/|unxu ),()(W根据一次抽样后得到的样本观察值 计算出 U 的观察值 u, 若 , 则拒绝原假设 , 即认为总体均值与 有显著差异; 若 , 则接受原假设 , 即认nx,21 2/|0H02/|u0H为总体均值与 无显著差异 .0例:7.1 节例 1,习题 7-1 的 7 题,7.2 节例 1;习题 7-2 的 1 题