1、概率论与数理统计总复习提纲第一块 随机事件及其概率内 容 提 要基本内容:随机事件与样本空间,事件的关系与运算,概率的概念和基本性质,古典概率,几何概率,条件概率,与条件概率有关的三个公式,事件的独立性,贝努里试验.1、随机试验、样本空间与随机事件(1)随机试验:具有以下三个特点的试验称为随机试验,记为 .1) 试验可在相同的条件下重复进行;2) 每次试验的结果具有多种可能性,但试验之前可确知试验的所有可能结果;3) 每次试验前不能确定哪一个结果会出现.(2)样本空间:随机试验 的所有可能结果组成的集合称为 的样本空间 记为 ;试验的每一个可能结果,即 中的元素,称为样本点,记为 .(3)随机
2、事件:在一定条件下,可能出现也可能不出现的事件称为随机事件,简称事件;也可表述为事件就是样本空间的子集,必然事件(记为 )和不可能事件(记为 ).2、事件的关系与运算(1)包含关系与相等:“事件 发生必导致 发生”,记为 或 ; 且 .(2)互不相容性: ; 互为对立事件 且 .(3)独立性:(1)设 为事件,若有 ,则称事件 与 相互独立. 等价于:若( ). (2)多个事件的独立:设 是 n 个事件,如果对任意的 ,任意的,具有等式 ,称 个事件 相互独立3、事件的运算(1)和事件(并):“事件 与 至少有一个发生”,记为 .(2)积事件(交):“ 事件 与 同时发生”,记为 或 .(3)
3、 差事件、对立事件(余事件) :“事件发生 而 不发生”,记为 称为 与 的差事件;称为 的对立事件;易知: .4、事件的运算法则1) 交换律: , ;2) 结合律: , ;3) 分配律: , ;4) 对偶(De Morgan) 律: , ,可推广 5、概率的概念(1)概率的公理化定义:(2)频率的定义:事件 在 次重复试验中出现 次,则比值 称为事件 在 次重复试验中出现的频率,记为 ,即 .(3)统计概率: 称 为事件 的(统计)概率.在实际问题中,当 很大时,取(4)古典概率: 若试验的基本结果数为有限个,且每个事件发生的可能性相等,则(试验对应古典概型)事件 发生的概率为:.(5)几何
4、概率:若试验基本结果数无限,随机点落在某区域 g 的概率与区域 g 的测度( 长度、面积、体积等)成正比,而与其位置及形状无关,则(试验对应几何概型),“在区域 中随机地取一点落在区域 中”这一事件发生的概率为:.(6)主观概率:人们根据经验对该事件发生的可能性所给出的个人信念.6、概率的基本性质(1)不可能事件概率零: 0.(2)有限可加性:设 是 n 个两两互不相容的事件,即 ,( ) ,则有 .(3)单调不减性:若事件 ,且.(4) 互逆性: 且 .(5) 加法公式:对任意两事件 ,有 ;此性质可推广到任意 个事件的情形.(6)可分性:对任意两事件 ,有 ,且7、条件概率与乘法公式(1)
5、条件概率:设 是两个事件,即 ,则称为事件 发生的条件下事件 发生的条件概率(2)乘法公式:设 且 则称为事件 的概率乘法公式.8、全概率公式与贝叶斯(Bayes)公式(1)全概率公式:设 是 的一个划分,且 , ,则对任何事件 ,有称为全概率公式.(2)贝叶斯(Bayes)公式:设 是 的一个划分,且 ,则对任何事件 ,有称为贝叶斯公式或逆概率公式.9、贝努里(Bernoulli)概型(1)只有两个可能结果的试验称为贝努里试验,常记为 也叫做“成功失败”试验,“成功”的概率常用 表示,其中 “成功”.(2)把 重复独立地进行 次,所得的试验称为 重贝努里试验,记为 (3)把 重复独立地进行可
6、列多次,所得的试验称为可列重贝努里试验,记为 以上三种贝努里试验统称为贝努里概型(4) 中成功 次的概率是: 其中 .疑 难 分 析1、必然事件与不可能事件必然事件是在一定条件下必然发生的事件,不可能事件指的是在一定条件下必然不发生的事件.它们都不具有随机性,是确定性的现象,但为研究的方便,把它们看作特殊的随机事件.2、互逆事件与互斥(不相容)事件如果两个事件 与 必有一个事件发生,且至多有一个事件发生,则 、 为互逆事件;如果两个事件与 不能同时发生,则 、 为互斥事件.因而,互逆必定互斥,互斥未必互逆.区别两者的关键是:当样本空间只有两个事件时,两事件才可能互逆,而互斥适用与多个事件的情形
7、.作为互斥事件在一次试验中两者可以都不发生,而互逆事件必发生一个且只发生一个.3、两事件独立与两事件互斥两事件 、 独立,则 与 中任一个事件的发生与另一个事件的发生无关,这时 ;而两事件互斥,则其中任一个事件的发生必然导致另一个事件不发生,这两事件的发生是有影响的,这时 .可以用图形作一直观解释.在图 1.1 左边的正方形中,图 1.1,表示样本空间中两事件的独立关系,而在右边的正方形中, ,表示样本空间中两事件的互斥关系.4、条件概率 与积事件概率是在样本空间 内,事件 的概率,而 是在试验 增加了新条件 发生后的缩减的样本空间 中计算事件 的概率 .虽然 、 都发生,但两者是不同的,一般
8、说来,当 、 同时发生时,常用,而在有包含关系或明确的主从关系时,用 .如袋中有 9 个白球 1 个红球,作不放回抽样,每次任取一球,取 2 次,求:(1)第二次才取到白球的概率;(2)第一次取到的是白球的条件下,第二次取到白球的概率.问题(1)求的就是一个积事件概率的问题,而问题(2)求的就是一个条件概率的问题.5、全概率公式与贝叶斯(Bayes)公式当所求的事件概率为许多因素引发的某种结果,而该结果又不能简单地看作这诸多事件之和时,可考虑用全概率公式,在对样本空间进行划分时,一定要注意它必须满足的两个条件.贝叶斯公式用于试验结果已知,追查是何种原因(情况、条件)下引发的概率.第二块 随机变
9、量及其分布内 容 提 要基本内容:随机变量,随机变量的分布的概念及其性质,离散型随机变量的概率分布,连续型随机变量的概率分布,常见随机变量的分布,随机变量函数的分布.1、随机变量设 是随机试验的样本空间,如果对于试验的每一个可能结果 ,都有唯一的实数 与之对应,则称 为定义在 上的随机变量,简记为 .随机变量通常用大写字母 等表示.2、离散型随机变量及其分布列如果随机变量 只能取有限个或可列个可能值,则称 为离散型随机变量.如果 的一切可能值为,并且 取 的概率为 ,则称为离散型随机变量 的概率函数(概率分布或分布律).也称分布列,常记为其中 .常见的离散型随机变量的分布有:(1)两点分布(0
10、-1 分布):记为 ,分布列为或 (2)二项分布:记为 ,概率函数(3)泊松分布,记为 ,概率函数泊松定理 设 是一常数, 是任意正整数,设 ,则对于任一固定的非负整数 ,有.当 很大且 很小时,二项分布可以用泊松分布近似代替,即,其中(4)超几何分布:记为 ,概率函数,其中 为正整数,且 .当 很大,且 较小时,有(5)几何分布:记为 ,概率函数.3、分布函数及其性质分布函数的定义:设 为随机变量, 为任意实数,函数称为随机变量 的分布函数.分布函数完整地描述了随机变量取值的统计规律性,具有以下性质:(1)有界性 ;(2)单调性 如果 ,则 ;(3)右连续, 即 ;(4)极限性 ;(5)完美
11、性 .4、连续型随机变量及其分布分布如果对于随机变量 的分布函数 ,存在非负函数 ,使对于任一实数 ,有 ,则称 为 连续型随机变量 .函数 称为 的概率密度函数 .概率密度函数具有以下性质:(1) ; (2) ;(3) ; (4) ;(5)如果 在 处连续,则 .常用连续型随机变量的分布:(1)均匀分布:记为 ,概率密度为分布函数为 (2)指数分布:记为 ,概率密度为分布函数为 (3)正态分布:记为 ,概率密度为,相应的分布函数为 当 时,即 时,称 服从标准正态分布.这时分别用 和 表示 的密度函数和分布函数,即具有性质: .一般正态分布 的分布函数 与标准正态分布的分布函数 有关系:.5
12、、随机变量函数的分布(1)离散型随机变量函数的分布设 为离散型随机变量,其分布列为(表 2-2):表 2-2 则 任为离散型随机变量,其分布列为(表 2-3):表 2-3 有相同值时,要合并为一项,对应的概率相加.(2)连续型随机变量函数的分布设 为离散型随机变量,概率密度为 ,则 的概率密度有两种方法可求.1)定理法:若 在 的取值区间内有连续导数 ,且 单调时, 是连续型随机变量,其概率密度为.其中 是 的反函数.2)分布函数法:先求 的分布函数然后求 .疑 难 分 析1、随机变量与普通函数随机变量是定义在随机试验的样本空间 上,对试验的每一个可能结果 ,都有唯一的实数 与之对应.从定义可
13、知:普通函数的取值是按一定法则给定的,而随机变量的取值是由统计规律性给出的,具有随机性;又普通函数的定义域是一个区间,而随机变量的定义域是样本空间.2、分布函数 的连续性定义左连续或右连续只是一种习惯.有的书籍定义分布函数 左连续,但大多数书籍定义分布函数 为右连续. 左连续与右连续的区别在于计算 时, 点的概率是否计算在内.对于连续型随机变量,由于,故定义左连续或右连续没有什么区别;对于离散型随机变量,由于 ,则定义左连续或右连续时 值就不相同,这时,就要注意对 定义左连续还是右连续.第三块 多维随机变量及其分布内 容 提 要基本内容:多维随机变量及其分布函数 二维离散型随机变量的联合分布列
14、,二维连续型随机变量的联合分布函数和联合密度函数,边际分布,随机变量的独立性和不相关性,常用多维随机变量,随机向量函数的分布.1、二维随机变量及其联合分布函数为 n 维(n 元)随机变量或随机向量.联合分布函数的定义 设随机变量,为随机向量 的联合分布函数二维联合分布函数具有以下基本性质:(1)单调性 是变量 或 的非减函数;(2)有界性 ;(3)极限性(3)连续性 关于 右连续,关于 也右连续;(4)非负性 对任意点 ,若 ,则.上式表示随机点 落在区域 内的概率为: .2、二维离散型随机变量及其联合分布列如果二维随机变量 所有可能取值是有限对或可列对,则称 为二维离散型随机变量.设 为二维
15、离散型随机变量 ,它的所有可能取值为 将或表 3.1 称为 的联合分布列.表 3.1 联合分布列具有下列性质:(1) ;(2) .3、二维连续型随机变量及其概率密度函数如果存在一个非负函数 ,使得二维随机变量 的分布函数 对任意实数 有 ,则称 是二维连续型随机变量,称 为 的联合密度函数(或概率密度函数).联合密度函数具有下列性质:(1)非负性 对一切实数 ,有 ;(2)规范性 ;(3)在任意平面域 上, 取值的概率;(4)如果 在 处连续,则 .4、二维随机变量的边缘分布设 为二维随机变量,则称分别为 关于 和关于 的边缘(边际)分布函数.当 为离散型随机变量,则称分别为 关于 和关于 的
16、边缘分布列.当 为连续型随机变量,则称分别为 关于 和关于 的边缘密度函数.5、二维随机变量的条件分布(了解)(1)离散型随机变量的条件分布设 为二维离散型随机变量,其联合分布律和边缘分布列分别为,则当 固定,且时,称为 条件下随机变量 的条件分布律.同理,有(2)连续型随机变量的条件分布设 为二维连续型随机变量,其联合密度函数和边缘密度函数分别为: .则当时,在 和 的连续点处, 在条件 下, 的条件概率密度函数为.同理, .6、随机变量的独立性设 及 分别是 的联合分布函数及边缘分布函数.如果对任何实数 有则称随机变量 与 相互独立 .设 为二维离散型随机变量, 与 相互独立的充要条件是.
17、设 为二维连续型随机变量, 与 相互独立的充要条件是对几乎一切实数 ,有.7、两个随机变量函数的分布设二维随机变量 的联合概率密度函数为 , 是 的函数,则 的分布函数为.(1) 的分布若 为离散型随机变量,联合分布列为 ,则 的概率函数为:或 .若 为连续型随机变量,概率密度函数为 ,则 的概率函数为:.(2) 的分布若 为连续型随机变量,概率密度函数为 ,则 的概率函数为:.8最大值与最小值的分布则9数理统计中常用的分布(1)正态分布:(2) :(3) :(4) :疑 难 分 析1、事件 表示事件 与 的积事件,为什么 不一定等于?如同仅当事件 相互独立时,才有 一样,这里依乘法原理 .只
18、有事件 与相互独立时,才有,因为 .2、二维随机变量 的联合分布、边缘分布及条件分布之间存在什么样的关系?由边缘分布与条件分布的定义与公式知,联合分布唯一确定边缘分布,因而也唯一确定条件分布.反之,边缘分布与条件分布都不能唯一确定联合分布.但由 知,一个条件分布和它对应的边缘分布,能唯一确定联合分布.但是,如果 相互独立,则 ,即 .说明当 独立时,边缘分布也唯一确定联合分布,从而条件分布也唯一确定联合分布.3、两个随机变量相互独立的概念与两个事件相互独立是否相同?为什么?两个随机变量 相互独立,是指组成二维随机变量 的两个分量 中一个分量的取值不受另一个分量取值的影响,满足 .而两个事件的独
19、立性,是指一个事件的发生不受另一个事件发生的影响,故有 .两者可以说不是一个问题.但是,组成二维随机变量 的两个分量 是同一试验 的样本空间上的两个一维随机变量,而也是一个试验 的样本空间的两个事件.因此,若把“ ”、“ ”看作两个事件,那么两者的意义近乎一致,从而独立性的定义几乎是相同的.第四块 随机变量的数字特征内 容 提 要基本内容:随机变量的数学期望和方差、标准差及其性质,随机变量函数的数学期望,原点矩和中心矩,协方差和相关系数及其性质.1、随机变量的数学期望设离散型随机变量 的分布列为 ,如果级数 绝对收敛,则称级数的和为随机变量 的数学期望.设连续型随机变量 的密度函数为 ,如果广
20、义积分 绝对收敛,则称此积分值为随机变量 的数学期望.数学期望有如下性质:(1)设 是常数,则 ;(2)设 是常数,则 ;(3)若 是随机变量,则 ;对任意 个随机变量 ,有;(4)若 相互独立,则 ;对任意 个相互独立的随机变量 ,有.2、随机变量函数的数学期望设离散型随机变量 的分布律为 ,则 的函数 的数学期望为,式中级数绝对收敛.设连续型随机变量 的密度函数为 ,则 的函数 的数学期望为 ,式中积分绝对收敛.3、随机变量的方差设 是一个随机变量,则 称为 的方差. 称为 的标准差或均方差.计算方差也常用公式 .方差具有如下性质:(1)设 是常数,则 ;(2)设 是常数,则 ;(3)若
21、相互独立,则 ;对任意 个相互独立的随机变量 ,有;(4) 的充要条件是:存在常数 ,使 .4、几种常见分布的数学期望与方差(1) ;(2) ;(3) ;(4) ;(5) ;(6) ;(7) ;(8) .5、矩设 是随机变量,则 称为 的 阶原点矩.如果 存在,则 称为 的 阶中心矩.设 是二维随机变量,则 称为 的 阶混合原点矩;称为 的 阶混合中心矩.6、协方差与相关系数随机变量 的协方差为 .它是 1+1 阶混合中心矩,有计算公式:.随机变量 的相关系数为.相关系数具有如下性质:(1) ;(2) 存在常数 ,使 =1,即 与 以概率 1 线性相关;(3)若 独立,则 ,即 不相关.反之,
22、不一定成立 .(4)(Schwarz inequality) 设( X,Y)是二维随机变量,若 X 与 Y 的方差都存在,则 疑 难 分 析1、随机变量的数字特征在概率论中有什么意义?知道一个随机变量的分布函数,就掌握了这个随机变量的统计规律性.但求得一个随机变量的分布函数是不容易的,而且往往也没有这个必要.随机变量的数字特征则比较简单易求,也能满足我们研究分析具体问题的需要,所以在概率论中很多的应用,同时也刻画了随机变量的某些特征,有重要的实际意义.例如,数学期望反映了随机变量取值的平均值,表现为具体问题中的平均长度、平均时间、平均成绩、期望利润、期望成本等;方差反映了随机变量取值的波动程度
23、;偏态系数、峰态系数则反映了随机变量取值的对称性和集中性.因此,在不同的问题上考察不同的数字特征,可以简单而切实地解决我们面临的实际问题.2、在数学期望定义中为什么要求级数和广义积分绝对收敛?首先,数学期望是一个有限值;其次,数学期望反映随机变量取值的平均值.因此,对级数和广义积分来说,绝对收敛保证了值的存在,且对级数来说,又与项的次序无关,从而更便于运算求值.而由于连续型随机变量可以离散化,从而广义积分与无穷级数有同样的意义.要求级数和广义积分绝对收敛是为了保证数学期望的存在与求出.3、相关系数 反映了随机变量 和 之间的什么关系?相关系数 是用随机变量 和 的协方差和标准差来定义的,它反映
24、了随机变量 和 之间的相关程度.当 时,称 与 依概率 1 线性相关;当 时,称 与 不相关;当 时,又分为强相关与弱相关.4、两个随机变量 与 相互独立和不相关是一种什么样的关系?(1)若 、 相互独立,则 、 不相关.因为 、 独立,则 ,故,从而,所以 、 不相关.(2)若 、 不相关,则 、 不一定独立.如:因为 ,知 、 不相关.但 ,, ,知 、 不独立.(3)若 、 相关,则 、 一定不独立.可由反证法说明.(4)若 、 不相关,则 、 不一定不相关.因为 、 不独立,但若 时,可以有 ,从而可以有 、 不相关.但是,也有特殊情况,如 服从二维正态分布时, 、 不相关与 、 独立
25、是等价的.第五块 大数定律和中心极限定理内 容 提 要基本内容:切比雪夫(Chebyshev)不等式,切比雪夫大数定律,伯努里(Bernoulli)大数定律,辛钦(Khinchine)大数定律,棣莫弗-拉普拉斯(De Moivre-Laplace)定理,列维-林维德伯格(Levy-Lindberg)定理.1、切贝雪夫不等式设随机变量 的数学期望 ,方差 ,则对任意正数 ,有不等式 或 成立.2、大数定律(1)切贝雪夫大数定律:设 是相互独立的随机变量序列,数学期望 和方差都存在,且 ,则对任意给定的 ,有.(2)贝努利大数定律:设 是 次重复独立试验中事件 发生的次数, 是事件 在一次试验中发
26、生的概率,则对于任意给定的 ,有 .贝努利大数定理给出了当 很大时, 发生的频率 依概率收敛于 的概率,证明了频率的稳定性.(3)辛钦大数定律:设 相互独立,服从同一分布的随机变量序列,且 (),则对任意给定的 ,有3、中心极限定律(1)林德贝格-勒维中心极限定理:设 是独立同分布的随机变量序列,有有限的数学期望和方差, , .则对任意实数 ,随机变量的分布函数 满足 .(2)李雅普诺夫定理:设 是不同分布且相互独立的随机变量,它们分别有数学期望和方差:, .记 ,若存在正数 ,使得当 时,有, 则随机变量 的分布函数 对于任意的 ,满足.当 很大时,.(3)德莫佛拉普拉斯定理:设随机变量 服
27、从参数为 的二项分布,则对于任意的 ,恒有.疑 难 分 析1、依概率收敛的意义是什么?依概率收敛即依概率 1 收敛.随机变量序列 依概率收敛于 ,说明对于任给的 ,当 很大时,事件“ ”的概率接近于 1.但正因为是概率,所以不排除小概率事件“ ”发生.依概率收敛是不确定现象中关于收敛的一种说法.2、大数定律在概率论中有何意义?大数定律给出了在试验次数很大时频率和平均值的稳定性.从理论上肯定了用算术平均值代替均值,用频率代替概率的合理性,它既验证了概率论中一些假设的合理性,又为数理统计中用样本推断总体提供了理论依据.所以说,大数定律是概率论中最重要的基本定律.3、中心极限定理有何实际意义?许多随机变量本身并不属于正态分布,但它们的极限分布是正态分布.中心极限定理阐明了在什么条件下,原来不属于正态分布的一些随机变量其总和分布渐进地服从正态分布.为我们利用正态分布来解决这类随机变量的问题提供了理论依据.4、大数定律与中心极限定理有何异同?相同点:都是通过极限理论来研究概率问题,研究对象都是随机变量序列,解决的都是概率论中的基本问题,因而在概率论中有重要意义.不同点:大数定律研究当 时,概率或平均值的极限,而中心极限定理则研究随机变量总和的分布的极限.