1、概率论与数理统计重点第一章 随机事件与概率1事件的关系 ABABA 2运算规则 (1) (2) )()()( CC(3) ) (4) 3概率 满足的三条公理及性质:)(P(1) (2 )10A1)(P(3)对互不相容的事件 ,有 ( 可以取 )nA, nkknkAP11)()((4) (5 ) )()((6) ,若 ,则 ,BBP)()(B)(BPA(7) )(PA(8) )( CCCC4古典概型:基本事件有限且等可能5几何概率6条件概率(1) 定义:若 ,则0)(B)(|(BPA(2) 乘法公式: )AP若 为完备事件组, ,则有nB,1 i(3) 全概率公式: ni ii1)|()((4)
2、 Bayes 公式: ni iikkk BAPB1)|()|7事件的独立性: 独立 (注意独立性的应用)A ,(第二章 随机变量与概率分布1 离散随机变量:取有限或可列个值, 满足(1) , (2 ) =1iipxX)0iip(3)对任意 ,RDDxiiP :)(2 连续随机变量:具有概率密度函数 ,满足(1) ;(f 1)( ,)(-dxfxf(2) ;(3)对任意 ,badXa)( Ra0aXP3 几个常用随机变量名称与记号 分布列或密度 数学期望 方差两点分布 ),1(pB,pP)1( pq1)0( pq二项式分布 n ,nkCkXn,2, nPoisson 分布 )(,10,!)(e几
3、何分布 )(pG,21 ,)(kpqXPp12q均匀分布 ,baU,bxabxf , ba)(a指数分布 )(E0 ,)(e12正态分布 ,2N2)( 1xxf 4 分布函数 ,具有以下性质)()XPxF(1) ;(2 )单调非降;(3)右连续;1 ,0((4) ,特别 ;aba )(1)(aFXP(5)对离散随机变量, ;xiip :)((6)对连续随机变量, 为连续函数,且在 连续点上,dtfF)()(xf )( xf5 正态分布的概率计算 以 记标准正态分布 的分布函数,则有1,0(N(1) ;(2 ) ;(3)若 ,则 ;5.0)()1)(x),(2X)()F(4)以 记标准正态分布
4、的上侧 分位数,则u,0N1uuP6 随机变量的函数 XgY(1)离散时,求 的值,将相同的概率相加;(2) 连续, 在 的取值范围内严格单调,且有一阶连续导数,则 ,若不单调,X)(x |)(|)()( 11ygfyfXY先求分布函数,再求导。第四章 随机变量的数字特征1期望(1) 离散时 , ;iipE)(iipxgXE)()(2) 连续时 , ;dxfX)(df(3) 二维时 ,jiijiygYg,),( dyxfyxgY),(,),(4) ;(5) ;CE)( (XCE(6) ;)(7) 独立时,X, )(2方差(1)方差 ,标准差 ;222)()(D )()(XD(2) ;)( ,0
5、XD(3) ;)(2C(4) 独立时,YX, )(YY3协方差(1) ;)()()( YEXEEov (2) ;,(), , abCovovv(3) ;,(2121X(4) 时,称 不相关,独立 不相关,反之不成立,但正态时等价;0),(YCY,(5) ),)(DXD4相关系数 ;有 ,)(,YXCovY1|XY 1)( ,| baXYPbXY5 阶原点矩 , 阶中心矩kkkE kkE)(第五章 大数定律与中心极限定理1Chebyshev 不等式 或2)(|)(| DP 2)(| D2大数定律3中心极限定理 (1)设随机变量 独立同分布 ,则 , 或nX,21 2)( ,)(iiXE),(21
6、nNXnii近 似或 ,),(1NXnii近 似 )0,1( 1Nii近 似(2)设 是 次独立重复试验中 发生的次数, ,则对任意 ,有 或理解为若mApAPx)(limxnpqPn,则),(pB),(npq近 似第六章 样本及抽样分布1总体、样本(1) 简单随机样本:即独立同分布于总体的分布(注意样本分布的求法) ;(2) 样本数字特征:样本均值 ( , ) ;niiX1)(EnXD2)(样本方差 ( )样本标准差iiS22 2SniiXS12)(样本 阶原点矩 ,样本 阶中心矩knikik1nikikX1)(2统计量:样本的函数且不包含任何未知数3三个常用分布(注意它们的密度函数形状及分
7、位点定义)(1) 分布 ,其中 独立同分布于标准正态分布 ,若2)(2212Xn n,21 )1,0(N且独立,则 ;)(),(1nYX1Y(2) 分布 ,其中 且独立;t/tX)( ),0(2nN(3) 分布 ,其中 且独立,有下面的性质 F,/2121Fn )(),(212nYX),(),( ),(1 12112nn4正态总体的抽样分布(1) ; (2) ;)/,(2NX)(12nXnii(3) 且与 独立; (4) ;1)2nSn )1/tSt(5) ,)2()( 1212ntYt 2)(1nS(6) )1,(/2121nFS第七章 参数估计1矩估计:(1)根据参数个数求总体的矩;(2)
8、令总体的矩等于样本的矩;(3)解方程求出矩估计2极大似然估计:(1)写出极大似然函数;(2 )求对数极大似然函数(3 )求导数或偏导数;(4 )令导数或偏导数为 0,解出极大似然估计(如无解回到(1)直接求最大值,一般为 min 或 max )ixi3估计量的评选原则(1)无偏性:若 ,则为无偏; (2) 有效性:两个无偏估计中方差小的有效;)(E4参数的区间估计(正态)参数 条件 估计函数 置信区间已知2nxu/ 2nux未知 st/ )1(st2未知 22)1( )(,)(212n概率论与数理统计期末重点第二章知识点:1.离散型随机变量:设 X 是一个随机变量,如果它全部可能的取值只有有限
9、个或可数无穷个,则称 X 为一个离散随机变量。2.常用离散型分布:(1)两点分布(0-1 分布):若一个随机变量 X 只有两个可能取值,且其分布为 ,12,1(01)PXxpxp则称 X 服从 处参数为 p 的两点分布。12,x两点分布的概率分布: 12, ()Px两点分布的期望: ;两点分布的方差:()E()Dp(2)二项分布:若一个随机变量 X 的概率分布由式 1,0,1.knknxCn给出,则称 X 服从参数为 n,p 的二项分布。记为 Xb(n,p)(或 B(n,p).两点分布的概率分布: (),0,.kknPp二项分布的期望: ;二项分布的方差:()E()DXp(3)泊松分布:若一个
10、随机变量 X 的概率分布为 ,则称 X 服从参数为 的泊松分布,记为 XP ,12.!ke( )泊松分布的概率分布:,0,.!kPe泊松分布的期望: ;泊松分布的方差:()E()DX4.连续型随机变量:如果对随机变量 X 的分布函数 F(x),存在非负可积函数 ,使得对于任意实数 ,有 ,()fxx()()xFPXftd则称 X 为连续型随机变量,称 为 X 的概率密度函数,简称为概率密度函数。()fx5.常用的连续型分布:(1)均匀分布:若连续型随机变量 X 的概率密度为 ,则称 X 在区间(a,b)上服从均匀分布,记为 XU(a,b)其 它,01)(bxabf均匀分布的概率密度: 其 它,
11、)(axf均匀分布的期望: ;均匀分布的方差:2bEX2()1baDX(2)指数分布:若连续型随机变量 X 的概率密度为 ,则称 X 服从参数为 的指数分布,记为 Xe ( )0()0xef 指数分布的概率密度:()xf指数分布的期望: ;指数分布的方差:1E21()DX(3)正态分布:若连续型随机变量 X 的概率密度为 2()1()xfxex则称 X 服从参数为 和 的正态分布,记为 XN( , )22正态分布的概率密度:2()1()xfxex正态分布的期望: ;正态分布的方差:E2()DX(4)标准正态分布: ,20,1 21)()x txxeed标准正态分布表的使用:(1) 0()(xx
12、(2),1()XNPababPaxb(3) 故2(,)0,1XYN()XxFxP()()abaaXb定理 1: 设 XN( , ),则2,6.随机变量的分布函数:设 X 是一个随机变量,称 为 X 的分布函数。()FxPx分布函数的重要性质: 12212110()()()(),0FxPXFxx7.求离散型的随机变量函数、连续型随机变量函数的分布(1)由 X 的概率分布导出 Y 的概率分布步骤:根据 X 写出 Y 的所有可能取值;对 Y 的每一个可能取值 确定相应的概率取值;iy常用表格的形式把 Y 的概率分布写出(2)由 X 的概率密度函数(分布函数)求 Y 的概率密度函数(分布函数)的步骤:
13、由 X 的概率密度函数 随机变量函数 Y=g(X)的分布函数()Xfx()YFy由 求导可得 Y 的概率密度函数()YFy(3)对单调函数,计算 Y=g(X)的概率密度简单方法:定理 1 设随机变量 X 具有概率密度 ,又设 y=g(x)处处可导且恒有 (或恒有()(,)Xfx()0gx) ,则 Y=g(X)是一个连续型随机变量,其概率密度为()0gx;其中 是 y=g(x)的反函数,且()|,Yfhyyf ()xhymin,(),ma,)gg练习题:2.4 第 7、13、14总习题 第 3、6、9、10、11、13、14、17、18、19第三章重要知识点:1.离散型二维随机变量 X 与 Y
14、的联合概率分布表:YX 1y2y jy iPXx1xp1 1jp 1jp2212 2j 2jj.ix1ip2i ijp ijp.jPYy1i2ip ij 1(1)要会由 X 与 Y 的联合概率分布,求出 X 与 Y 各自概率分布或反过来;类似 P63 例 2(2)要会在 X 与 Y 独立的情况下,根据联合概率分布表的部分数据,求解其余数据;类似 P71 例 3(3)要会根据联合概率分布表求形如 的概率;,Pabcd(4)要会根据联合概率分布律之类求出相应的期望、方差、协方差、相关系数等。2. 二维连续型随机变量 X 与 Y 的联合概率密度 :设(X,Y )为二维随机变量,F(x,y)为其分布函
15、数,若存在一个非负可积的二元函数 f(x,y),使对任意实数(x,y ) ,有,则称(X,Y)为二维连续型随机变量。(,)(,)yxFfstd(1) 要会画出积分区域使得能正确确定二重积分的上下限;(2) 要会根据联合概率密度求出相应的分布函数 F(x,y),以及形如 等联合概率值;P64 例 3PXY(3) 要会根据联合概率密度求出 的边缘密度;类似 P64 例 4,xy(4) 要会根据联合概率密度求出相应的期望、方差、协方差、相关系数等。3.联合概率分布以及联合密度函数的一些性质:(1) ;(2 )1ijip(,)1fxyd要会根据这些性质解类似 P68 第 5,6 题。4.常用的连续型二
16、维随机变量分布二维均匀分布:设 G 是平面上的有界区域,其面积为 A。若二维随机变量(X,Y)具有概率密度函数,则称(X,Y)在 G 上服从均匀分布。(,)(,)0Axyfxy5.独立性的判断:定义:设随机变量(X,Y)的联合分布函数为 F(x,y),边缘分布函数为 , ,若对任意实数 x,y,有()XFxYy,PXxYyPXxYy(1)离散型随机变量的独立性:由独立性的定义进行判断;所有可能取值 ,有 , 则 X 与 Y 相互独立。(,)ij(,)()()ij ijPxy.ijijp(2)连续型随机变量的独立性:由独立性的定义进行判断;联合概率密度 ,边缘密度 ,(,)fxy()XfxYfy
17、有 几乎处处成立, 则 X 与 Y 相互独立。,xyXY(3)注意与第四章知识的结合X 与 Y 相互独立 ()()(),0XYEEDDCov因此 X 与 Y 不独立。()()()(,)0XYEEov6相互独立的两个重要定理定理 1 随机变量 X 与 Y 相互独立的充要条件是 X 所生成的任何事件与 Y 生成的任何事件独立,即,对任意实数集 A,B,有,PABPAB定理 2 如果随机变量 X 与 Y 独立,则对任意函数 , 相互独立。1()gx2)y(1)要求会使用这两个定理解决计算问题练习题:习题 2-3 第 3、4 题 习题 2-4 第 2 题习题 3.2 第 5,7,8 题总习题三 第 4
18、,9 (1)- (4) , 12,13第四、五章知识点设总体密度函数如下, 是样本,试求未知参数的矩估计值,最大似然估计值。12,.nx(;,),0pxe(1) 002 22 2220011()()xtttt ttEXdedet ede,由此可推出 ,2)DEX(),()()DXEDX从而参数 , 的矩估计值为,sx(2)似然函数为: (1)11()ep(,nniiLx其对数似然函数为: l(,)lii由上式可以看出, 是 的单调增函数,要使其最大, 的取值应该尽可能的大,由于限制 ,这给出的最大nL(1)x似然估计值为 (1)x将 关于 求导并令其为 0 得到关于 的似然方程l(,,解得12
19、()ln(,)0niixdL1(1)()niixx第四章重要知识点:1.随机变量 X 数学期望的求法:(1)离散型 ;(2)连续型 1()iExp()()EXxfd2.随机变量函数 g(X) 数学期望的求法:(1)离散型 ;(2)连续型 1()()iig ()()gf3.二维随机向量期望的求法:(1)离散型 ;1(,)(,)ijijiEXYxyp(2)连续型 ,ggfdxy4.随机变量 X 方差的求法:(1)简明公式 222()()()(DEX(2)离散型 1iiixp(3)连续型 2()()fxd5. 随机变量 X 协方差与相关系数的求法:(1)简明公式 ,()()()CovYEXYEXYE
20、(2)离散型 ,()()ijijij yp(3)连续型 , (),xfxyd(4) ()XYovDY6.数学期望、方差、协方差重要的性质:(1) 1212()()EEX(2) 设 X 与 Y 相互独立,则 ()Y(3) ()(),ECov若 X 与 Y 相互独立,则 ()DD(4) 2()C(5) 112,),ovXY(6) ()abov若 X 与 Y 相互独立,则 ,0(7) 若(X,Y)服从二维正态分布,则 X 与 Y 相互独立,当且仅当 0XY7. n 维正态分布的几个重要性质:(1)n 维正态变量( )的每个分量 ( )都是正态变量,反之,若 都是正态变12,.ni1,2.n12,.n
21、X量,且相互独立,则( )是 n 维正态变量。,(2)n 维随机向量( )服从 n 维正态分布的充分必要条件是 的任意线性组合均服从一维正态分,. 12,.n布 均服从一维正态分布(其中 不全为零) 。12.nlXlX12,.nl(3)若( )服从 n 维正态分布,设 是 的线性函数,则( )服从 k12,.X12,.kY(1,2.)jXn12,.kY维正态分布。(4)设( )服从 n 维正态分布,则“ 相互独立”等价于“ 两两不相关”,n12,.nX练习题:1. 设(X,Y)的联合密度函数为 ,求 及4()0(,)xyyxfxy(,)CovY解:11300(),2()2)5xEXddd 22
22、 242()4(xfyyxx23()(5D同理 120()(,)4()5xEYxfydydx2 312又因10()()1xXyyx从而 462, (57CovYEXY()2713XYD2. 习题 4.3 第 10 题8.中心极限定理(1)定理 4(棣莫佛拉普拉斯定理)设随机变量 相互独立,并且都服从参数为 的两点分布,则对任意实数 ,有12,.,.nXpx21lim()()n ti xipPedx(2)定理 3(独立同分布的中心极限定理)设随机变量 相互独立,服从同一分布,且12,.,.nX则2(),()(1,.)iiEDi 211limn ti xinXPed练习题:习题 4-4 11 题
23、12 题 总习题四 24,25,26 题第五章重要知识点确定或求证统计量所服从的分布1.三大分布(1) 分布:设 是取自总体 N(0,1)的样本,称统计量 服从自由度为 n 的 分布。212,.nX2221.nX2(2)t 分布:设 XN(0,1), ,且 X 与 Y 相互独立,则称 服从自由度为 n 的 t 分布。()Y/tYn(3)F 分布:设 ,且 X 与 Y 相互独立,则称 服从自由度为(m,n)的 F 分布。22,mnmF2.三大抽样分布(1)设总体 是取自 X 的一个样本, 为该样本的样本均值,则有 ,212(,),.nXN 2(,/)XNn0/Un(2)定理 2 设总体 ,是取自
24、 X 的一个样本, 与 为该样本的样本均值与样本方差,则有212(,),.n 2S,211(1)niiSX与 相互独立X2(3)定理 3 设总体 ,是取自 X 的一个样本, 与 为该样本的样本均值与样本方差,则212(,),.nN2S有 ,221()nii n(1)/TtS练习题:1.设 是来自正态总体 的样本,求统计量2,.nX(0,)X的分布。13214.Y解:因为 ,故21321(,)nN1321.(0,)nXN(0,),.iXNi由样本的独立性及 分布的定义,有22224().()()nX再由样本的独立性以及 t 分布的定义,有 132113212 24 42 ().nnXY t2 总
25、习题五 14 题3.求样本函数相关的概率问题练习题:习题 5-3 2 总习题五 16、17第六章重要知识点:1.矩估计的求法:设总体 X 的分布函数 中含有 k 个未知参数的函数 ,则1(;,.)kFx1,.k(1)求总体 X 的 k 阶矩 它们一般都是,.是这 k 个未知参数的函数,记为 1(,.),2.iikgi(2)从(1)中解得 1,.().jjkhj(3)再用 的估计量 分别代替上式中的 ,即可得 的估计量:(1,2.)ikiAi(1,2.)jk,. ,.jjkhAj注:求 ,类似于上述步骤,最后用 ,代替 ,求出矩估计1v1,.kB1,.kv(,.)jk2.最大似然估计的求法:求最
26、大似然估计的一般方法:(1) 写出似然函数 12()(,.;)nLx(2) 令 或 ,求出驻点()0dln0d(3)判断并求出最大值点,在最大值点的表达式中,用样本值代入就得参数的最大似然估计值。比如 P154 例 46。3. 估计量的优良性准则(1)无偏性定义 1 设 是未知参数 的估计量,若 ,则称 为的无偏估计量。1(,.)nX()E(2)有效性定义 2 设 和 都是参数 的无偏估计量,若 ,则称 较11(,.)n21,.nX12()()D1有效。4 置信区间(1)双侧置信区间:设 为总体分布的未知参数, 是取自总体 X 的一个样本,对给定的数 , ,若存在统计12,.nX101量 ,1
27、2(,.)n,使得 ,则称随机区间 为 的 双侧置信区间,称12,.nX_1P_(,)1为置信度,又分别称 与 为 的双侧置信下限与双侧置信上限。_(2)单侧置信区间:设 为总体分布的未知参数, 是取自总体 X 的一个样本,对给定的数 , ,若存在统计12,.nX 01量 ,12(,.)n满足 ,则称 为 的置信度为 的单侧置信区间,称 为 的单侧置信下限;若存在统计P(,)1量 ,满足12(,.)nXP则称 为 的置信度为 的单侧置信区间,称 为 的单侧置信上限。)15.寻求置信区间的方法:一般步骤:(1) 选取未知参数 的某个较优估计量 (2)围绕 构造一个依赖于样本与参数 的函数 12(
28、,.,)nUX(3)对给定的置信水平 ,确定 与 ,使112P通常可选取满足 与 的 与 ,在常用分布情况下,这可由分位数表查得。PU12(4)对不等式 作恒等变形后化为12则 就是 的置信度 为的双侧置信区间。(,)6.置信区间的公式:(1)0-1 分布参数的置信区间:22211(4),(4),),(bacbacanunXunX(2)设总体 ,其中 已知, 而为未知参数, 是取自总体 X 的一个样本。2()N212,.nX均值 的 置信区间为:( , )12(3)设总体 ,其中 , 未知, 是取自总体 X 的一个样本。2(,)21,.n均值 的 置信区间为:( , )2()SXtn2(1)SXt(4)设总体 ,其中 , 未知, 是取自总体 X 的一个样本。2(,)XN1,.n方差 的 置信区间为: 212221()(),SSn的 置信区间为: 221()(),练习题:习题 6-2 第 1,2,5 ,6 题习题 6-3 第 3,4,5 ,6 题习题 6-4 第 4 题总习题六 第 7,8 ,9,10,16,17 ,18,20,21 题