1、考前答疑安排,5月28日 1号楼A201教师休息室上午:8:30-12:00, 答疑教师:房永飞,王岩华下午:1:30-4:00 答疑教师:卢筠,王洁明,第一章 古典概型和概率空间,1. 条件概率和乘法公式,P(AB)=P(B)P(A|B),2. 事件的独立性,对任意的事件A,B,若P(AB)=P(A)P(B), 则称事件A,B是相互独立的。,3. 全概率公式和Bayes公式,离散型随机变量 连续型随机变量 概率分布函数 随机变量函数的分布,第二章 随机变量及其分布,1.离散型随机变量的概率分布,2. 几种常用的离散型随机变量,1.两点分布 (Bernoulli分布),2.二项分布 (Bino
2、mial分布),3.泊松分布(Poisson 分布),4.几何分布(Geometric分布),分布函数,分布列,3.分布列与分布函数的关系图示如下,4.离散型随机变量函数的分布,设 X 是离散型随机变量,其分布列为,Y 是 X 的函数 , 则 Y 也是离散型随机变量. 它的取值为,或,设X 是随机变量,如果存在非负函数,使得对任何满足 的,有,则称 X 是连续型随机变量,称 是 X 的概率密度函数,简称为概率密度或密度,1.连续型随机变量的概率分布,2. 几种常用的连续型随机变量,1.均匀分布(Uniform 分布),2.指数分布(Exponential 分布),3.正态分布(高斯分布),重要
3、结论,若 ,则,1、,3、,2、,3. 连续型随机变量的分布函数,1、 如果 X 是连续型随机变量, 有概率密度 则,并且在 的连续点有,4.连续型随机变量函数的分布,(1)先求 Y = g ( X ) 的分布函数,(2)利用 Y = g ( X ) 的分布函数与密度函数的关系 ,求 Y = g ( X ) 的密度函数,设 X 是一个取值于区间 a , b ,具有 概率密度 f ( x ) 的连续型随机变量 ;又设y = g ( x ) 处处可导,且对于任意 x , 恒有或恒有 ;则 Y = g (X) 是一个连续型随机变量 , 它的概率密度为,定理,其中, x = h ( y ) 是 y =
4、 g ( x ) 的反函数,定理 5.1 (续),补充定理,第 3 章 随机向量及其独立性,联合分布边缘分布随机变量的独立性随机向量函数的概率分布,1. 二维离散型随机向量 ( X,Y ) 的分布律,联合分布律的性质,2.边缘分布列,3. 离散型随机变量的独立性,1. 连续型随机向量联合概率密度,联合概率密度的性质,2. 联合分布与联合密度,连续型随机变量(X,Y),其概率密度与分布函数的关系如下:,同理, Y的边缘密度为,X的边缘密度为,3. 边缘密度,4. 连续型随机变量的独立性,1. 二维均匀分布 2. 二维正态分布,五、两个常用的分布,下面介绍两个常用的二维随机变量.,均匀分布,设D为
5、平面上的区域, 面积,若 (X,Y)的联合密度为,则称(X,Y)在D上服从均匀分布.,二 维正态分布,一个重要的结论,即二维正态分布的两个边缘分布都是一维正态分布,5. 随机向量的函数的分布,设(X, Y)是二维随机变量,z = (x, y)是一个已知的二元函数,如果当(X, Y)取值为(x, y)时, 随机变量Z取值为z = (x, y),则称Z是二维随机变量的函数,记作Z = (X, Y) 问题: 已知(X, Y)的分布, 求Z = (X, Y)的分布.,一、离散型随机向量函数的分布,二、连续型随机变量函数的概率分布,1. 已知(X,Y) f(x,y),求Z = (X,Y)的概率分布.,2
6、. 若Z为连续型随机变量, 则在 f(z) 的连续点处,推论 设(X,Y)关于X,Y的边缘密度分别为fX(x) , fY(y). 若X和Y独立, 则,Z=X+Y的概率密度的一般公式,极大极小值的分布,设X,Y是两个相互独立的随机变量,它们的分布函数分别为FX(x)和FY(y), 求M=max(X,Y) 及 N=min(X,Y)的分布函数.,M=max(X,Y),FM(z) = PMz = Pmax(X,Y)z,= PXz,Yz,= PXz PYz,= FX(z) FY(z),类似地,可得N=min(X,Y)的分布函数是,=1-PXz,Yz,FN(z) =PNz =Pmin(X,Y) z,=1
7、Pmin(X,Y) z,=1- PXzPYz,= 1-1-FX(z)1-FY(z),第四章 数学期望和方差,定义1.1:设离散型随机变量X 的概率分布为,若无穷级数,绝对收敛,则称其和为随机变量 X 的数学期望或均值,记作 E( X )。,定义1. 2 :设 X 为连续型随机变量, 其密度函数为 ,若积分,绝对收敛,则称此积分为随机变量 X 的数学期望或均值,记作 E( X )。,设X=(X1 , Xn)为离散型随机向量,概率分布为,设X=(X1 , Xn)为连续型随机向量,联合密度函数为,Var (X)=E(X-E(X)2,性质2: Var(b+X)=Var(X) . 特别地,若X=C,C为
8、常数,则Var(C)=0,Var (aX + b ) = a2 Var(X),性质3: 若a,b为常数, 则,性质1: 若b为常数,随机变量X的方差存在, 则bX的方差存在,且 Var(bX) = b2Var(X),若随机变量X,Y 的方差都存在, 则X+Y的方差存在,且,性质5:,性质4:,Var(XY)= Var(X) +Var(Y) 2cov(X,Y),若X, Y 独立, Var(XY)= Var(X) +Var(Y),A. 协方差函数和相关系数,协方差,相关系数,协方差的性质,当且仅当,时,等式成立,Cauchy-Schwarz不等式,48,相关系数的性质,49,X , Y 不相关,注
9、:X与Y不相关仅仅是不线性相关,可以非线性相关。,50,X,Y 相互独立,X,Y 不相关,若 X , Y 服从二维正态分布,,X,Y 相互独立,X,Y 不相关,第五章 极限定理,强大数律中心极限定理,(中心极限定理),点估计和矩估计 最大似然估计 抽样分布及其上分位数 正态总体的区间估计,第七章 参数估计,参数估计,点估计,区间估计,点估计 估计未知参数的值,区间估计 根据样本构造出适当的区间,使他以一定的概率包含未知参数或未知参数的已知函数的真值,记总体k阶矩为,样本k阶矩为,用相应的样本矩去估计总体矩的 估计方法就称为矩估计法.,1. 矩估计法,矩估计的一般步骤,设总体分布含有m个未知参数
10、 1 ,m,(1)根据未知参数的个数求总体的各阶矩,(2)解方程组(即从方程组中解出未知参数),(3)用Ai代替上述方程组中的 ,i=1,2,m,(4)若估计的是参数的函数,最大似然估计法的基本思想:根据样本观测值,选择参数p的估计 ,使得样本在该样本值附近出现的可能性最大,2. 最大似然估计法,求最大似然估计(MLE)的一般步骤是:,(1) 由总体分布导出样本的联合分布列(或联合密度);,(2) 把样本联合分布列(或联合密度)中自变量看成已知常数,而把参数 看作自变量,得到似然函数L( );,(3) 求似然函数 的最大值点(常转化为求对 数似然函数 的最大值点) 即 的MLE;,离散型样本的
11、似然函数,连续型样本的似然函数,点估计的无偏性,注: 样本均值 与样本方差S2 分别是总体均值和总体方差2的无偏估计量.,设X1 ,X2,,Xn为来自总体XF(x;)的一个样本, 是未知参数. 若对于给定的 (0 1),存在两个统计量,使得对任意的 满足,区间估计,则称随机区间 为参数 的置信水平(confidence level)为1- 的置信区间(confidence interval).,置信水平又称为置信度,置信区间的左端点 又称为置信下界,置信区间的右端点 又称为置信上界.,正态总体参数的置信区间,正态总体参数的置信区间,第八章 假设检验 统计学专题:http:/bbs.pinggu.org/tongjixue/, 0, 0, 0, 0, 0, 0,均值的正态 检验法 (2 已知), 0, 0, 0, 0, 0, 0,均值的T 检验法 ( 2 未知), 2 02, 2 02, 2 02, 2 02, 2= 02, 2 02,( 未知),关于 2 的卡方检验法,