1、回顾过去学习过的,离散型随机变量,如果随机变量 可能取的值为有限个或可列无穷多个,这种类型的随机变量就称为离散型随机变量。,这组概率值反映了离散型随机变量 的本质。称为 的概率分布。,设离散型随机变量 的 一切可能取值为: 对应的概率值为:,离散型随机变量 的概率分布 必须满足,反之,如果一组数满足这两条性质,都可以作为某个离散型随机变量 的概率分布。,离散型随机变量的概率分布,离散型随机变量 的概率分布也可表示为:,定义 离散型随机变量 的概率分布为如果级数 对应的极限存在,则称级数对应的极限为 的数学期望或均值,即,离散型随机变量的数学期望,定义 离散型随机变量 的概率分布为如果级数 对应
2、的极限存在, 则称此极限为 的方差,即并称 为 的标准差。,离散型随机变量的方差,离散型随机变量的方差计算公式,一、随机变量-随机现象的函数化,相对于随机试验的实际结果,我们对试验结果的某些函数更感兴趣。因此我们要把随机试验的结果数理化,即把试验结果与实数联系起来,建立起所谓的随机变量,即数值随着随机试验结果的不同而取各种不同值的变量。,定义: 对于随机实验结果中的任何一个结果 ,都有唯一的实数 与之对应,则称 为随机变量。,引入随机变量,随机事件可以通过随机变量来表示!,引入随机变量的最大好处是建立了随机现象与实数之间的桥梁,使我们能够利用数学工具来处理数理统计的问题。,根据随机变量的取值情
3、况,随机变量分为两类:离散型随机变量与非离散型随机变量。非离散型随机变量的范围很广,但其中最重要的也是实际中常遇到的是连续型随机变量。,(3)随机变量随着试验结果而取不同的数值,在试验前只知道它可能的取值范围和相应的概率,而不能预知它到底取什么数值。,(2)随机变量的各个取值都有一定的概率。,(1)普通函数定义在实数轴上,而随机变量则定义在样本空间(事件)上,样本空间上的元素(事件)不一定是实数。,二、随机变量与普通函数的区别,三、连续型随机变量的概率密度,定义:对于随机变量 ,如果存在非负可积函数,使得 在任一区间 取值的概率为:则称 为连续型随机变量,并称 为 的概率密度。,从定义看,对于
4、连续型随机变量,由于其取值不是集中在有限个点上,所以考察其取值于某一点的概率意义不大。连续型随机变量在一点的概率实际上是该变量在无穷小区间上的概率,也是无穷小,在极限的意义下,此概率为零。因此:概率为零的事件不一定是不可能事件!,概率密度 具有两条重要性质:,反之,如果某个函数满足这两条性质, 则该函数可以作为某个连续型随机变量的概率密度。,例: 已知连续型随机变量 的概率密度为,求: (1) ;(2) 。,解:,所以,(1)均匀分布,例如:公共汽车每15分钟一班,则乘客的候车时间服从参数为 0, 15 的均匀分布 U(0,15),四、常见连续型随机变量的概率密度,设随机变量 的概率密度为钟型
5、曲线函数则称 服从参数为 的正态分布,记为,实际生活中大量的随机变量都服从或近似服从正态分布。,(2)正态分布,特别地,称 的正态分布为 标准正态分布,其密度函数为:,可以证明:,利用这个结果,通过变量替换,,可以证明:,标准正态分布示意图,密度函数,累积分布函数,正态分布最常用,可以通过查表求得累积正态分布函数 的值:,注意:,累积分布函数 的二条重要性质:,1、,2、,经验表明:随机变量如果受大量微小的、独立的随机因素的影响时,可看作这些随机因素作用叠加的总和,这样的随机变量近似服从正态分布。这种现象的理论解释是独立同分布中心极限定理。,定义: 对于随机变量 ,称函数为随机变量 的累积分布
6、函数,五、累积分布函数,累积分布函数具有下列基本性质:,(4)连续型随机变量 的累积分布函数,因此,即:累积分布函数的导数等于密度函数,因为,例:,已知连续型随机变量 的概率密度为,求: 的累积分布函数 及 、,解:,随机变量的分布函数、概率密度能全面、完整地描述随机变量的概率性质和分布情况,但比较烦琐、复杂,不易看出分布的主要特征,也不便于进行随机变量之间的比较。在许多实际问题中,我们只需要知道随机变量的主要数字特征(数学期望,方差),并不需要详细了解可能难以确定的随机变量的分布情况。,六、随机变量的数字特征,随机变量的数字特征不仅在一定程度上可以简单刻划出随机变量的基本性态,而且可以用数理
7、统计的方法估计出它们。因此对它们的研究在理论上、实际上都有重要意义。,1、从加权平均谈起,一门课程,平时成绩p占30%,期末成绩m占70%,某生平时得90分,期末得82分,则该生该课程的总成绩 z 为平时成绩p和期末成绩m的加权平均,即,数学期望数据的集中程度,一般地,一组数据 在一组权重 下的加权平均为:,定义:连续型随机变量 的概率密度为 , 如果广义积分 存在,则称广义积分为 的数学期望或均值,即:,2、连续型随机变量的数学期望,例:,已知连续型随机变量 的概率密度为,求:,解:,正态分布,3、正态分布的数学期望,4、数学期望的性质,设连续型随机变量 的概率密度函数为 , 而 为连续函数
8、或分段连续函数。 如果广义积分 存在,则称此广义积分为对应的函数 的数学期望或均值,即:,5、随机变量函数的数学期望,1、方差的概念,一门课程,三次考试成绩 a、b、c 各占总成绩 z 的1/3。甲得分为70分、80分、90分乙得分为60分、80分、100分计算得出两人期末总成绩 z 都为80分如何评价两人该课程成绩的好坏呢?,方差数据的分散程度,我们注意到乙的成绩起伏较大,因此可以用通过各次成绩与期末总成绩的偏离程度的平方和来揭示两人成绩的差异。,计算得:甲为 200,乙为 800 显然乙的成绩起伏较大,与观察吻合。,定义: 连续型随机变量 的概率密度为 如果广义积分 存在,则称为 的方差,即:并称 为 的标准差或均方差。,例:,已知 为离散型或连续型随机变量,证明:,证明:,由方差的定义和数学期望的性质,有,这就是方差的计算公式,例:,已知连续型随机变量 的概率密度为,求:,解:,正态分布,2、正态分布的方差,3、方差的性质,例: 已知随机变量 的均值和方差都存在。 称随机变量 为 的标准化随机变量。,说明任意随机变量可以化为标准化随机变量!,证明:,证明:,