1、66第 5 章 随机试验和随机变量教学目的与要求:通过本章教学,使学生理解什么是随机试验以及由它所定义的随机变量,并了解统计学的重要任务之一便是把数据看作随机变量(或称之为无限总体)的样本去推断它的这种或那种特征。作为后续章中所介绍的统计推断方法所必需的预备知识,学生通过本章的学习还应了解与随机试验和随机变量有关的属于概率论范畴的若干基本概念。重点内容与难点:1随机试验及事件、概率等基本概念 2随机变量的概念: 离散型随机变量的分布列和连续性随机变量分布的图示 3数学期望和方差的定义及数学性质5.1 随机试验一、随机现象1概念:在给定的条件下不能确切预见其结果的现象叫作随机现象。2随机现象的产
2、生:因大量的偶然因素存在且无法控制,使现象的结果不能确定和不能完全预见的。于是,现象的随机性便产生了。3随机现象有一定规律性的。在给定条件下在规律值附近的数值发生的可能性较大,离规律值越近则发生的可能性越大,离规律值越远则发生的可能性越小。统计学就是要通过对随机现象的有限次的观察结果去探寻它的各种统计规律。二、随机试验1概念:对随机现象的观测称作随机试验。2种类:随机试验有可重复随机试验和不可重复随机试验两种。前者是指可以在相同条件下重复进行的随机试验;后者是指不能在相同条件下重复进行的随机试验。要注意,随机现象或随机试验的概念都是同给定的一组条件联系在一起的。给定的一组条件发生了改变,就变成
3、了另外的随机现象和另外的随机试验。三、事件(一)事件的种类1 概念:随机试验的每一种结果或随机现象的每一种表现称作随机事件,简称为事件。2 种类:一个事件如果不能再被分解为两个或两个以上事件,称作基本事件。基本事件是试验的最基本结果:每次试验必出现一个基本事件,任何两个基本事件都不会同时出现。由两个或两个以上基本事件所组成的事件称做复合事件。一项随机试验的所有基本事件的集合,称作该随机试验的基本事件空间。必然事件是每次试验都一定出现的事件,记作 。任何一次试验都不可能出现的事件称为不可能事件,记作 。(二)事件的关系和运算(四)概率(一)什么是概率用 0 与 1 之间的数值来表明事件 A 在随
4、机实验中出现的可能性大小,通常记作 P(A) 。这样的数值叫作事件 A 的概率。对于概率,通常可有两种解释:(1)某个系统的一种内67在特性,这个特性不依赖于我们对该系统的知识;(2)对某一陈述相信程度的度量。事件 A 的频率为(5.1)nAP)(当试验次数 n 较小时,频率的数值有较大的波动;当 n 充分大时,频率数值的波动明显减弱,并且随着 n 的增大,频率会趋于稳定在某个常数 p 附近。我们便说频率 Pn(A)的这个稳定值 p 是 事件 A 的概率。即:(5.2)pAP)(按照对概率的这种解释,当然只能在可重复随机试验的范围内讨论问题。概率作为对某一陈述相信程度的度量,叫作主观概率。一一
5、一 可以直接计算概率的两种场合有两种可以直接计算概率的场合。一种叫作古典型概率,另一种叫作几何型概率。1古典型概率如果一项随机试验的全部基本事件总数是有限的,并且各个基本事件出现的可能性都相同,事件 A 由若干基本事件所组成,则 A 的概率可用下式计算(5.3)基 本 事 件 总 数所 含 基 本 事 件 的 个 数P)(式中分子亦称作有利于事件 A 的基本事件个数。2几何型概率如果随机试验可模拟为向区域 上随机投点。并且(1)这个区域有明确界限,可以作长度、面积、体积的几何度量。 (2)随机点落在这个区域任何一点上的可能性都相同,也就是说,对于 中的某一区域 g,随机点落在 g 内的概率与
6、g 的几何度量成正比,同它的形状以及在 中的位置无关。对于这种随机试验,如果以 A 表示随机点落在区域 g 中 这一事件,则其概率可用下式计算(5.4)的 几 何 度 量的 几 何 度 量AP)(事件 A 的概率记作 P(A) ,则不论 P(A)是某个系统的内在特性,还是对某一陈述的相信程度,它都应该具有下面的性质:性质 1:非负性,即 0P(A )1性质 2:规范性,即,对于必然事件 ,有 P( )=1;性质 3:对于随机事件 Ai(i=1,2,),只要它们两两互不相容,则有 1)(iAii(三)概率的加法规则1.任意事件的加法规则任意两个事件和(并)的概率,等于二事件概率的和再减去二事件同
7、时发生的概率。即(5.5))()()( ABPBAP在三个事件,有(5.6)()()( CCCCBAP 2.不相容事件的加法规则两个不相容事件 与 的和( 并)的概率,等于二事件概率的和。即68)()(BPAP(5.7)(四)条件概率和乘法公式在实际问题中,除了要知道事件 发生概率外,有时还需要知道在“事件 已发生”A的条件下,事件 发生的概率,这种概率称为条件概率,记作A )|(BAP(五) 全概率公式有时事件 比较复杂,直接求它的概率有一定困难。如果我们可以把事件 分解成互不相容的一些简单事件,而这些简单事件的概率却比较容易求出,那么,我们就可以用全概率公式去计算事件 的概率。A全概率公式
8、可表述如下:设 为 个互不相容事件,且 则任一事nB,21 。, ),21(0)(1 niiBPni 件 的概率为A(5.8)ni iiAAP1)|()((六)贝叶斯公式设 为 个互不相容的事件,且 是nB, 21 。),21(0)(,1 niBPini A任一事件,且 则对任一 ,有。0)(AP)21(i, (5.9)),( niBAPAPBBniiiiiii ,21,)|()|)(|)| 1这就是贝叶斯公式。(七)事件的独立性对于两个事件 和 ,假若事件 的发生会对事件 发生的概率产生影响,即AB,称事件 与 之间统计相依。假若事件 的发生并不影响事件 发生的)(|(PBA BA概率,称事
9、件 与 之间统计独立。在 与 独立时显然有 ,这时,乘法A)(|(PA公式式成为 )()|()(PPB把这个关系式作为事件独立性的定义,即设 与 是任意两个事件,如果满足(5.10)A则称事件 与 独立,否则称 与 相依。在实际应用中,如果两个事件相互间没有影响,AB则可以认为这两个事件相互独立。应该指出,两个事件相互独立与互不相容是两个不同的概念。独立性是指两个事件的发生互不影响,互不相容是指两个事件不能同时发生。两个不相容事件相依,两个独立事件一定相容(除非其中有一个事件的概率为 0) 。5.2 随机变量及其分布一、随机变量的概念(一 )什么是随机变量在随机试验中被测量的量。在一组给定的条
10、件下,这种变量取何值事先不能确定,它69的取值只能由随机试验的结果来定,并且随试验的结果而变。(二)随机变量的种类一般地,如果随机变量的全体可能取值包括有限个可能结果,或者是一个无限的整数序列,这样的随机变量称作离散型随机变量。如果随机变量的全体可能取值为实数轴上的某一区间,这样的随机变量称作连续型随机变量。二、随机变量的分布一一一 随机变量分布的概念1离散型随机变量的分布离散型随机变量 X 的每一个可能的取值 Xi 和随机变量取该值的概率 p(x i)之间所确立确立对应关系称作这个离散型随机变量的分布。P(x i) ( i=1,2,3,)称作随机变量 X 的概率分布或概率函数。它满足下面的关
11、系:p(x i) 0 和 。对于离散型随机变量,分布列全面地1)(iixp描述了它的分布。根据分布列,还可以同时作出分布棒图。2连续型随机变量的分布连续型随机变量 X 的一系列取值区间和随机变量在该区间取值的概率之间确立的对应关系,称作这个连续型随机变量的分布。连续型随机变量的分布可以用密度函数来描述,随机变量 的密度函数记作 。随X)(xp机变量 在某一数值区间 内取值的概率等于竖立在该区间上的,以密度曲线为上底的,ba曲边梯形的面积。写作(5.11)badxpXP)()(密度函数满足下面两个基本性质:(1)密度函数的函数值不会是负数,从图形看,密度曲线在横轴上方,以横轴为渐近线;(2)在整
12、个实数轴上的密度函数值的和等于 1。这两个性质用密度函数式写作, (5.12)0)(xp1)(dx三、常见的几种分布规律在理论研究和实际应用中,人们掌握了某些种类随机试验的概率分布模型。对于这种随机试验定义的统计总体,我们说它具有已知的分布。1两点分布(01 分布) 。2二项分布3超几何分布4泊松分布5均匀分布如果随机变量 的可能取值充满一个区间 , ,且 落在 , 中任意等长度XabXab的子区间内的概率相等,或者说 落在子区间内的概率与子区间的长度成正比,与子区间的具体位置无关。 6正态分布。令随机变量 X 是在一个随机试验中被测量的结果,并且,决定这项试验结果的是大量70偶然因素作用的总
13、和,每个因素的单独作用相对均匀地小,那么,X 的分布就近似于正态分布。它有两个参数: 和 2。 实际上是 X 的数学期望 E(X), 2 实际上是 X 的方差V( X) 。正态分布的概率密度曲线可以用已知的数学解析式表达出来,它是一种已知的分布。为了方便,人们编制了“正态密度曲线下的面积”表(见附录 1 表 2) 。这个表是就标准正态变量情形编制的,因此,查表时要把一般正态变量转化成标准正态变量。标准正态变量是 = 0, 2=1 的正态变量,通常记作 N(0,1) 。为了和一般正态变量有所区别,我们这里用大写字母 Z 来表示标准正态变量,用小写字母 z 表示它的取值。 p(z)0 z1 z2把
14、随机变量与它的数学期望相减之差除以该随机变量的标准差(方差的平方根) ,称作随机变量的标准化。把区间的两个端点作如下标准化变换:11)(zXVEx22)(zXVEx得到图中相应的区间(z 1, z2) ,据此来查表。7 分布2这是 v 个相互独立的标准正态变量的平方和构成的随机变量所遵循的分布规律。这个分布的概率密度函数的表达式这里略去不作介绍,概率密度函数的图形如图。图中表示了一族曲线,其形态随 v 值的不同而改变。v 是构成 变量的标准正态变量个数,称作 变22量的自由度。今后,对 变量的分布规律,总要说明它的自由度,记作 (v)。 2 28F 分布。这是两个相互独立的 变量(分别除以各自
15、自由度之后)相除构成的随机变量所遵循的分布规律。即,设 X 和 Y 是相互独立的服从 分布的随机变量,自由度分别为 f 1,f 22,则称随机变量21/fYXF所遵循的分布规律为 F分布,记作 F(f 1, f2) 。f 1 称作 F分布的第一自由度(分子自由度) ,f2 称作 F分布的第二自由度(分母自由度) 。9t 分布。这是相互独立的一个标准正态变量与一个 变量(除以它自己的自由度后)的平方根2相除构成的随机变量所遵循的分布规律。即,设 X 是标准正态变量,Y 是自由度为 v 的变量,且 X 和 Y 相互独立,则称随机变量2vXt/所遵循的分布规律为 t分布。 v 称为它的自由度,记作
16、t (v)。四、随机变量分布的特征数(一)位置特征数随机变量分布的位置特征数,有数学期望、中位数、众数,等等。我们只介绍数学期望。z711随机变量 X 的数学期望:X 的一切可能值以相应的概率为权数的加权算术平均数。今后我们把 X 的数学期望记作 E(X)。E(X)= (5.13)vixPipxi1若 是连续型随机变量,其概率密度函数为 ,则 的数学期望定义为)(pXdx)( (5.14)式中的定积分应绝对收敛。 (二)离散特征数离散特征又叫“散布特征” 、 “离中趋势” 。随机变量的离散特征,是指随机变量取值的不均匀状况。随机变量的离散特征数是对随机变量离散特征的数值度量。包括:方差、标准差、变异系数。5.3 随机变量与样本如果随机变量 是在某个可以在不变条件下重复进行的随机试验中被观测的量。我们X想要知道 的分布。进行的有限次的试验(观测)叫作 的样本。相对于样本而言,在统计学中把随机变量X叫作总体(统计总体)。X