1、第五章 数理统计的基础知识,总体和样本几个常用的分布和抽样分布,5.1 数理统计的基本概念,从本质上讲,总体就是所研究的随机变量或随机变量的分布。即一个具有确定概率分布的随机变量。,一、总体(母体) 在数理统计中,把所研究的对象的全体称为总体。通常指研究对象的某项数量指标,一般记为X。 把总体的每一个基本单位称为个体。如全体在校生的身高X,某批灯泡的寿命Y。对不同的个体,X的取值是不同的。X是一个随机变量或随机向量。X或Y的分布也就完全描述了我们所关心的指标,即总体的分布。为方便起见,我们将X的可能取值的全体组成的集合称为总体,或直接称X为总体。X的分布也就是总体的分布。,二、随机样本从总体X
2、中抽出若干个个体称为样本,一般记为(X1,X2,Xn)。n称为样本容量(或样本大小)。而对这n个个体的一次具体的观察结果(x1,x2,xn)是完全确定的一组数值,但它又随着每次抽样观察而改变。(x1,x2,xn)称为样本观察值。,如果样本(X1,X2,Xn)满足(1)代表性:样本的每个分量Xi与总体X有相同的分布;(2)独立性: X1,X2,Xn是相互独立的随机变量,则称样本(X1,X2,Xn)为简单随机样本。,1设总体X的分布为F(x),则样本(X1,X2,Xn)的联合分布为,2当总体X是离散型时,其分布律(离散总体密度)为,样本的联合分布律(离散样本密度)为,3当总体X是连续型时, Xf(
3、x)(连续总体密度),则样本的联合密度(连续样本密度)为,总体、样本、样本观察值的关系,总体,样本,样本观察值,?,理论分布,统计是从手中已有的资料样本观察值,去推断总体的情况总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体。,例5.1 设,(X1,X2,Xn)为X的一个样本,,求(X1,X2,Xn)的密度。,解 (X1,X2,Xn)为X的一个样本,故,例5.2 设某电子产品的寿命X服从指数分布,密度函数,(X1,X2,Xn)为X的一个样本,求其密度函数。,解 因为(X1,X2,Xn)为X的一个样本,,例5.3 某
4、商场每天客流量X服从参数为的泊松分布,求其样本(X1,X2,Xn)的联合分布律。解,三、分组数据统计表与频率直方图,1、分组数据表,(1)组距:若样本值过多时,可将其分为若干组。 分组的区间长度一般取成相等,称区间的长度为组距。(2)组频数:区间所含的样本值个数称为该区间的组频数。(3)组频率:组频数与总的样本容量之比称为组频率。,2、频率直方图 它能够直观地反应出组频率的分布,四、经验分布函数,五、统计量,样本是我们进行分析和推断的起点,但实际上我们并不直接用样本进行推断,而需对样本进行“加工”和“提炼”,将分散于样本中的信息集中起来,为此引入统计量的概念。,(X1,X2,Xn),g(X1,
5、X2,Xn),其中g(x1,x2,xn)是(x1,x2,xn)的连续函数。如果g(X1,X2,Xn)中不含有未知参数,称g(X1,X2,Xn)为统计量。(不含未知参数的样本的函数),如,已知,,(X1,X2,Xn)为X的一个样本,均为统计量,若已知,2未知, (X1,X2,X5)为X的一个样本,几个常用的统计量样本均值,样本方差,样本均方差(样本标准差,样本k阶原点矩,样本k阶中心矩,顺序统计量,样本极小值,样本极大值,极差,5.2 常用统计分布,(一) 2分布1、定义: 设X1,X2,Xn为取自总体N(0,1)的样本,则,一、常用分布 2分布、 t 分布和F分布。,称为自由度为n的2分布。,
6、n个相互独立的服从标准正态分布的随机变量的平方和服从2(n)。,2分布的密度函数f(y)曲线,例5.4,(X1,X2,X3)为X的一个样本,求,的分布。,解 因为(X1,X2,X3)为X的一个样本,则,i=1,2,3,例5.5,(X1,X2,X6)为X的一个样本,求常数C使得CY服从2分布。,解 因为(X1,X2X6)为X的一个样本,XiN(0,1),i=1,26,则,所以,取常数C=1/3使得CY服从2分布,性质1. 若X2(n),则E(X)=n,D(X)=2n证明:,性质2.(分布可加性):若X2(n1),Y2(n2),X与Y独立,则 X + Y2(n1+n2 ),3、2分布表及有关计算(
7、1)构成 P2(n)=,已知n, 可查表求得;(2)有关计算,称为上侧分位数,练习1. P(2(n)s)=1-pP(2(n) s)=0.05,求s解:,练习3. P(ab) -1- P(2(n)a ),例5.6 总体XN(,2),(X1,X2,X16)为一个样本,求,解,1、定义 若XN(0, 1),Y2(n),X与Y独立,则,t(n)称为自由度为n的t分布。,(二) t分布,例5.6,(X1,X2,X3)为X的一个样本,求,的分布,i=1,2,3,解,t(n) 的概率密度为,2、基本性质: (1) f(t)关于t=0(纵轴)对称;(2) f(t)的极限为N(0,1)的密度函数,即,3、t分布
8、表及有关计算 Tt(n) PT= ,注:,T分布的双侧分位数,例5.7.设总体X服从N(0,1),样本X1,X2Xn来自总体X,试求常数c使统计量 服从t-分布.,例5.8.设随机变量X服从N(2,1),随机变量Y1 ,Y2 ,Y3, Y4均服从N(0,4),且它们相互独立,令求(1)T的分布,(三) F分布,1、定义 若X2(m),Y2(n) ,X,Y独立,则,称为第一自由度为m ,第二自由度为n的F分布,其概率密度为,例5.9 (X1,X2,X5)为取自正态总体XN(0,2)的样本,求统计量,的分布,解,2、 F分布表及有关计算 PF(m,n)= =F(m,n),(2)FF(n1,n2),
9、则,3 F分布的性质,5.3 抽样分布:统计量的分布,证明,组合,故服从正态分布。,1、若,则,是n 个独立的正态随机变量的线性,2、设(X1,X2,Xn)是正态总体N(,2)的样本,则 (1),(2),(3),与S2独立,(4),例5.10.设X1, X2 ,X25是取自N(21,4)的样本, 求(1)样本均值的数学期望和方差;,解:,例5.11.设X1, ,X10是取自N(2,16)的样本, 求a。解:,例5.12 设X1,X2, ,X8 是取自N(1,9)的样本,求样本方差 S2的期望与方差。解:,3、设(X1,X2,Xn)是正态总体N(,2)的样本,则,证明 (X1,X2,Xn)是正态
10、总体N(,2)的样本,则由分布定理1、2可知,与S2独立,且,所以由t分布的定义,可知,例5.13设X1,X2, ,X8 是取自N(0,9)的样本,求解:,4、设(X1i,X2i,Xnii)是来自具有相同方差2 ,均值为i的正态总体N(i,2)的样本,i=1,2,t,且设这t个样本之间相互独立,设,分别是第i个总体的样本均值和样本方差,i=1,2,t,则有(1)2t个随机变量,是相互独立的。,(2),其中,(3)当t=2时,有,5、设(X1,X2,Xn1)是N(1,12)的样本,(Y1,Y2,Yn2)是N(2,22)的样本,且相互独立,S12,S22是样本方差,则(1),例5.14 设总体XN
11、(10,32),(X1,X2,X6)是它的一个样本,设,(1)写出Z所服从的分布;(2)求P(Z11)。,解 因为(X1,X2,X6)是XN(10,32)的一个样本,因此XiN(10,32),且Xi相互独立,i=1,2,6,所以,P(Z11),例5.15 X服从正态分布 ,X1,X2X10是X的样本,求下列概率。,练习:设X1, ,X10是取自N(0,0.32)的样本,求,例5.16 两个总体X,Y均服从正态分布N(20,3), 分别抽取容量为10及15的样本,求概率,例5.17:设(X1, ,X20)和(Y1,Y2Y25)是分别来自XN(30,9 )和 YN(30,9)的两个独立的简单随机样本,,例5.18:设(X1, ,X9)和(Y1,Y2Y16)是分别来自XN(a,4 )和YN(b,4)的两个独立的简单随机样本,记求,