1、前面,我们讨论了参数的点估计. 它是用样本算得的一个值去估计未知参数. 但是,点估计仅仅给出了未知参数的一个近似值,它没有反映出这种估计的精度. 区间估计正好弥补了点估计的这个这个不足之处.,2 区间估计,一 、定义 设X1 , , Xn为来自总体XF(x, )的一个样本, 为未知参数。若对于给定的(0 1),存在统计量,使得对所有的 满足,则称随机区间,为参数 的置信度为 1- 的置信区间,,分别称为置信度 为1- 的双侧置信区间的置信下限和上限。置信度1- 也称置信水平。,对一个具体的区间,而言,它可能包含, 也可能不包含, 包含 的可信度为1,二 构造置信区间的方法,1. 枢轴量法的具体
2、步骤,从未知参数 的某个点估计,出发,构造,与 的一个函数,使得H的分布已知,且与 无关。该函数通常称为枢轴量。,利用不等式运算,将不等式,适当选取两个常数c, d,使对给定的有,等价变形为,即,此时参数 的置信度为1- 的置信区间为,A (X1 , , Xn ),B (X1 , , Xn),2. 如何确定c , d,我们总是希望置信区间尽可能短.,设,d,只要它们的纵标包含f(x)下1-的面积,就确定一个1-的置信区间.,的概率密度为 f(x)。任意确定两个数c和,在,c = d, d=f (.)的上 /2分位数.,当c = d 时求得的置信区间的长度为最短.,的概率密度为单峰且对称的情形,
3、,当,的概率密度为不对称的情形,如,分布,F分布,习惯上仍取对称的百分位点来计算未知参数的置信区间.,例如,N(0, 1),取 的点估计为,求参数 的置信度为 1 的置信区间.,例1 设X1,Xn是取自N(, 2) 的样本, 2已知,解:,寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.,因为,对于给定的置信水平, 根据U的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平1.,N(0, 1),u/2, u/2,从中解得,于是所求 的 置信区间为,说明:(1)L越小,置信区间提供的信息越精确;(2)置信区间的中心是样本均值;(3)置信水平 1 越大,z /2越大,因此置信区间
4、越长;(4)样本容量n越大,置信区间越短。,置信区间的长度为,例2 已知某地区新生婴儿的体重 XN(, 2) , , 2未知。随机抽查n个婴儿得n个体重数据,X1,X2,Xn,求 的区间估计(置信水平为1 ),t(n 1),取 的点估计为,解:,寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.,因为,对于给定的置信水平, 根据 t 的分布, 确定一个区间, 使得U取值于该区间的概率为 置信水平1.,t(n 1),从中解得,例3 已知某地区新生婴儿的体重 XN(, 2) , , 2未知。随机抽查n个婴儿得n个体重数据,X1,X2,Xn,求 2 的区间估计(置信水平为1 ),2(n 1),
5、取 2 的点估计为,解:,寻找一个待估参数和 估计量的函数 ,要求 其分布为已知.,因为,对于给定的置信水平, 根据枢轴量的分布, 确定一个区间, 使得枢轴量取值于该区间 的概率为置信水平1.,2(n 1),从中解得,例4: 有一大批糖果.现从中随机的取16袋,称得重量(以克记)如下:,设每袋糖果的重量近似服从正态分布,试求总体均值 和标准差 的置信水平为0.95的置信区间。,506 508 499 503 504 510 497 512,514 505 493 496 506 502 509 496,解:(1)这是单总体方差未知,总体均值 的区间估计问题.均值 的置信水平为1 的置信区间为,根据给出的数据,算得,这里,均值 的置信水平为0.95 的置信区间为,总体标准差 的置信水平为0.95的置信区间为,根据给出的数据,算得 s =6.2022.,这里,标准差 的置信水平为0.95 的置信区间为,作业,