1、I摘 要指数分布是可靠性工程中最重要的分布之一,对其参数区间估计的研究有一定的理论意义和实用价值。本文主要针对小样本情况,研究指数分布尺度参数的区间估计问题。 讨论了单参数指数分布尺度参数基于选定枢轴变量的最短区间估计方法,根据假设检验与区间估计之间内在的联系,通过似然比检验推导出尺度参数在无偏估计类中最短的置信区间; 针对双参数指数分布,在位置参数未知的条件下,利用尺度参数一致最小方差无偏估计构造枢轴变量推导出该参数的置信区间,同时又利用似然比检验法求出尺度参数置信区间,两种方法所得结果相同,最后给出了尺度参数的定数截尾估计; 本文最后想对指数分布尺度区间估计进行改进,由于涉及到陌生的概念被
2、迫中止,所以将在进一步学习和研究以后再进行讨论。关键词:区间估计;单参数指数;双参数指数;尺度参数;置信区间。IIAbstractPonential distribution is one of the most important distributions in reliability engineering. It is both theoretically meaningful and practical to study the estimation of its parameter range. In this article the parameter range estimat
3、ion of an exponential distribution scale is studied by taking small samples. The choice of the parameter(s) of single-parameter exponential distribution based on the selection of shortest interval of a pivot is discussed. According to the inner connection of hypothesis testing and range estimation,
4、the shortest confidence interval is derived via likelihood ratio testing. For double-parameter exponential distribution, the confidence interval of its position parameter is derived from the pivot constructed from the scale parameter UMVU. The confidence interval of this scale parameter is obtained
5、using likelihood testing. These two methods give the same results from which the truncation estimation for the scale parameter is determined. Finally, the distribution of scale index would like to improve the range of estimates, as it relates to the concept of strangers was forced to suspend, it wil
6、l further study and research in the future discussion.Keywords: range estimation;single-parameter exponent; double-parameter exponent; scale parameter; confidence interval.III目录1 绪论 .11.1 定义介绍 11.2 小结 32 单参数指数分布的置信区间 .42.1 引言 42.2 尺度参数区间估计最短化 42.3 似然比检验法构造置信区间 92.4 小结 .153 双参数指数分布尺度参数的区间估计 163.1 引言
7、.163.2 带冗余参数尺度参数的区间估计 163.3 尺度参数的定数截尾估计 .204 总结 234.1 综述 .234.2 尺度参数区间估计的改进 .23致 谢 25参考文献 .26附录 A 英文原文 .27附录 B 汉语翻译 .3211 绪论1.1 定义介绍定义 1.1 设样本 来自分布函数为 F(X; ), ( 为未知参数)的总体,对于nX,21 给定的常数 ,如果存在两个统计量 与)0(nX,211满足nX,212, (1.1)21P则称随机区间 是参数 的置信水平为 的置信区间。21,由概率性质易知 1即 (1.2)1221PP由置信区间定义得(1.3)21故可得到与定义 1.1
8、等价的定义 1.2定义 1.2 设总体 分布函数为 F(X; ),其中 为未知参数,对于给定的常数X,由来自总体 的简单随机样本 确定的两个统计量)1,0( nX,21和 满足 , 和nX,2n,2121P10, 且 ,则称随机区间 是 的置信水平为P22,的置信区间。1说明:在定义 1.1 中, 是事先选定的,与假设检验类似,对给定的置信水平 ,人们总是力图构造这样的区间估计,使得(1.1)式得到满足,并且至少存在一个 ,使得 ,这意味着置信水平被“足量” 使用了,以满足区间的 1)()(21XP精确度尽可能高的要求。区间估计的要旨是充分使用样本提供的信息,做出尽可能可靠和精确的估计,有了样
9、本 ,就要把 估计在区间 之内,不难理解,这里要有两个要求:nX,21 21,(1) 要以很大的可能性落在区间 内,也就是说概率 要尽量大。21, 21P2(2)区间长度 要尽可能小,或某种能体现这个要求的其它准则。故此,评价12区间估计的优良性有两个要求,其一是置信水平(可靠度) ,即区间包含未知参数概率的大小;其二是精确度,即衡量置信区间的长度,因置信区间是随机区间,故应使用平均长度 作为精确度的度量。平均长度俞小俞好,但在样本大小一定的条12E件下,这两者是矛盾的,犹如假设检验中犯第一类错误的概率与犯第二类错误的概率这一对矛盾,完全与 Neyman 和 Pearson 的假设检验理论的基
10、本思想类似,而区间估计理论和方法的基本问题莫不在于已有样本资源的限制下,怎样找出更好的估计方法,以尽量提高二者置信水平和精确度,但终归有一定的限度。Neyman 提出并为现今广泛采用的原则,在使得置信水平达到一定要求的前提下,寻找精确度尽可能高的区间估计,也就是寻找区间平均长度尽可能短,或者区间包含非真值的概率尽可能小的区间估计。通常,我们通过使用枢轴变量来推导参数的置信区间,或者用某个量的渐近分布(中心极限定理)获得参数的置信区间,但是在样本容量不太大时,并不能保证渐近分布的精确性, 要研究小样本下参数区间估计问题,故采用枢轴变量法推导参数的置信区间。欲构造参数 的置信水平为 的置信区间,我
11、们首先考虑 的 MLE 或充分1统计量,然后据此得到一个统计量 ,并基于 构造枢轴变量,然后推导 的)(XM)(X置信区间。定义 1.3 设样本 的分布族为 ,其中 为分布的参数,设 为X);(F)(XT一统计量,若在已知 的条件下, 的分布与参数 无关,则称 是充分统计量。T T定义 1.4 设 是来自分布族 的独立同分布的样本,Tn,21);(XF随机变量 是样本与参数 的函数,而它的分布又必须与参数 无关的已知分);( 布,具有这一特性的随机变量称为枢轴变量。一般地, 常是充分统计量或点估计的函数。给定的枢轴变量 ,设其分布密度函数为 ,对于给定的常数);(XT)(xg,选取两个常数 和
12、 ( ) ,使得)1,0(1221T, (1.4);(P如果下面两个不等式可以相互转化(1.5)()();( 2121 XXT那么 , (1.6) )()(21P3则区间 为参数 的一个置信水平为 的置信区间。)(,21X1对于枢轴变量 T=T(X; )令P( Tb)= g(t)dt=1- (1.7)ab满足(1.7)式的 ,ab有无穷多个值。事实上,对集合 中0, 21212 任一元素 ,由等式 和 都能确定出 满足21adtg1)()(dtgb ba,从而由不等式 可解出无穷多个随机区间)(dtgba XT;使得 ,即能得到参数 的无穷多个置信水平,21XT )()(21P为 的置信区间。
13、1.2 小结在样本数和置信水平一定的条件下进行参数区间估计时,由于置信区间不是唯一的,所以做区间估计时应尽可能使置信区间平均长度变短,能使置信区间平均长度达到最短,一般就认为比较合理。对于枢轴变量的密度函数为对称的单峰函数时(如标准正态分布,t 分布等) ,在许多经典的统计著作中所提到的左右各取概率为 的分2位点,这样确定的置信区间是最短的。但是当枢轴变量的密度函数为非对称的单峰函数时(如卡方分布,F 分布等) ,用上述方法所确定的置信区间显然不是最短的,而根据 Neyman 置信区间理论可求得平均长度最短的无偏置信区间,如果没有无偏性的保证,置信区间并不是唯一的,受参数估计理论 CR 不等式
14、的启发,如果我们能得到置信区间平均长度较好的下界,那么对于衡量一个置信区间的优劣是极其有益的。42 单参数指数分布的置信区间2.1 引言历史上指数分布是第一个寿命模型,应用很广,所以该模型的统计方法得到广泛发展,早期的 Sukhatme(1973)的工作,随后的 Epstein 和 Sobel(1953,1954,1955)等工作给出了许多结果,并把指数分布当作寿命在推广使用,特别在工业寿命试验领域内的应用更是这样,很多专家学者致力于该分布统计方法的研究 定义 2.1:设总体 服从尺度参数为 的单参数指数分布 ,其密度函X)0()(E数为 00exp1);(xxf2.2 尺度参数区间估计最短化
15、引理 2.1 设 是来自单参数指数分布 的一个简单样本,则nX,21 )(E。 7)2(nXGn由引理 2.1 知,对于给定的常数 ,有)1,0()2()2(1nGnP 1)2()2(1nXnP令,)2(021,ndxg)2(01 2,ndxg5其中 表示 的密度函数。),(nxg)2(所以尺度参数 的置信水平为 的一个置信区间为 。1 )2(,)(21nXn在样本数和置信水平都固定的条件下,尺度参数 置信区间的平均长度越短越好,而枢轴变量 的概率密度函数显然是单峰非对称函数,故用上述方法得到的置信区间nG不是最短的,下面我们将在上述置信区间的基础上寻找最短置信区间。对于给定的置信水平 ,设分
16、位点 满足1ba,(2.1)1),()(nGaPn其中 是 的概率分布函数。),(nx由此我们得到尺度参数 的置信水平为 的置信区间 。aXnb2,该区间的平均长度为 nbaXnaEL212根据 Neyman 区间估计理论的基本思想,我们需要解下述的条件极值问题:寻找 和 使得ab(2.2)1min,bGaPb由于上述条件极值的约束条件比较特殊,很难确定解析解,故先证明此条件极值驻点唯一,以便给数值解法提供方便。定理 2.2 当 时,上述条件极值问题(2.2)有唯一驻点。2n证明:采用 乘子法Lagre令 1),(),(1naGb60),(1,2nbgLaa由此可解出 ),(),(22a即 (
17、2.3)2exp2exp11 bann我们所求的驻点 就是(2.1)式与(2.3) 式的解,这样仅需证明(2.1)式与(2.3) 式有),(ba解而且解是唯一的即可。考虑函数 ,2exp)(1hn0x令 ,可求出 的最大值点 。当 时, 是严格单调0x)( )1(20n0x)(h递增的;当 时, 是严格单调递减的,即 是单峰非对称函数,而当 趋于xhx正无穷大或零时 趋于零。为了保证 和(2.3) 式成立,应该有 ,)(hba)1(2na。根据 的单峰性易知,对于任意的 都可唯一地解出 。)1(2nb bU容易看出 与 的性质相似,它的峰值在 处达到。),(nxg( )1(2nx由 单峰性质知
18、,当 增大到 , 将减少至 ,所以当)hb)(bUaa时, 是随 严格单调增加的,另外当 趋于无穷大时,1(2nbnUG),(, b从大于零的一侧趋于零。而当 在大于 的一侧趋于 时,)Ua )1(2n)1(2n从小于 的一侧也趋于 ,因此有()()(,),(limbnb 0)()1(2nUGn而 ,由介值定理知:存在唯一的 使得10b1),(,nb不妨取 ,所以 是条件极值问题(2.2)的唯一驻点。 证毕)(Ua)(a7推论 2.3 设随机变量 的密度函数 是单峰函数,如果区间 满足:X)(xf ),(ba(1) (2)badxf1)( 0)(bfa那么区间 是满足条件(1)的所有置信区间中
19、最短的。),(证明:根据 的单峰性及条件(2)知,必然存在极值点 满足 ,(f xbxa反证法:假设存在区间 满足条件(1),并且 。则导致矛盾),baba证明:根据 的单峰性及条件(2)知,必然存在极值点 满足 ,)(xf 假设存在区间 满足条件(1),并且 。, b设 ,对于 同理可证。a a若 ,那么 ,则有b xb )()()(1 ba abfabfdxf又因为 )()()( fffba显然矛盾,即 不成立。ab若 ,那么 ,则有 bababadxfxfdxfxf )()(0)()(而 baffffbf )()()()()( 又因为 ,所以 ,显然与已知矛盾。0)(af a综上所述,区
20、间 是满足条件(1)的所有置信区间中最短的。 证毕),引理 2.5 设 为任意实数, 为正整数,则有下式成立:mdttt mtt )exp()1()exp(!01 证明:令 dtttf mmtt )exp()1()exp!)( 01 8显然 是定义在 上的连续可导函数,且有)(f ),(0 )exp(!)exp(!)exp(! )e(111 mttttf mtm mtttt所以 在 内恒为常数,而 ,故 。 证毕)(f),0)(f0)(f由(2.1)式得 1),(),(00dxngdxngba即 1)2ep()(2ep)(210 dxxnbn令 ,代入上式得xu 201201 1)exp()(
21、)exp()(anbn duudu由引理 2.4 得 1)2exp(!)2exp(!nttntt ab所以尺度参数 基于枢轴变量 的置信水平为 的最短置信区间为XGn 。aXnb2,其中 满足,(2.4)10101)2exp(!)2exp(!nt nttt baba对于求解上述非线性规划问题可用 MATLAB 或 LINGO 软件进行数值求解。说明:9我们知道,对于指数分布 ,尺度参数 的枢轴变量不是唯一的,例如在容量)(E为 的样本中,令 为最小的次序统计量,由 的密度函数n)1(X)1(X00exp); xnxf知 ,显然 也是尺度参数 的枢轴变量。由于枢轴变量的不唯一性)2()1(nX)
22、1(nX导致置信区间也不尽相同,所以无法确定最优置信区间。但假设检验和区间估计之间存在非常密切的联系,正因为如此,Neyman 才可以将 Neyman 和 Pearson 假设检验理论的基本思想推广到区间估计。似然比检验是构造检验法的常用方法,N P 基本引理告诉我们,在简单原假设对简单备择假设的检验问题中,最大功效检验可由似然比检验给出,事实上,似然比检验法也可用在复合假设的检验问题中构造检验,因此由似然比检验构造出的置信区间也将具有较好的性质,Richard.J.Larsen 和 Morris.L.Marx6证明了似然比检验是切实可行的。2.3 似然比检验法构造置信区间定义 2.1 考虑假
23、设检验问题:(2.5)1100:H设样本 有概率函数 ,X);(xf统计量 (2.6);(sup)(0xf称为上述检验的似然比统计量。形如: (2.7)的检验Cxx)(10)(称为检验问题(2.5) 似然比检验,其中 为某常数。)(x说明:当 时,由定义 2.1 知010(2.8);()0xf显然有 ,这里 是参数 在整个参数空间中的极大似然估计。在得到样1)(0x本观测值 后,似然性最大的参数值是最大似然估计 ,与参数 真值相当接近。若原假设 成立,即 的真值为 ,则 等于 或“离 很近” ,使得0H000,从而 ;当 显著地小于 1 时,显著地有);(sup);();(xfxff1)(x)
24、(x,即“ 离 很远” ,因 与 的真值很接近,故 的真值为 的可能000性极小,即原假设 极可能不成立。0综上所述,当 时接受 ;当 时拒绝 。Cx)(0HCx)(0H若要寻求参数 置信水平为 的置信区间,则要考虑关于 的检验问题 :1 00H(2.9)0100:设 的一个水平为 的检验 相应的拒绝域与接受域分别为 与 ,0H)(x);(0XW);(0则, (2.10);(00XWP);(00XxP设 ,又设 ,则有);(Sx,)S1(这样就得到 的置信水平为 的置信区间,反之亦然。1设 是来自 的一个简单样本,则样本的似然函数为nX,21 )(E0exp1;, 121 iniinn xIx
25、f 由 0),(2121 ninxdxLnf可知11尺度参数 的极大似然估计为 。niiX1对于检验问题:(2.11)0100:H该检验问题的似然比检验为CXx)(1)(似然比统计量: )0(21exp2)0(2exp2)0(exp);();(su)(10011001100100 iniinin iniini iniini xIexIxIfxfx取 ,012nixt则 )0(2exp2)(1 ininxIttt 当 成立时, 服从 分布,设其密度函数为 。0Htf在 和 内, 关于 分别是严格单调递增和严格单调递减函数。所)2,(n),()(t12以真实水平为 的似然比检验为210)(Cttx
26、或其中 为常数,且由下式确定21,C 2exp2exp1)(1)( 1121212 CCdndxf nC 由引理 2.4 得(2.12) 10102221 1exp!exp!2nt nttt CC由此我们获得尺度参数 的置信水平为 的一个置信区间 ,12,CXn其中 满足(2.12)式。21,C由于区间估计与假设检验存在内在联系,可以预计,最优区间估计与最优假设检验也存在内在联系,按照这一思路来寻求最优区间估计,即 Neyman 的置信区间。由双边假设检验问题(2.9) 的水平为 的检验可以得到 的置信水平为 的置信区间,1但在文献6中已证明了该检验的一致最大功效检验是不存在的,为了研究双边检
27、验问题的最优性,只需在满足无偏性要求这个较小的检验类中寻求最大功效检验,由参数UMPU 检验可导出该参数 UMAU 置信区间,在置信水平给定的条件下,UMAU 置信区间在无偏置信区间中精确度最高。定义 2.2 设样本分布族为 ,对给定的 ,以 表示假设检验:F)1,0(2.5)的所有水平为 的检验组成的集合,若检验 ,且对任一 有)(x)(x, ,则称 为检验问题(2.5)的水平为 的一致最大功效检验)( )(x(UMP 检验) 。定义 2.3 设 是假设检验问题(2.5)的一个检验,其功效函数 满足:)(x )(对 ,有)1,0(,)(013,)(1则称 是检验问题(2.5)的水平为 的无偏
28、检验。)(x显然水平为 的 UMP 检验一定是水平为 的无偏检验。定义 2.4 在检验问题 (2.5)中,如果存在一个水平为 的无偏检验 ,对于任何)(x水平为 的无偏检验 ,有 , ,则称检验 是水平)(x)()(xEx 1为 的一致最大功效无偏检验(UMPU 检验) 。引理 2.5 设双边假设检验问题(2.9)的水平为 的 UMPU 检验的拒绝域为,接受域为 ,如果“ ”可以等价地变换为“);(0XW);(0XW);(0XWx”,那么称 是 的置信水平为 的 UMAU 置信区间。(21,2116由引理 2.5 知,要证明通过似然比检验所确定的置信区间为 UMAU 置信区间。只需求证似然比检
29、验为 UMPU 检验。引理 2.6 设样本 的分布函数族是单参数指数族,其中 是一维开区间, ,X0对任意水平 ,如果检验 具有形式)1,0()(xT 21)(0,CxiTi或其中 , ,皆为常数,且满足21C10(1) (2.13)((2) (2.14)(00 TET则称 是检验问题(2.9)的水平为 的 UMPU 检验。 6)(x引理 2.7 设 是检验问题(2.9)的似然比统计量,令 是 的单调递增(或)(x )UZ单调递减) 函数,则基于 的检验就等价于基于似然比统计量 的检验。Z(x证明:由积分变换易证。定理 2.8 设 是单参数指数分布检验问题(2.11)的似然比检验,cxx)(1
30、0)(14其中似然比统计量 ,则 是该检验的 UMPU 检验。);()0xf)(x证明:设 是来自单参数指数总体 的一个简单样本,则样本的似nX,21 )(E然函数为 0exp1;, 121 iniinn xIxf 充分统计量 ,由定理 2.6 知该检验问题的水平为 的 UMPU 检验可niiXT1)( 表示为(2.15) 21)(0,)(CxTixTi或并应满足(2.13) 、(2.14) 式,显然有,)2(nnTEnE)(的密度函数为)(XT )0(exp)(1;(1Inxf 故检验 的功效函数为21211 )()()( CTPCTTCPTEii 或或 221(2.16)211exp)(C
31、nd15dttnCTPTETEC iii exp)(1)()()(212又由(2.13)、 (2.14)式 , ,故(2.15)式中 可由)(0 )()(00E 21,C(2.17)21021 )1(exp)(20001Cnnndx来确定,易证此方程组有解,所以 是检验问题(2.11) 的 UMPU 检验,由定理 2.7T知似然比检验 是检验问题(2.11)的 UMPU 检验。 证cxx)(1)(毕由引理 2.5 知,通过似然比检验所确定的尺度参数的置信区间为一致最精确无偏置信区间。2.4 小结在小样本条件下,当枢轴变量的密度函数为非对称单峰函数时,传统方法采用概率分布对称来推导参数置信区间显
32、然不是最优的,但随着样本容量的增加,置信区间长度缩短的幅度将呈递减趋势。根据 Fisher 定理 6, , 收敛于正态分布)1(2n,它是对称分布,所以当样本容量增大时,两种方法差异就缩小。由于枢1,32nN轴变量不唯一,无法求得指数分布尺度参数最优置信区间,所以只能在小范围内求取参数最优置信区间,因此我们将置信区间的范围缩小到无偏类中,利用区间估计与假设检验之间内在的联系,通过似然比检验求取尺度参数的一致最精确无偏置信区间。163 双参数指数分布尺度参数的区间估计3.1 引言与单参数指数分布等常见分布一样,双参数指数分布也是一类应用非常广泛的分布。它被用于保险精算模型,也常常被用于建立各种经
33、济模型和用于工程技术问题中,所以对该模型的研究已取得显著进展。 很多人讨论了位置参数与尺度参数的置信区间及其改进, 对双参数指数分布做过相关研究。随机变量 服从双参数指数分布 ,其密度函数为X),(Exxf0exp1),;(其中 为未知的位置参数,也称为冗余参数。R3.2 带冗余参数尺度参数的区间估计3.2.1 枢轴变量法设 是来自双参数指数分布 的一个简单样本,则样本的概率函nX,21 ),(E数为17(3.1)1(121 (exp),;,( xIxf niinn其中 。由因子分解定理得 分别为 的充分),min(21)1( nXX )1()1(,X),(统计量。下面根据充分统计量来寻找尺度
34、参数的一致最小方差无偏估计,可以验证为 的无偏估计。)(n定理 3.1 设 是来自指数分布 的一个简单样本,则统计量n,21 ),(E是 的一致最小方差无偏估计。)(nXL证明:设 , 满足 ,即 ,即),(ET(tl0)(tl0exp)(dtttl,表明函数 的 变换为 0,按 变换的唯0exp)(0dssl )(slLalcLaplce一性,得 ,即 ,故 对 是完备的。因为 是)(l 1)(tlP,E,R的充分统计量和无偏估计,根据 定理 14可知统计量 是 的一致 schefLemanL最小方差无偏估计。 证毕在位置参数未知的条件下,对于尺度参数 的区间估计,本章也采用枢轴变量法,因为
35、枢轴变量不唯一,所以构造枢轴变量的方法的好坏将直接影响到区间估计的优劣。参数的一致最小方差无偏估计作为充分统计量的函数,并且具有完备性,由它构造出的枢轴变量所确定的置信区间也将具有较好的性质。定理 3.2 设 是来自指数分布 的一个简单样本,令nX,21 ),(E,则 。)(1(XnR),(nR证明: )()(1)1( nX令18niiXS1)(而 ,根据 分布可加性知 。)1,(iXGam),(S令 )(1XnT, )(exp1exp1)()1(1 tndtXPtF ntX t故 tttFX0)()(1所以 的密度函数为 ,即 ,)1(X )()(exp)(tItntf ),()1(nEX则
36、 ,由 分布可知 。 证毕,TST, )1,(R设分位点 满足ba)(baP即 1)()(1(aXnbXn则尺度参数 的置信水平为 的一个置信区间为(3.2) anb)(,)(1(1(该区间的平均长度为 banbXnaXnEL 1)()()(1(1( 根据 区间估计理论的基本思想,即需要解决下述条件极值问题:Neyman19(3.3) ba1min 1)exp()1(.2dntsa将 看作 的函数,对积分 两边关于 求导得ba)(2xa a)ep(2badbn令 ,bal1)(则 取最小值时有 ,整理得 。01)(2 dabl 0)exp()e(bann所以尺度参数 基于枢轴变量 的置信水平为
37、 的最短置信区间为R1XXn)(,)(1(其中 满足 (3.4)ba,banndxxb1)ep()1(0e2易证此方程组解存在且唯一,证明过程可参考定理 2.2。3.2.2 似然比检验法在第二章,我们通过似然比检验法构造单参数指数分布尺度参数的置信区间,并且证明该区间为一致最精确无偏置信区间,本节将继续利用似然比检验构造在位置参数未知的条件下双参数指数分布尺度参数的区间估计。由样本概率函数(3.1) 式易知 是 的极大似然估计,)1(X由 知 是 的极大似然估计0,(21nxL )1(对于检验问题: 0100:H似然比统计量 20)()(exp)()(,;)(),;(sup)( 10(01(
38、)1(0(0)1( 00 xInneIxxffnniin令 ,0)1(xnt则 0,)()exp)(1 tIttnt 易知 关于 为单峰函数,这里取 作为检验统计量,)(t0)(X检验函数 Ctx)(1)(下面讨论 的概率分布t当 成立时,由定理 3.2 知统计量 ,0H )1,()(01(nXnt所以 的概率密度函数为 。t )(exp)1()2tItntf当 接受原假设 时,则有C0(3.5) 2121 1)exp()(0e)exp()( 2212 tnntn dttdtt 所以尺度参数 的置信水平为 的一个置信区间为,1)(2)1(,tXntX21其中 满足(3.5) 式。显然通过似然比
39、检验法所确定的置信区间与用枢轴变量法所确21,t定的置信区间相同。3.3 尺度参数的定数截尾估计在实际问题中经常会遇到数据缺失问题,譬如在产品寿命实验中,由于实验设备、观测手段或其它方面的困难造成某些数据丢失或未观测到的现象等,这样我们得到的是“缺失数据”。若由于部分数据缺失重做实验一般是不值得的,有时甚至是不可能的,如何对缺失数据后的现有数据进行统计分析是一个特殊的、有较大难度的问题。因此,寻找在缺失数据条件下对不完全数据进行科学、有效的可靠性分析方法现已成为可靠分性分析中一个新的十分重要的领域。假设将随机抽取的 n 个产品在时间 t=0 是同时投入试验,试验进行到有 m 个产品失效停止,m
40、 个失效产品的失效时间分别为 0 ,这里 是第 m 个021ttmt产品的失效时间, 是随机变量。所得的样本 t 称为定数结尾样本。mt ,设 是来自指数分布 的一个简单样本, 是该样nX,21 ),(E)()2()1,rX本中前 个次序样本,下面我们通过尺度参数的最佳线性无偏估计来构造该)(r参数的枢轴变量,首先寻找尺度参数的最佳线性无偏估计。引理 3.3 设 是来自 的前 个次序样本,记 ,)()2()1( rX ),(r)1(Y, ,则 相互独立,且(iii XinY,3Y21 ,1nE, 。 5,i r,3引理 3.4 设 是来自指数分布 的前 个次序样本,记 ,)()2()1r )(
41、Er)(iiXU, ,则 ,jjiiij UXE)()( 2)(2iiiUX10sin,1022)(sist n。 5r0定理 3.5 设 是来自双参数指数分布 的前 个样本,)()2()1,rX ),(E)1(nr则 。 )(1)1()( rriiBLUEn根据尺度参数最佳线性无偏估计来构造尺度参数的枢轴变量,22令(3.9)(1)1()(2 rriiri XnXYS由引理 3.3 知 ),1(r尺度参数 的枢轴变量 。)2(2rS设分位点 满足 ba, 12bSaP即 (3.10)12exp)1(22drrba所以尺度参数 的置信水平为 的定数截尾估计为 ,该区间的平均长bSa2,度为 b
42、arbSaEL1)(2根据 Neyman 区间估计理论的基本思想,问题转化为求条件极值:(3.11)12exp)1(2.1min2drtsbara通过 乘子法得:Lagrne(3.12) barrrr xb12ep)1(20exp2所以尺度参数 基于枢轴变量 的置信水平为 的一个定数截尾估计为S,其中 满足(3.12)式。bSa2,ba,234 总结4.1 综述参数的置信区间表示该参数的取值范围和可信程度,在置信水平给定的条件下,置信区间的平均长度越短,估计的精确度就越高。如何构造合适的统计量,使得构造出的置信区间的平均长度尽可能短是一个重要的统计学问题。本文分别 对单参数指数分布参数和双参数指数分布尺度进行了讨论。对单参数指数尺度分布的讨论,根据来自它的一个小样本,首先构造枢轴变量求出它的置信区间,由于所构造的枢轴变量的概率密度函数显然是单峰非对称函数,所以得到的置信区间不是最短的,于是对给定的置信水平设分位点 a,b,将分位点 a,b 带入所求出的置信区间,得出新的置信区间,问题就转化为求满足置信区间最小的条件极值问题。本文又给出了一个推论,结论是必须满足推论中提出的 2 个条件,置信区间才是最短的。从而确定了最短的置信区间,即是由满足 a,b 具备的条件而得到的。以上就是用传统方法求出的最短置信区间。由于枢轴变量的不唯一性导致置信区间也不相同,所以无法确定最优的置信区间,