1、63第五章 统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数
2、检验将在第六章进行讨论,本章着重讨论参数检验。第一节 点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量( xn12, )来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种
3、次品率来估计更为可靠呢?记 A =“抽取15件产品,只有一件是次品 ”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有 X=0 与 X=1 两种情形,于是,可得事件 A发生的概率为:P(A)= 其中:是这批产品的次品率。若次品率=0.1,则P(A)= 0914.0.1=0.0229 若次品率=0.4,则P(A)= 60.4=0.0003。现在事件A 既然在一次观察中就发生了,直观地我们可以认为事件A发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。由于0.02290.0003,故应选择0.1作为产品的次品率比选择0.4更可靠些。把上例推广到一般
4、的情形,我们就可以得到极大似然法的一般原理。设 nx,21 是取自密度函数为f(x, )的总体的一组样本。其中:x和都为参数,待估计。的极大似然估计的基本思路是,若记A =“一次观察中,所得一组样本的样本值为( nx,21 )”。现在在一次观察中A发生了,即P(A)应尽可能地大,即应在 所有可能取值的集合中选出一个使P(A) 达到最大值的作为的估计值。此时的又称为的极大似然估计值。由于 , 相互独立,且都与X具有相同的分布,由此可以得到, P(A)就相当于事件: XXxn12, 同时发生的概率,也就是P(A)=,记为L( )=L(), 于是有:L()=64L()称为 的似然函数。求极大似然值的
5、问题就是求似然函数 L()的最大值问题,根据微分学的结果,L( )取到最大值的必要条件是它对的导数为零。因为 ln L()与L( )取得极大值的 点相同,为计算方便,我们通常就用对数似然方程来求解最大似然估计值。在我们上述例子中,f(1, )= ,f(0 , )=1-,于是得到似然函数:L()= 1415,iixf令 dL=0,舍去 =1,得 的最大似然估计值 15=0.067。实际上, 15正是在15次抽样中得到一次次品的频率,用频率估计概率,当n充分大时无疑是合理的。例5-2。从一个正态总体中抽取容量为 n的样本,求总体参数 及 的极大似然估计。解:构造似然函数221exp21inx22l
6、ll iL为了求和,使ln的极大,令解上述方程得到:所以得到和的极大似然估计量为:,x 221niSxn二、估计量好坏的评选标准前面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。那么,什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请看下面一个例子。例5-3。假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强度是多少。现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。由于随机原因,每次抽取样本的测量结果是不同的。如果样本容量为3
7、,抽取4组样本,测得结果如表5-1所示。表5-1 一组抽样样本的观察值样本值样本顺序 x1 x3均值1 900 999 1011 9702 995 1050 1105 10653 1010 941 890 9474 950 910 1140 100065为了说明的方便起见,我们假定,实际上=1000公斤,当然这在事先是不知道的。我们要求利用样本信息来推断总体指标,并使其误差最小。第一组样本的中位数最接近总体指标,第二组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断总体指标更合理呢?评
8、价点估计的结果通常有无偏性、有效性和一致性等标准。1. 无偏性无偏性的含义是个别样本由于随机原因可能偏大或偏小,然而一个好的估计量从平均上看应该等于所估计的那个指标,其直观意义是估计量的值应在参数的真值周围摆动而无系统误差。一般地,无偏性的定义为:设 为被估计参数,若有估计量( nx,21 ),对一切n,有 E= ,则称 为 的无偏估计量。若 - b,则称b为估计量 的偏差。若b0,则称 为 的有偏估计量。如果0nli,则称 为 的渐近无偏估计量。不论是重复抽样或不重复抽样,也不论样本容量大小,样本均值及样本比例都是总体均值和总体比例的无偏估计,即 PEX,,但样本方差 2nS并不是总体方差
9、2的无偏估计量。这是因为如果我们把 2nS定义为2nS= 21xi,则:2121xnEiniinii xx122222 21nnnEi 产生偏差的原因是总体方差的无偏估计应该是nxi22,但抽样时由于是未知的,因而用估计量 x来代替。根据最小平方原理,变量X距样本均值 的离差平方和为最小,因此 2i就小于 2i,从而用 代替计算的方差就低估了 2,为了得到 2的无偏估计,令Snxi21这时,由于 ES, nxi21就是 2的无偏估计了。样本方差与 2n之差称为偏差。但当n很大时 0,所以它是渐近无偏差估计。当样66本容量很大时,也可以直接用样本方差作为总体方差的估计值。但如样本容量较小时偏差就
10、比较大了。图5-1 估计的无偏性和有效性2. 有效性即使是符合无偏性要求的估计统计量,在抽取个别样本时也会产生误差。为了使误差尽量地小,要求估计量围绕其真值的变动愈小愈好,也就是说要求统计量的离散程度要小,或者说其方差要小。一般地,有效性的定义为:设、是未知参数的两个估计量,若对任意的正常数c,有,则称比有效。有效性反映了估计量分布的集中程度,估计量的分布越是集中在参数真值附近,则其估计效率越高,如图5-1所示。但是为了方便起见,在实际上有效性可定义为:、是未知参数的两个无偏估计量,若用V(),V()分别表示各自的方差,若 V()/V()100 。这表示备择假设是总体的均值大于 100。或者是
11、:100 。反之,如果只有在样本均值低于假设的总体均值很显著时才拒绝原假设,则称作左侧检验。此时,原假设实际上变为 0: 100,备择假设为 1:496.6。可见样本均值落在原假设的接受区域内。我们接受原假设,即认为这批纸罐的容重符合标准的要求。例5-6。某特种建材生产厂规定某种规格新型墙体材料的重量不得大于500公斤。今随机抽取了16块这种规格新型墙体材料,测得其平均重量为505公斤,标准差S=10。问在=0.05的显著性水平下能否认为这批新型墙体材料的重量符合标准的要求?这次要检验的假设为:H0: 5001:500这次也需要利用t分布来进行检验。这是一个右侧检验问题。原假设的接受区域为1,
12、(nst根据置信度水平=0.05,查表得到 753.1605.t。由此可以得到原假设的接受区域临界点是504.4。现样本均值=505504.4。可见样本均值落在原假设的拒绝区域内。我们拒绝原假设,接受备择假设,即认为这批新型墙体材料的重量不符合标准的要求。(二)比例的假设检验76例5-7。某酒厂规定某种酒中含有的糖度应为12%,产品才能算合格。今随机抽取了100瓶这种酒,发现平均的糖度为11.3%。问在显著性水平=0.10 的条件下,这批酒与合格产品对糖度的要求有无明显的差别?问题要检验的假设为:H0:=0.121:0.12这是比例的双侧检验问题。根据区间估计的结果,原假设的接受区域是 nPZ
13、PnZP1,)1(2/2/ 由于=0.10,则 2/=1.64。计算得到原假设的接受区域是0.114,0.126。由于样本比例0.1131300 的情况下,有( )成立。(单选题)A. 若=0.05 ,则接受 B. 若=0.05,则接受 H1 C. 若=0.10,则接受 D. 若=0.10,则拒绝 5-10 下面关于假设检验的陈述正确的是( )。(多选题)A. 假设检验实质上是对原假设进行检验 B. 假设检验实质上是对备择假设进行检验 C. 当拒绝原假设时,只能认为肯定它的根据尚不充分,而不能认为它绝对错误 D. 假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确E. 当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确5-11 某种新型建材单位面积的平均抗压力服从正态分布,均值为 5000 公斤,标准差为120 公斤。公司每次对 50 块这种新型建材的样本进行检验以决定这批建材的平均抗压力是否小于 5000 公斤。公司规定样本均值如小于 4970 就算不合格,求这种规定下犯第一类错误的概率。78