1、1,概率论与数理统计,(二十一)开始王柱2013.05.27,2,概率论与数理统计,第七章续 特殊的区间估计,3,(7.4.1 ) 大样本情形下总体均值的区间估计,由概率论中的中心极限定理可知,不论所考察的总体分布如何,只要样本容量n足够大,样本均值近似地服从正态分布。即,设总体X的分布是任意的,均值 和方差 都是未知的。用样本 对总体平均数 作区间估计。,由于样本容量n足够大,总体方差近似地用样本方差代替,也近似地服从正态分布。即,4,于是,由得,总体平均数 的区间估计为,5,某市为了解在该市民工的生活状况,从中随机抽取了100个民工进行调查,得到民工月平均工资为230元,标准差为60元,试
2、在95%的概率保证下,对该市民工的月平均工资作区间估计。,这里n=100可以认为是大样本。 1- =0.95, /2=0.025,查附表2得 u 0.975=1.96,于是, 置信度为0.95的置信区间为(218.24,241.76)。,解:,置信下限 (元),置信上限 (元),例21-01.,6,设有一容量大于50的样本,它来自参数为p的0-1分布的总体 X .,又例. 0-1分布参数的区间估计,求: p的置信度为1- 的置信区间.,样本为 X1,X2,Xn,由于样本容量大,认为,近似地服从正态分布N(0,1).于是有,7,而不等式,于是有,p 的近似的、置信度为1- 的置信区间为,等价于,
3、记,8,例、从一大批产品的100个样品中, 得一级品60个.,一级品率 p 是0-1分布的参数.,计算得,于是所求p的置信度为0.95的近似置信区间为,求:这大批产品的一级品率 p 的置信度为0.95的置信区间.,解:,这里 1- =0.95, /2=0.025 ,n=100, u 0. 975=1.96,例21-02.,9,下面考察总体X服从二点分布 情形,其分布律为 ,从总体中抽取一个容量为n的样本,其中恰有 m 个“1”,现对p作区间估计。此时,,在最后一式推导中,需注意仅能取“1”和“0”,把这些量代入上式,得p的置信度为1- 的置信区间是,10,从一大批产品中随机的抽出100个进行检
4、测,其中有4个次品,试以95%的概率估计这批产品的次品率。,记次品为“1”,正品为“0”,次品率为。总体分布是二点分布,根据题意n=100,m=4,由1- =0.95, /2=0.025,查附表2得 u 0.975=1.96。,置信下限,于是, 置信度为0.95的置信区间为(0.002, 0.078)。,解:,置信上限,例21-03.,11,需要指出,上面介绍的两种情况均属于总体分布为非正态分布的情形,如果样本容量较大(一般)时,可以按正态分布来近似其未知参数的估计区间。如果样本容量较小(一般 )时,不能用上述的方法求参数的估计区间。参数估计采用表格的形式小结于表7-4-1中。,12,设对于给
5、定的值 (01),若由样本 X1,X2,Xn 1.若统计量 (X1,X2,Xn),满足,7.5: 单侧置信区间,我们称随机区间 ( , )为 的置信度为1- 的单(上、右)侧置信区间, 称 为置信度为1- 的单侧置信下限.,2.若统计量 (X1,X2,Xn),满足,我们称随机区间 (- , )为 的置信度为1- 的单(下、左)侧置信区间, 称 为置信度为1- 的单侧置信上限.,13,如,正态总体 X; 均值 ,方差 2均为未知.设X1,X2, Xn为该总体 N (, 2)的样本.并给定置信度为1- ,由,于是得到 的置信度为1- 的单(下)侧置信区间为,有,即, 的置信度为1- 的单(下)侧置
6、信区间的置信上限为,14,注意到,因此, 的置信度为1- 的单(下)侧置信区间,即,即, 的置信度为1- 的单(下)侧置信区间的置信上限,15,由,于是得到 的置信度为1- 的单(上)侧置信区间为,有,即, 的置信度为1- 的单(上)侧置信区间的置信下限为,同理,16,注意到,因此, 的置信度为1- 的单(上)侧置信区间,即,即, 的置信度为1- 的单(上)侧置信区间的置信下限,17,又由,于是得到 2 的置信度为1- 的单 (下)侧置信区间为,有,即,2的置信度为1- 的单(下)侧置信区间的置信上限为,18,又由,于是得到 2 的置信度为1- 的单 (上)侧置信区间为,有,即,2的置信度为1
7、- 的单(上)侧置信下限为,19,从一批灯泡中随机取5只作寿命试验. 测得的寿命如下:,设灯泡寿命近似地服从正态分布.,这里 1- =0.95, n=5, t 0. 95(4)=2.1318,计算得,于是所求置信度为0.95的单(上)侧置信下限为,求灯泡寿命平均值的置信度为0.95的单(上)侧置信下限.,解:,例21-04.,20,概率论与数理统计,第八章续 特殊的假设检验,21,(*1)基于成对数据的检验n1=n2=n ,12 22 且未知,为了比较两种产品、两种仪器、两种方法等 的差异,我们常在相同的条件下做对比试验,得到一批成对n1=n2=n的观察值。然后分析观察数据做出推断。这种方法称
8、为逐对比较法。,令 ,视 为总体 的一个样本,于是,所要进行的检验等价于一个正态总体,方差未知的检验即可(t检验) 。其中:,则 ,22,(*2) 总体方差12 22 都未知,且n1 n2的检验,令,,并设X1,X2,Xn1为来自总体 N (1, 12)的样本. Y1,Y2,Yn2为来自总体 N (2, 22)的样本. 这两个样本相互独立。 n1 n2.检验为,H0:1 =2; H1: 1 2 。,23,则,其中,,24,在H0成立的条件下,选用统计量,即可,其中,于是,视 为来自正态总体的一个样本。原来的问题等价于一个正态总体,未知方差,检验,25,在平炉上做操作方法的试验.交替进行两种方法
9、各10炉,其得率为:,这里取 =0.05, 由表8.3.1知此检验问题的拒绝域为,设两个样本相互独立.且来自两个正态总体N (1, 2), N (2, 2).问新法y能否提高得率?(取=0.05).,解:,按题意需检验 H0:1-2=0; H1: 1-2 0 。,有时提出的假设检验问题可能是:,此时称为右边检验。,在显著性水平 下,检验假设 H0: = 0; H1: 0” 的拒绝域.,取检验统计量,当假设H0为真时, z不应太大.因而拒绝域的形式为,当假设H0为真时,由正态分布分位点的定义得, . 拒绝域为,29,类似地:在显著性水平 下,左边检验问题 “ H0: = 0; H1: 0 。,3
10、.在显著性水平 下,左边检验假设 H0: = 0; H1: 0 。,拒绝域的形式为,取检验统计量,32,已知某种水果罐头(维生素C)的含量服从正态分布。标准差为3.98(毫克)。产品质量标准中,Vc的平均含量必须大于21毫克。现从一批这种水果罐头中抽取17罐,测得含量平均值 (毫克)。问这批罐头的Vc含量是否合格?取 =0.05。,解:因为本题要求的平均含量必须大于21毫克,少了判为不合格品,所以用单侧检验。,在成立的条件下,,例21-07.,33,由检验水平=0.05 ,查标准正态分布表,得临界值 ,确定否定域为 。,由样本观察值计算,所以,否定,即认为这批罐头的含量符合标准。,34,2.
11、2为未知,关于均值 的检验(t检验),采用统计量,总体为 N (, 2),其中,2为未知,我们来求检验问题:,H0: = 0; H1: 0 。在显著性水平 下的拒绝域.,作为检验统计量,当 t 过分大时就拒绝H0,拒绝域的形式为,35,3. 单个正态总体方差的假设检验,设总体为N (, 2) , 、2均为未知,要求 检验假设(显著性水平为 ):,H0: 2 = 02 ; H1: 2 02 。,由于s2 是 2的无偏估计,当H0 为真时,比值在 1 附近摆动,而不应过分大于1,也不应过分小于1。我们已知,36,我们取,其拒绝域的形式为:,作为检验统计量。,此处k的值由下式确定:,37,机器包装食
12、盐,假设每袋盐重服从正态分布,规定每袋盐标准重量为500克,标准差不能超过10克。某日开工后,从装好的食盐中随机抽取9袋,测得重量为(单位:克):497 507 510 475 484 488 524 491 515。问这天包装机的工作是否正常(取 =0.05)?,所以,不能否定H0 ,即可以认为平均每袋盐重为500克。,在H0成立的条件下,解:包装机工作正常指 克和 ,因此分两步进行检验。,现在, n=9, =0.05,得临界值又得,例21-08.,38,所以,否定 ,即可以认为方差超过(10)2 ,包装机工作不稳定。 由、可以认为,包装机工作不正常。,在 成立的条件下,现在, n=9, =
13、0.05,得临界值又得,39,总体 X N (, 2), =2, =40。现在用新法生产。随机取n=25。样本均值为 =41.25。设总体均方差不变。问在显著性水平= 0.05之下产品有否提高?,解:按题意需检验假设“ H0: = 0 =40 ; H1: 0”。这是右边检验问题。,拒绝域为,现在,落在拒绝域中。拒绝H0,认为产品有显著的提高。,例21-09.,40,是利用假设H0为真时服从N(0,1)分布来确定拒绝域的的统计量,这种检验法称为 u 检验法.,上面例1中,如将需要检验的问题写成以下的形式更为合理:,H0: 0; H1: 0 。,取显著性水平 ,来确定拒绝域.,因为在H0中的 都比
14、在H1中的 要小,从直观上看,较合理的检验法则应是:若观察值的 与0的差 过分大,即 则我们拒绝H0,因此 拒绝域的形式为,41,由标准正态分布函数 (x) 的单调性得到,要控制,只需令,42,即得,即,从而检验问题的拒绝域为,和以前是一样的.,比较总体 N (, 2) ,在2为已知,关于均值 的两种 检验问题: 和,H0: = 0; H1: 0 。,H0: 0; H1: 0 。,尽管原假设的形式不同,实际意义也不一样,但对于相同的显著水平,它们的拒绝域是相同的.因此遇到形如后者的检验问题,可归结为前者形式来讨论.,43,某厂生产钢筋,已知钢筋强度服从正态分布, ,2为未知。其强度标准为52(kg/mm2),今抽取6个样品,测得其强度数据如下(单位:kg/mm2):48.5 49.0 53.5 49.5 56.0 52.5。判断这批产品的强度是否合格(=0.05)?,t未落在拒绝域中,故接受H0,即认为产品的强度与标准强度无显著性差异,就现在样本提供的信息来看,产品是合格的。,在H0成立的条件下,解:,现在, n=6,t0.975(5)=2.571。又得,例21-10.,44,概率论与数理统计,结束,