1、Ch6 统计推断,统计学原理,6.1 总体参数估计(new) 6.2 总体参数检验(new) 6.3 非参数检验(new),主要介绍:统计推断的理论与方法。,Ch6 主要内容,Ch6 统计推断 6.1 总体参数估计(new) 6.2 总体参数检验(new) 6.3 非参数检验(new),Ch6 学习目的,1,掌握统计估计的基本理论与方法 2,掌握统计检验的理论与方法 3,掌握非参数检验的理论与方法,Ch6 统计推断 6.1 总体参数估计(new) 6.2 总体参数检验(new) 6.3 非参数检验(new),Ch6 统计推断,统计学原理,6.1 总体参数估计(new) 6.2 总体参数检验(n
2、ew) 6.3 非参数检验(new),6.1 总体参数估计,6.1.1 参数估计的基本概念 6.1.2 点估计 6.1.3 优良估计量的标准 6.1.4 总体参数的区间估计 6.1.5 总体平均数的估计 6.1.6 总体成数的估计 6.1.7 总体方差的估计,Ch6 统计推断 6.1 总体参数估计(new) 6.2 总体参数检验(new) 6.3 非参数检验(new),返回,6.1.1 参数估计的基本概念,Ch6 统计推断 6.1 总体参数估计(new),统计推断,就是利用样本的数据,对总体的数量特征,做出具有一定可靠程度的估计和判断。统计推断的基本内容,有参数估计和假设检验两方面。 参数估计
3、,就是研究一个随机变量X,推断它具有什么样的数量特征,以及按什么样的方式变动; 假设检验,则是推测随机变量的数量特征和变动模式,是否符合我们事先所作的假设,如果不符合假设,那么它的数量特征可能是什么。 本节先研究总体参数的估计。,6.1.1 参数估计的基本概念,Ch6 统计推断 6.1 总体参数估计(new),总体参数估计总体参数估计,是以样本统计量,作为未知总体参数的估计量,并通过观察取得样本数据,计算样本统计量的取值,作为被估计参数的估计值。通常,设F(X;)为总体X的分布函数, 为待估计的总体参数,对参数所做的估计记为 。 参数估计,通常又可分为点估计和区间估计两种。 估计置信度。又称估
4、计推断的概率保证程度,或者说是估计的可信程度。通常记为1- 。其中,称为风险概率。 抽样极限误差。 又称允许误差范围。是指在某种概率条件下,估计参数真值与估计值的离差绝对值,记为(6.1.1) 愈小,表明抽样估计的准确度愈高,反之,准确度愈低。如果=0,则表明估计无偏误。 设估计置信度为1- ,则 与估计置信度的关系为:(6.1.2),6.1.1 参数估计的基本概念,Ch6 统计推断 6.1 总体参数估计(new),抽样平均误差 就是抽样估计量的标准差。记为 。(6.1.3) 由于在无偏条件下,(6.1.4) 有(6.1.5) 因此, 又是抽样极限误差 在各种概率条件下的标准差。 当然,要计算
5、 ,必须知道 的分布。,返回,6.1.2 点估计,Ch6 统计推断 6.1 总体参数估计(new),当总体X的分布函数形式F(X; )为已知时,但它的参数为未知,若从总体中抽取一个样本X1,X2,X3, Xn ,并直接以样本统计量,作为相应总体参数的估计量,则用该样本统计量,对所作的一个数值点的估计,就称为点估计。点估计记为比如,用样本平均数估计总体平均数,用样本的方差估计总体方差,等等,都是点估计。点估计又叫定值估计。 未知参数与样本统计量Zn=Z(X1,X2,X3, Xn)之间,一般都存在某种变换关系 =f (Zn). (6.1.2),6.1.2 点估计,Ch6 统计推断 6.1 总体参数
6、估计(new),【例6-1】设某灯泡的寿命X N(2), 2 为未知,今随机取的4只灯泡,测得寿命数据为1502,1453,1367,1650。试估计和 。 解:因为是全体灯泡的平均寿命,为样本的平均寿命,因此,可用样本平均数估计总体平均数,用样本的方差S2估计总体方差2 。于是, 和 的估计值分别为1493和118.61。,返回,6.1.3 优良估计量的标准,Ch6 统计推断 6.1 总体参数估计(new),一般地,作为优良的估计量,至少应该满足以下三个标准: 一致性。 如果估计 是一致的,那么对于任意小的数0,有(6.1.3) 无偏性。 如果有关系式(6.1.4) 成立,那么,称 是的无偏
7、估计。 如果有关系式(6.1.5) 成立,那么,则称 是渐近无偏的。 有效性。 如果 和 都是的无偏估计量,但如果(6.1.9) 则称 相对于 是更有效的估计量。,6.1.3 优良估计量的标准,Ch6 统计推断 6.1 总体参数估计(new),【例6-2】如果X1,X2,X3, Xn1来自同一总体X,且是相互独立,若总体X的k阶原点矩E(Xk)k存在,且总体X的k阶中心矩D(Xk) 2k - k2=mk也存在,按照随机收敛的定义,当n时,有因此,样本k阶原点矩Ak,是总体k阶原点矩k的一致估计;样本k阶中心矩Bk,是总体k阶中心矩mk的一致估计。 于是,样本平均数是总体平均数的一致估计,样本方
8、差是总体方差的一致估计。 【例6-3】设总体X的k阶矩k =E(Xk),k1存在,又设X1,X2,X3, Xn是X的样本。试证明,不论X服从什么分布,k阶样本矩是k阶总体矩 k的无偏估计。 证明:X1,X2,X3, Xn1与X同分布,故有E(Xik) = E(Xk) = k,.i=1,2,n 即有(6.1.6) 特别的,不论X服从什么分布,只要它的数学期望存在, 总是总体X的数学期望1 =E(X)的无偏估计量。,6.1.3 优良估计量的标准,Ch6 统计推断 6.1 总体参数估计(new),【例6-4】对于均值,方差2都存在的总体,若, 2 均未知,则 2的估计量(6.1.7)是有偏误的(即不
9、是无偏估计)。证明:由(6.1.6),有 E(A2) = 2 = 2+ 2,. 又故所以 是有偏的。 相反,可证样本方差(p144)(6.1.8) 是 2的无偏估计。因此,一般都取S2作为方差 2的估计量。,返回,6.1.4 总体参数的区间估计,Ch6 统计推断 6.1 总体参数估计(new),置信区间 设总体X的分布函数F(X; ),含有一个未知参数 。对于给定的01,若由样本X1,X2,X3, Xn 确定的两个估计值 和 (其中 ),满足(6.1.10) 则称随机区间 ,是的置信度为1- 的置信区间, 为置信估计下限, 为置信估计上限,1- 为置信概率水平, 叫风险概率或者显著性水平。如图
10、61。根据分布函数与概率密度函数的关系,(6.1.10)式可化为(6.1.11),6.1.4 总体参数的区间估计,Ch6 统计推断 6.1 总体参数估计(new),区间估计 总体参数的区间估计,就是求的置信区间 ,求置信区间,就是当给定置信度1- 时,解方程(6.1.11)求 。进一步,如果置信区间的上、下限,是一个以真值为中心的对称随机区间(6.1.12) 则方程可化为(6.1.13) 在这个方程当中,未知的量是或者 。 要解方程求出的置信区间,还必须知道样本估计量以及与相关的统计量Zn的分布。即知道f ( )。 于是,解方程(6.1.13)后,得的置信区间的上、下限(6.1.14) 其中,
11、 为的点估计值。,6.1.4 总体参数的区间估计,Ch6 统计推断 6.1 总体参数估计(new),求未知参数的置信区间的具体步骤 第一步,寻求一个样本X1,X2,X3, Xn的函数Zn=Z(X1,X2,X3, Xn; ) (6.1.16) 它包含待估参数 ,而不包含其它未知参数;并且Z的分布已知,且不依赖于其它任何未知参数(包括 )。 第二步,对于给定的置信度1- ,定出两个常数Z1, Z2,使得Pro Z1 Zn(X1,X2,X3, Xn; ) Z2 = 1- . (6.1.17) 第三步,从Z1 Zn(X1,X2,X3, Xn; ) Z2得到等价的不等式, 其中(6.1.18) 那么,
12、就是的一个置信度为1- 的置信区间。 特别的,当 是一个以真值为中心的对称随机区间时,有(6.1.19) 则这个对称的随机区间可表示为(6.1.20) 其中, 为的点估计值。,6.1.4 总体参数的区间估计,Ch6 统计推断 6.1 总体参数估计(new),【例6-5】设总体X N(2),方差2 为已知, 为未知,X1,X2,X3, Xn是来自X的样本,求的置信度为1- 的置信区间。 解:我们知道 是的无偏估计。根据样本抽样定理,有(6.1.21) Z所服从的分布N(0, 1),是不依赖于任何未知参数的。按标准正态分布的上分位点的定义,有(6.1.22) 即 (6.1.23) 这样,我们就得到
13、了的一个置信度为1- 的置信区间(6.1.24)显然,在这里(6.1.25) 而Z/2则称为标准正态分布的概率度系数。,6.1.4 总体参数的区间估计,Ch6 统计推断 6.1 总体参数估计(new),区间估计的特点 区间估计的特点是,它不是指出被估计参数的确定数值,而是指出被估计参数的可能范围,以及参数落在这一范围内的概率保证程度。通常的做法是,令风险概率 为小概率,即 =0.05或者 =0.01;而 则由确定。 从上面的结论可知,在进行区间估计的时候,既可以给定置信度1- ,去估计抽样误差的可能范围 ;也可以给定允许极限误差 ,去推算概率保证程度1- 。,返回,6.1.5 总体平均数的估计
14、,Ch6 统计推断 6.1 总体参数估计(new),总体平均数的估计,分为两种情况 第一种情况,设总体X N(2),方差2 为已知, 为未知,X1,X2,X3, Xn是来自X的样本, 分别是样本平均数和样本方差。求的置信度为1- 的置信区间。 解: 2 为已知,此时由(6.1.20)式的函数,已得到的置信度为1 - 的置信区间(6.1.26)第二种情况,设总体X N(2), 2 均为未知,X1,X2,X3, Xn是来自X的样本, 分别是样本平均数和样本方差。求的置信度为1 - 的置信区间。,6.1.5 总体平均数的估计,Ch6 统计推断 6.1 总体参数估计(new),解: 2为未知,此时不能
15、使用(6.1.21)式给出的区间,因为其含有未知参数 ,考虑到S2是 2的无偏估计,因此,可将(6.1.21)式中的换成S,由抽样定理,有(6.1.27)t所服从的分布t(n-1),是不依赖于任何未知参数的。按t分布的上分位点的定义,有(6.1.28) 即(6.1.29)这样,就得到了的一个置信度为1- 的置信区间(6.1.30) 在这里(6.1.31)而t/2(n-1)则是t分布的概率度系数。,6.1.5 总体平均数的估计,Ch6 统计推断 6.1 总体参数估计(new),【例6-6】某大学从该校中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95%的置信水平,估计该
16、大学全体学生平均每天参加体育锻炼的时间。已知总体方差为36。 解:总体X的分布形式未知,但总体方差2=36,且n=10030为大样本。根据中心极限定理,有取Z为估计统计量,于是,总体均值 的置信度为1- 的置信区间为由1- =0.95, =0.05,Z/2=1.96, =26,得全体学生平均每天参加体育锻炼的时间即为(24.824, 27.176)。,6.1.5 总体平均数的估计,Ch6 统计推断 6.1 总体参数估计(new),【例6-7】某大学从该校中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。假定总体X N(2),总体方差 2未知,但已知样本方差S2=34。试以95
17、%的置信水平,估计该大学全体学生平均每天参加体育锻炼的时间。 解:因为总体X N(2),不知2 ,但已知样本方差S2=34。根据抽样定理,有取t 为估计统计量,于是,总体均值的置信度为1- 的置信区间为由1- =0.95, =0.05,t /2(n-1)=1.984, =26,得全体学生平均每天参加体育锻炼的时间即为(24.84, 27.16)。,返回,6.1.6 总体成数的估计,Ch6 统计推断 6.1 总体参数估计(new),总体成数估计和总体平均数估计相类似。 设有一容量n50的大样本,它来自(0, 1)分布的总体X,X的均值为P,方差为P(1-P),其中P就是总体成数,是一个未知参数。
18、求P的置信度为1- 的置信区间。 解:已知(0, 1)分布均值和方差为 =P, 2 =P (1-P)。 (6.1.32) 设X1,X2,X3, Xn是来自X的样本,因为样本容量较大,由中心极限定理,有(6.1.33)近似地服从N(0, 1)分布,Z是不依赖于任何未知参数的。于是有(6.1.34),6.1.6 总体成数的估计,Ch6 统计推断 6.1 总体参数估计(new),而不等式(6.1.35) 等价于(6.1.36) 记(6.1.37) 则(6.1.38)于是,我们就得到了P的近似的、置信度为1- 的置信区间(P1, P2)。其中 为样本成数。,6.1.6 总体成数的估计,Ch6 统计推断
19、 6.1 总体参数估计(new),【例6-8】设自一大批产品的100个样品中,得一级品60个,求这批产品的一级品率P的置信度为0.95的置信区间。 解:一级品率P是(0, 1)分布的参数,此处n=100, =60/100=0.6,1- =0.95, /2=0.025,Z /2=1.96,则有于是,P1=0.50,P2=0.69。故得P的置信度为0.95的近似置信区间(0.50, 0.69)。,返回,6.1.7 总体方差的估计,Ch6 统计推断 6.1 总体参数估计(new),总体方差也是表明总体数量特征的重要指标。很多情况,需要利用抽样的方法,来估计总体方差。通常是,以样本方差S2来估计总体方
20、差 2,即。 但这只是点估计,更多的是求它的区间估计。 设总体X N(2), 2 均为未知,X1,X2,X3, Xn是来自X的样本,S2是样本方差。求2 的置信度为1- 的置信区间。 解: 2 的无偏估计为S2,由抽样定理,有(6.1.39) 2所服从的分布2(n-1),是不依赖于任何未知参数的。,6.1.7 总体方差的估计,Ch6 统计推断 6.1 总体参数估计(new),故有(6.1.40) 即(6.1.41)这样,就得到了2 的一个置信度为1- 的置信区间(6.1.42)其中, 2/2和 21- /2自由度为n-1的 2分布的 /2分位点和1- /2分位点,并且 21- /2 2 /2。
21、,6.1.7 总体方差的估计,Ch6 统计推断 6.1 总体参数估计(new),【例6-9】设某种金属抗拉强度服从正态分布。抽取10个样品做抗拉强度试验,测得数据方差S2=4,试求 2的置信度为95%的置信区间。 解:因为金属拉强度X N(2), 2 均为未知, 2 的无偏估计为S2,由抽样定理,有取 2为估计统计量,于是,得到了 2的一个置信度为1-的置信区间由于,S2=4,n=10,1- =0.95, /2=0.025,得 2 /2(n-1)=19.0228和 21- /2(n-1)=2.7004。 于是 即 2的置信度为95%的置信区间为(1.8925, 13.3314)。 则的置信度为
22、95%的置信区间为(1.38, 3.365)。,返回,6.2 总体参数检验,6.2.1 总体参数假设检验 6.2.2 正态总体均值的检验 6.2.3 总体成数的检验 6.2.4 总体方差的检验,Ch6 统计推断 6.1 总体参数估计(new) 6.2 总体参数检验(new) 6.3 非参数检验(new),返回,6.2.1 总体参数假设检验,Ch6 统计推断 6.2 总体参数检验(new),参数假设检验 设总体X的分布函数F(X; ),含有未知参数 。所谓参数假设检验,就是先对提出一个假设,这个假设称为原假设或0假设,记为H0: = *,其中 *为假设值;于是,在H0成立的条件下,对于给定的置信
23、概率1-,必然存在一个可置信的概率区间( 1*, 2*)和不可置信区间(-, 1*)( 2*,+ );Pro 1* 2* = 1- . (6.2.1) 如果,我们用随机抽样资料计算的统计估值 ,落在区间( 1*, 2*)内,则可认为H0是可信的,抽样与理论假设H0无显著性差异;反之,就是有显著性差异的,假设H0是不可信的;对不可信的假设,我们同样也提出一个与H0对立的备择假设或1假设H1: *,或者H1: *,或者H1: *。 那么,可置信区间( 1*, 2*)就称为可接受域;不可置信区间(- , 1*) ( 2*,+ )称为拒绝域;拒绝域与可接受域的边界点 1*, 2*称为临界点。 参数假设
24、检验的目的,就是判断应该相信的假设是H0还是H1。当然,这种判断存在风险。这种风险,来源于假设检验中的两类错误判断。,6.2.1 总体参数假设检验,参数假设检验(续),Ch6 统计推断 6.2 总体参数检验(new),6.2.1 总体参数假设检验,假设检验的两类错误 所犯错误一般有两种类型:一类是H0为真却被拒绝了。犯这种错误的概率用表示,所以也叫错误或弃真错误。另一类错误是H0为伪却被接受了。犯这种错误的概率用表示,所以也叫错误或纳伪错误。正确的决策和犯错误的概率可归纳如表:表71 假设检验中各种可能结果的概率在作检验决策的时候,当然希望,少犯或不犯错误;同时也希望,少犯或不犯错误。但在样本
25、容量为一定的条件下, 错误和错误是一对矛盾, 大小和成反比关系,减少犯错误的可能性,势必增加犯错误的可能性。在实际工作中,由于不可能无限增大样本容量,一般选择 =0.05或者 =0.01,以控制错误为主,而不考虑错误的检验。 水平也叫显著性水平。因此,参数假设检验也叫显著性检验。它是在显著性水平下,针对H1检验H0是否成立的检验。,Ch6 统计推断 6.2 总体参数检验(new),6.2.1 总体参数假设检验,双侧检验与单侧检验 根据研究的问题性质,以及统计量与总体参数的显著性差异方向,统计检验的方法,有: 双侧检验 单侧检验。,Ch6 统计推断 6.2 总体参数检验(new),6.2.1 总
26、体参数假设检验,双侧检验 如果在显著性水平下,需要检验的假设是H0: = *,H1: *, (6.2.2) 则这种检验就称为双侧检验。,Ch6 统计推断 6.2 总体参数检验(new),6.2.1 总体参数假设检验,双侧检验(续) 双侧检验的检验问题是,总体参数与样本估值有没有显著性差异,而不问差异的方向是正或负。所以,给定的显著性水平 ,通常按对称分配的原理,平均分配到左右两侧,每方各为 /2,相应得到下临界值 1*,上临界值 2*。如图63。Pro 1* 2* = 1- . (6.2.3) 即Pro 1* = /2.,Pro 2* = /2. (6.2.4) 在双侧检验中,用样本资料计算统
27、计量的实际值 ,并与事先给定的临界值 1*, 2*作比较。如果 2*,或 1*,就拒绝原假设H0,而接受备择假设H1;如果 1* 2*,就不能否定原假设,而应接受原假设是真实的。,Ch6 统计推断 6.2 总体参数检验(new),6.2.1 总体参数假设检验,单侧检验: 单侧检验,就是除了检验总体参数与样本估值有没有显著性差异外,还要检验是否有方向性的差异。 右单侧检验。 左单侧检验。,Ch6 统计推断 6.2 总体参数检验(new),6.2.1 总体参数假设检验,右单侧检验: 如果在显著性水平下,需要检验的假设是 H0: *,H1: *, (6.2.5) 则这种检验就是右单侧检验。 右单侧检
28、验有 Pro 2* = . (6.2.6) 如果 2*,就拒绝原假设H0,而接受备择假设H1;如果 1*,就接受H0是真实的。,Ch6 统计推断 6.2 总体参数检验(new),6.2.1 总体参数假设检验,参数假设检验的实质总体参数假设检验,是在某种概率条件下,利用样本的实际资料计算参数估值,来检验事先对总体参数特征所作的假设,是否可信。比如,我们可以,把过去长期观察的平均水平和变异情况当成一个标准,来判断当前股票价格水平是否正常。如果现在的价格变化与过去基本保持一致,则可以认为,过去拟定的标准是有效的,是基本正确的;如果现在的价格变化与过去长期背离,则可以认为,过去拟定的标准是有问题的,理
29、论假设有可能是错误的。所以,参数假设检验假设的实质,是理论假设与实际抽样的一个对比。,Ch6 统计推断 6.2 总体参数检验(new),6.2.1 总体参数假设检验,总体参数检验的步骤: 第一步,根据实际问题的要求,建立原假设H0和备择假设H1。原假设,总是假定总体没有显著性差异,所有差异都是由随机原因引起的。备择假设,是原假设的对立事件。 第二步,给定检验的显著性水平和样本容量n。在H0假设成立的条件下,由被检验的统计量分布,求出相应的临界值 1*, 2*,该临界值即为H0的拒绝域与接受域的分界线。 第三步,确定检验统计量,并依据样本资料计算检验参数估计值 。 第四步,将 值与临界值进行比较
30、。如果 值超过临界值,说明抽样落入拒绝域中,可以拒绝接受H0;若 值小于临界值,抽样落入接受域中,我们就不能拒绝H0,而必须接受原假设或作进一步的检验。,Ch6 统计推断 6.2 总体参数检验(new),返回,6.2.2 正态总体均值的检验,正态总体均值的检验: 总体均值的假设检验,就是检验当前的总体均值与假设的总体均值,是否存在显著性差异。可以根据研究问题的要求和样本资料的条件,灵活运用各种检验方法。 Z检验。又称正态分布检验。 t检验。又称t分布检验。 在假设检验中,由于样本容量和样本资料的限制,使样本统计量有不同的概率分布,是形成Z检验和t检验两种方法的主要原因。,Ch6 统计推断 6.
31、2 总体参数检验(new),6.2.2 正态总体均值的检验,Z检验。又称正态分布检验。 设X N(2), X1,X2,X3, Xn是来自X的样本,已知2,检验假设H0: = 0。其中, 0为已知数。其检验的步骤: 第一步,根据实际问题的要求,建立原假设H0,和备择假设H1。例如, H0: = 0,H1: 0, (6.2.9) 或者H1: 0,或者H1: 0。 这里以检验H0: = 0,H1: 0为例。 第二步,对于样本X1,X2,X3, Xn,在H0假设成立的条件下,由抽样定理,有 (6.2.10),Ch6 统计推断 6.2 总体参数检验(new),6.2.2 正态总体均值的检验,Z检验。又称
32、正态分布检验。(续) 在给定显著性水平条件下,有 Pro |Z| Z/2 = 1- . (6.2.11) 在这里,Z为检验的统计量,Z/2为检验统计量的临界值,可根据给定查表求出。 第三步,根据样本资料,计算检验统计量的Z值。 第四步,检验比较。如果|Z|Z/2,就说明抽样落入拒绝域中,可以拒绝H0而接受H1;若|Z| 0或 0。 (6.2.12) 的拒绝H0条件|Z| Z ,接受H0条件|Z|Z 。,Ch6 统计推断 6.2 总体参数检验(new),6.2.2 正态总体均值的检验,【例6-10】某批发商欲从工厂购进一批灯泡,根据合同规定,灯泡的平均使用寿命不能低于1000小时。已知灯泡的使用
33、寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时,问批发商是否应该购买这批灯泡=0.05。 解:这是个左单侧检验问题。因为灯泡的平均使用寿命超过1000小时,批发商是欢迎的,批发商关心的问题是,样本均值为960小时是否应该购买,他可以容许的下限是什么,灯泡的寿命低于什么水平是不能接受的。 H0: 0=1000,H1: 1000。 因为,灯泡的使用寿命X N(2), 2=20。所以,在H0成立条件下,由抽样定理有在H0和显著性水平的条件下,有 Pro |Z| Z = . 取Z为检验统计量。因 =0.05,查正态分布表Z =1.645;由n=100, 2=
34、20, =960, 0=1000,计算得Z= -2。 由于|Z| =2 Z =1.645,Z值处于拒绝域中,所以可以拒绝H0而接受H1,即这批灯泡的寿命低于1000小时,批发商不应该购买这批灯泡。,Ch6 统计推断 6.2 总体参数检验(new),6.2.2 正态总体均值的检验,t检验。又称t分布检验。 设X N(2), X1,X2,X3, Xn是来自X的样本,但2未知,检验假设H0: = 0。其中, 0为已知数。其检验的步骤: 第一步,根据实际问题的要求,建立原假设H0,和备择假设H1。例如, H0: = 0,H1: 0, (6.2.13) 或者H1: 0,或者H1: 0。 这里依然以检验H
35、0: = 0,H1: 0为例。 第二步,对于样本X1,X2,X3, Xn,在H0成立的条件下,由于2 未知,可用样本的方差S2代替2 ,由抽样定理,有(6.2.14),Ch6 统计推断 6.2 总体参数检验(new),6.2.2 正态总体均值的检验,t检验。又称t分布检验。(续) 在给定显著性水平条件下,有 Pro |t| t /2(n-1) = 1- . (6.2.15) 这里,t为检验的统计量,t/2(n-1)为检验统计量的临界值,可根据给定查表求出。 第三步,根据样本资料,计算检验统计量的t值。 第四步,检验比较。如果|t| t/2(n-1),就说明抽样落入拒绝域中,可以拒绝H0而接受H
36、1;若|t| 0或 0。 (6.2.16) 的拒绝H0条件|t| t (n-1),接受H0条件|t| t (n-1)。,Ch6 统计推断 6.2 总体参数检验(new),6.2.2 正态总体均值的检验,【例6-11】某机器制造出的肥皂厚度为5cm,今欲了解机器性能是否良好,随机抽取10块肥皂做样本,测得平均厚度为5.3cm,标准差为0.3cm,试以 =0.05的显著水平检验机器性能是否良好。 解:机器性能是否良好,取决于产品的厚薄合乎规定,不能太大也不能太小,于是假设为 H0: = 0=5,H1: 5, 由于总体的方差未知,用样本方差S2代替,由抽样定理有在显著性水平的条件下,有 Pro |t
37、| t /2(n-1) = 1- . 取t为检验统计量。因为n=10,S=0.3, =5.3, 0=5,计算得t=3.16;由 =0.05,查t分布表得t /2(n-1)=2.2622。 由于|t| =3.16 t/2(n-1)=2.2622,所以可以拒绝H0而接受H1,说明该机器性能不好。,Ch6 统计推断 6.2 总体参数检验(new),返回,6.2.3 总体成数的检验,设X 的分布为(0, 1)分布,其均值和方差为 =P, 2 =P(1-P)。 (6.2.17) 其中,P就是总体成数。设X1,X2,X3, Xn是来自X的样本,则总体成数的检验步骤为: 第一步,建立原假设H0,和备择假设H
38、1。可以是, H0: =P0,H1: P0, (6.2.18) 或者H1: P0,或者H1: P0。 这里以双侧检验H0: =P0,H1: P0为例。 第二步,对于随机样本X1,X2,X3, Xn,可计算其样本平均数p;由抽样的中心极限定理,在大样本条件下,有(6.2.19)近似地服从N(0, 1)分布。,Ch6 统计推断 6.2 总体参数检验(new),6.2.3 总体成数的检验,于是,在H0成立和的条件下,有 Pro |Z| Z /2 = 1- . (6.2.20) 在这里,Z为检验的统计量,Z/2为检验统计量的临界值,可根据给定查表求出。 第三步,根据样本资料,计算检验统计量的Z值。 第
39、四步,检验比较。如果|Z| Z/2,就说明抽样落入拒绝域中,可以拒绝接受H0而接受H1;若|Z|P0或 P0。 (6.2.21) 的拒绝H0条件|Z| Z ,接受H0条件|Z|Z 。,Ch6 统计推断 6.2 总体参数检验(new),6.2.3 总体成数的检验,【例6-12】一项调查结果显示,某地老年人口比重为14.7%,该地老年人口研究会,为了检验该项调查是否可靠,随机抽取了400名居民,发现其中有57人年龄在65岁以上。问:调查结果,是否支持该地老年人口比重为14.7%的看法? =0.05。 解:设老年人口比重为 =P,则 H0: =P0=14.7%,H1: 14.7%, 由抽样的中心极限
40、定理,在大样本条件下,有并且,显著性水平的条件下,有 Pro |Z| Z /2 = 1- . 取Z为检验统计量。因为n=400,P0=14.7%,p =57/400=14.25%,计算得Z = -0.254; =0.05,查正态分布表得Z /2=1.96。 由于|Z| =0.254 Z/2=1.96,所以可以接受H0,即调查结果,支持该地老年人口比重为14.7%的看法。,Ch6 统计推断 6.2 总体参数检验(new),6.2.3 总体成数的检验,值得注意的是,以上的检验是针对大样本情况做出的。如果样本是一个小样本,n30,则成数的检验,应该按照二项分布检验处理。我们用一个例子说明它的检验步骤。,Ch6 统计推断 6.2 总体参数检验(new),6.2.3 总体成数的检验,【例6-13】在一批货物中有优良品及次品,次品率P未知。合同规定,货物的次品率不得超过P0=0.1,如果该批货物的次品率超过了P0=0.1,则货物的订货方,有权拒绝接受货物。从中抽取容量n=30的样本,找到了4件次品。问订货方是否应该接受货物? =0.05。 解:这是个小样本单侧检验问题。因为货物的次品率低于P0=0.1,订货方是欢迎的。于是有假设 H0: P0 =0.1,H1: P0 。 指定1及0分别对应于次品及优良品,并研究服从二项分布的统计量其中Xi是服从(0,1)分布的随机变量。,