1、1,第5章 假设检验,本章教学目标了解和掌握统计推断中的另一个基本问题:参假设检验及其在经济管理中的应用;掌握运用 Excel 的“数据分析”及其统计函数功能求解假设检验问题。,2,本章主要内容,5.1 案例介绍 5.2 假设检验的基本原理5.3 单个正态总体均值的检验 5.4 单个正态总体方差的检验5.5 两个独立正态总体均值的检验5.6 成对样本试验的均值检验5.7 两个正态总体方差的检验5.5 总体比例的检验本章重点:假设检验中不可避免的两类错误及其应用 Excel“数据分析”功能的使用及其运行输出结果分析。难点:假设检验中不可避免的两类错误及其应用。,3,5.1 案例介绍,【案例1】新
2、工艺是否有效?某厂生产的一种钢丝的平均抗拉强度为 10560 (kg/cm2)。现采用新工艺生产了一种新钢丝,随机抽取 10 根,测得抗拉强度为: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 10670求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。是否就可以作出新钢丝的平均抗拉强度高于原钢丝,即新工艺有效的结论?,4,某台加工缸套外径的机床,正常状态下所加工缸套外径的标准差应不超过 0.02 mm。检验人员从加工的缸套中随机抽取 9 个,测得外径的样本标准差为 S = 0.03 mm。问:该机床的加工
3、精度是否符合要求?,【案例2】机床加工精度是否符合要求?,5,新车的平均首次故障里程数是汽车的一个主要可靠性指标。现测得甲、乙两种品牌轿车的首次故障里程数数据如下:甲品牌 X1:1200, 1400, 1580, 1700, 1900乙品牌 X2:1100, 1300, 1800, 1800, 2000, 2400 其中,【案例3】两种轿车的质量有无差异?,问:能否据此判定乙品牌轿车的平均首次故障里程高于甲品牌?,=1733,=1556,6,为分析甲、乙两种安眠药的效果,某医院将20个失眠病人分成两组,每组10人,两组病人分别服用甲、乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时
4、间对比试验(小时),(1)哪种安眠药的疗效好?(2)如果将试验方法改为对同一组10个病人,每人分别服用甲、乙两种安眠药作对比试验,试验结果仍如上表,此时结论如何?,【案例4】哪种安眠药的疗效好?,7,【案例5】某一系列电视剧是否获得成功,如果能够证明某一系列电视剧在播出的头13周其观众的收视率超过了25,则可以断定它获得了成功。假定由400个家庭组成的样本中,有112个家庭在头13周看过了某系列电视剧。现在要判断这部电视剧是否获得了成功。,8,【案例6】女企业家对成功的理解是否不同,对女企业家进行了一项研究来看她们对成功的理解。给她们提供了几个备选答案,如快乐/自我实现,销售/利润,成就/挑战
5、。根据她们业务的总销售额将其分为几组。销售额在10万50万元的在一组,少于10万元的在另一组。要研究的问题是:把销售/利润作为成功定义的比率,前一组是否高于后一组?,9,5.2 假设检验的原理,一、实际推断原理假设检验的理论是小概率原理,又称为实际推断原理,其具体内容是:小概率事件在一次试验中是几乎不可能发生的。二、假设检验推理的思想方法假设检验推理的思想方法是某种带有概率性质的反证法。,10,三、基本原理和步骤例1:统计资料表明,某电子元件的寿命 XN(0 , 2 ),其中 0 已知, 2 未知。现采用了新工艺生产,测得新工艺生产的 n 个元件寿命为 x1, x2, , xn。问:新工艺生产
6、的元件期望寿命 是否比原工艺的元件期望寿命 0 有显著提高?此问题要推断的是: 是否 0?这可用假设检验的方法解决,步骤如下:,. 5.2 假设检验的原理,11,1.提出一个希望推翻的假设,本例中 H0: = 02. 按希望出现的结果提出一个与原假设对立的假设, 称为备择假设,记为 H1。 本例中 H1: 03. 构造一个能用来检验原假设 H0 的统计量,t (n-1),本例中,要检验的是总体均值 ,,当 H0 为真时,,估计,故应使用,来构造检验 的统计量。,统计量,称为原假设,记为 H0,12,4. 给定一个小概率 ,,称为显著性水平,显著性水平 是当 H0 为真时,,拒绝 H0 的概率,
7、(即犯“弃真”错误的概率)。,也即当检验结果拒绝 H0 时,,不犯错误的概率为 1-,,从而可以有1- 的可信度接受,备择假设 H1。,5. 确定要拒绝 H0 时统计量的取值范围,,称为拒绝域,,拒绝域的边界点称为临界值。,本例中,,由于 H1: 0,而当 H0 为真时,,有,P t t ( n-1 ) = 1-,可知当统计量 t t(n-1) 时,,就可以有1- 的把握判定,H0 不真,(犯错误的概率仅为 ),,故此时应拒绝 H0。,从而拒绝域为 t t(n-1),,临界值为 t(n-1)。,(右边检验),,13,6. 计算统计量 t 的值,,本例中,,若计算结果为 t t(n-1),,并作
8、出检验结论,则拒绝 H0,,接受 H1,,即在水平 下,,认为 显著高于 0。,若 t t(n-1) | H0 为真= 可知检验中可能出现以下两类判断错误:,二.检验中可能犯的两类错误,第一类错误,当 H0 为真时拒绝 H0 的错误,,即“弃真”错误,,犯此类错误的概率为 。,第二类错误,当 H0 不真时接受 H0 的错误,,即“取伪”错误,,记犯该类错误的概率为 ,,即,P tt(n-1)H0 不真= ,由于 H0 不真时与 H0 为真时,,统计量 t 的分布是,不同的,,故 1-。,Result Possibilities结果的各种可能性,Relationship Between a &
9、ba & b 间的联系,17,两类错误的关系,由图可知,减少 会增大 ,反之也然。在样本容量 n 不变时,不可能同时减小犯两类错误的概率。应着重控制犯哪类错误的概率,这应由问题的实际背景决定。当第一类错误造成的损失大时,就应控制犯第一类错误的概率 (通常取 0.05,0.01等);反之,当第二类错误造成的损失大时,就应控制犯第二类错误的概率 。要同时减小须犯两类错误的概率,必须增大样本容量 n。,x,0,H0:=0,t(n-1),H1:=1,18,t (n -1),5.3 单个总体均值的检验,设 XN( , 2 ),, 2 未知,,X1, X2, , Xn 为总体,X 的样本,,给定水平 ,,
10、原假设为,H0: =0 ( 0为某一给定值),当 H0 为真时,,统计量,1. H1:0 (双边检验),当 H0 为真时,,由,P-t/2 (n-1)tt/2 (n-1)=1- ,可得:,若 |t| t/2 (n-1),就拒绝 H0,接受 H1;,否则接受 H0。,19,当 H0 为真时,由 P t t ( n-1) =1-可得:若 t t ( n-1 ) 就拒绝 H0,接受 H1;否则就认为 并不显著高于 0 。,3. H1: 0 (左边检验) 由 P t -t (n-1) =1-可得:若 t 0,(右边检验),20,案例1. 检验新工艺的效果,某厂生产的一种钢丝抗拉强度服从均值为10560
11、(kg/cm2)的正态分布,现采用新工艺生产了一种新钢丝,随机抽取10根测得抗拉强度为: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 10670问在显著性水平 = 0.05下,新钢丝的平均抗拉强度比原钢丝是否有显著提高?,21,案例 1 解答:,说明新工艺对提高钢丝绳的抗拉强度是有显著效果的。,本案例为右边检验问题,,设新钢丝的平均抗拉强度为 ,, 2 未知,,故使用,t 检验。,由题意,,H0: =0,,H1: 0,由所给样本数据,,可求得:,S = 81,,n =10,, =0.05,,t0.05(9)=1.8
12、331, t =2.7875,故拒绝 H0,,即在水平 =0.05下,, 显著高于 0。,t(n-1),= t0.05(9),=1.8331,22,在案例1中,若取 = 0.01,问结论如何?,【解】 t0.01(9) = 2.8214, t =2.7875 P0,P 25%, 样本比例 p = 112/400 = 0.28,26,设 H0: 2 = 02 (02为某一给定值)则当 H0为真时,统计量,与前面分析完全类似地,可得如下检验方法:,5.5. 单个总体方差的检验, 2 02, 2 02, 2 02 ,故拒绝 H0,即该机床加工精度已显著下降。 应立即停工检修,否则废品率会大大增加。,
13、【案例2】 机床加工精度问题,29,课堂练习 4,一台奶粉自动包装的包装精度指标为 标准差 = 0.005 (kg) 某天开工时,随机抽检了 10 袋产品,测得其样本标准差为 S = 0.00554 (kg) (1)在水平 = 0.25 下,检验该天包装机的包装精度是否符合要求。 (2)在本检验问题中,为什么要将 取得较大?,30,统计意义上的显著和实际的显著,有时,由于非常大的样本容量,你很有可能会得出统计意义上的显著性但实际中的显著性却很小。比如,假设在全国性的关于高档次的商业电视市场推广活动之前,你知道人们对你的品牌认知度是0.3。在活动结束之后,根据对20,000人的调查显示有6,16
14、8人认识你的品牌。单边检验希望能证明现在的认知比例是大于0.3,而p-值结果为0.0047,正确的统计结论是品牌名字消费者的比例现在取得了显著性改变,而在实际上这个增长重要吗?总体比例现在的估计值在6,168/2,00000.3084,或是30.84%。这个增长量只比假设检验值30%多了1%。在市场推广活动中的高额费用产生的结果是否对品牌认知度有意义呢?现实中的低于1的市场认知度的微小增长与高成本的市场活动费用相比,你应该认为这次市场活动是不成功的。如果品牌知名度提高了20,你就能得出活动是非常成功的。,31,5.6.两个总体均值的检验,设总体 X1 N ( 1, 12),,X2N ( 2,
15、22),,且 X1和 X2 相互独立。,和 S12, S22 分别是,它们的样本的均值和样本方差,,样本容量分别为,n1和 n2。,原假设为,H0:1 = 2,32,可以证明,当 H0 为真时,统计量,其中:,完全类似地,可以得到如下检验方法:, t ( n1+n2-2 ),称为合并方差。,1. 12 = 22 = 2,,但 2 未知,( t 检验 ),33,测得甲, 乙两种品牌轿车的首次故障里程数数据如下:甲品牌 X1:1200, 1400, 1580, 1700, 1900乙品牌 X2:1100, 1300, 1800, 1800, 2000, 2400设 X1和 X2 的方差相同。问在水
16、平 0.05 下,(1)两种轿车的平均首次故障里程数之间有无显著差异?(2)乙品牌轿车的平均首次故障里程是否比甲品牌有显著提高?,【案例3】轿车质量差异的检验,34,解:,双边检验问题,S12=269.62,,S22=471.92,12 = 22 = 2 未知,,n1= 5,,H0:1= 2,H1:12。,由所给数据,可求得, | t | = 0.74, -t(n1+n2-2) = -t0.05(9) = -1.833故乙品牌轿车平均首次故障里程并不显著高于甲品牌。 显然,对给定的水平 ,若单边检验不显著,则双边检验肯定不显著。 但反之却不然,即若双边检验不显著,单边检验则有可能是显著的。,H
17、1:12,36,用 Excel 检验两总体均值,可用 Excel 的【工具】“数据分析”“ t检验:双样本等方差假设”,检验 12=22= 2,但 2未知时两个总体的均值。,在Excel 的输出结果中: “P(T=t)单尾”,t (统计量),0,f (t),“P(T=t)单尾”的值(概率),单边检验达到的临界显著性水平;,“P(T=t)双尾”,双边检验达到的临界显著性水平。,由图可知:,P(T=t)双尾 = 2P(T=t)单尾,“P(T=t)单尾”和“P(T=t)双尾”统称为“ p 值 ”。,37,“P(T=t)单尾”与“P(T=t)双尾”的使用,从而,若“P(T0.05,则结果为不显著;“P
18、(T0.05; “P(T0.05, 故无论单边还是双边检验结果都不显著。,t,t,“P(T t,等价于,“P(T=t)单尾” t/2,等价于,“P(T=t)双尾” t 0.005(9) = 3.2498, 案例 5 解答,42,可用 Excel 的【工具】“数据分析”“ t检验:平均值的成对二样本分析”进行成对样本试验的均值检验。,用 Excel 求解,本例中“P(T=t)双尾”= 0.0028 F ( n1, n2 ) = 的数值 F (n1, n2)。,F( n1, n2 ),F (n1, n2)有以下性质: F1- (n1, n2)=1/F(n2, n1)利用上式可求得 F 分布表中未给
19、出的 值的百分位点。,如 F0.95(10, 15) = 1/F0.05(15, 10),46,可用 Excel 的统计函数 FINV 返回 F(n1,n2)。语法规则如下:格式:FINV( , n1, n2 )功能: 返回 F ( n1, n2 )的值。,用 Excel 求 F( n1, n2 ),47,2. 两总体方差的检验 ( F 检验 ),原假设为 H0:12=22。,完全类似地,可以得到如下检验方法:, F ( n1-1, n2-1 ),当 H0为真时,,统计量,48,【例2】在 0.20下,检验【案例3】中两个正态总体的方差是否存在显著差异。,解:由题意,H0:12=22,H1:1
20、222,n1=5,n2=6由例5的计算结果,S12=269.62,S22=471.92,= 0.326,F/2(n1-1, n2-1),= F0.1(4, 5),= 3.52,F1-/2(n1-1, n2-1),= F1-0.1(4, 5),=1/F0.1(5, 4),=1/4.05,= 0.247,F = 0.326,F1-0.1(4, 5) = 0.247, F0.1(4, 5) = 3.52,故在水平 = 0.20下,,12 与 22 间无显著差异。,可知案例4 中关于 12 = 22 的假定是合理的。思考题:本例中为什么要将 取得较大?,49,可用 Excel 的【工具】“数据分析”“F检验: 双样本方差”检验两个正态总体是否是同方差的。 在 Excel 的输出结果中 “P(F=f)单尾”与“P(T 0, 2,1 P2,P1 22,12 02, 2 0.0052 时,,包装精度才不符合要求,,故本问题是右边检验。,H0:2 = 0.0052,,H1:2 0.0052,, = 0.25,不能拒绝 H0,,包装机精度符合要求。,(2)对于机床精度的检验问题,,犯第一类错误,(精度符合要求但判定不符合要求),的损失很小;,而犯第二类错误,(精度已显著下降但判定仍符合,要求),的损失很大。,因此应控制犯第二类错误的概率,,取较大的 可使较小。,