1、第7章 假设检验,正如一个法庭宣告某一判决 为“无罪(not guilty)”而不为“清白 (innocent)”,统计检验的结论也应 为“不拒绝”而不为“接受”。Jan Kmenta,统计名言,案例,辛普森杀妻案,辛普森案 (英语:O. J. Simpson murder case,又称加利福尼亚人民诉辛普森案,英语:People v.Simpson)是美国加利福尼亚州最高法院对前美式橄榄球明星、演员OJ辛普森进行的刑事诉讼,在该案中,辛普森被指控于1994年犯下两宗谋杀罪,受害人为其前妻妮克尔布朗辛普森及其好友罗纳德高曼。该案被称为是美国历史上最受公众关注的刑事审判案件。,案发时间,199
2、4年6月12日深夜 案发后凌晨,辛普森门外有血迹 现场滴落的血痕中有辛普森的血,辛普森家中血手套和辛普森的脏衣服都有被害人的血,法庭战争 检方的“铁证如山”与“梦幻律师团”,在检方看来,本案可谓是“铁证如山”,本案中无论是证据数量,还是证据的可信程度,在检方看来,都达到了很高的标准。,控辩双方几个关键的地方,控方:检方在审判的最初几周出示证据,证明辛普森曾有对妮可尔的家庭暴力史。 辩方:时遭受丈夫家庭暴力中,遭受丈夫伤害的概率为1%,控方:鞋码与辛普森的相似,辛普森手上有划痕 辩方:世界上与辛普森鞋码一样的人数不胜数,在左手有伤痕的人也不尽其数,所以这样的证据对案件的判断是没有任何价值的。,控
3、方:在犯罪现场发现的血液,DNA鉴定发现与辛普森是完全一致的,而DNA鉴定两个人一致的可能性只有万分之。 辩方:在洛杉矶300万人口中,就有300个人DAN一致,辛普森是洛杉矶人口的1人,所以,辛普森是杀人凶手的概率只有0.03%。如果认为新浦森有罪的话,那么误判的概率将高达99.97%.最终无罪释放。,控方:平时遭受丈夫家庭暴力中,非正常死亡的,其凶手为丈夫的概率为80%。 控方:可能会有很多与辛普森鞋码一样的人,但也会有很多左手有划痕的人,但辛普森是一个嫌疑犯, 不能把他放在所有的人当中去进行归类,于是只能放在嫌疑犯中,在嫌疑犯中,跟辛普森鞋码吻合的人的概率非常之小,法庭宣判过程,法官假定
4、辛普森无罪控方搜集证据证明他有罪,只有当证据充足的时候才能宣判有罪,否则要接受法官的假定。,辛浦森(Simpsons Paradox)悖论,160,166,36,290,326,总的看, 白人有19/160=12% 的被告被判处死刑, 与之对应, 黑人只有17/166=10% 的被告被判死刑, 白人死刑率要高一些. 但如果考虑受害者的种族, 结论就相反了. 当受害者是白人时, 有11/63=17.5% 的黑人被告被判死刑, 而只有 19/151=12.6% 的白人被告被判死刑. 当受害者是黑人时, 白人被告没一个人( 0%)被判死刑, 而黑人被告确有 6/103=5.8% 的被判死刑.,控方:
5、DNA鉴定 辩方:把辛普森至于300万人群当中,但新浦是是嫌疑犯,所以应把他放在嫌疑犯这个人群中,那么样本与他一致的也就他一个人,综上,只有辛普森一个人符合三个条件,第 7 章 假设检验,7.1 假设检验的基本问题 7.2 一个总体参数的检验,学习目标,1.理解假设检验的基本思想和基本步骤 ;2.理解假设检验的两类错误及其关系;3.熟练掌握一个总体平均数、总体成数各种假设检验方法;4.利用P - 值进行假设检验。 用Excel进行检验,假设检验知识结构,7.1 假设检验的基本原理7.1.1 怎样提出假设? 7.1.2 怎样做出决策?7.1.3 怎样表述决策结果?,第 7 章 假设检验,7.1.
6、1 怎样提出假设?,7.1 假设检验的基本原理,1.什么是假设?,假设:定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想。是对总体参数的一种假设。 常见的是对总体均值或比例和方差的检验; 在分析之前,被检验的参数将被假定取一确定值。,我认为到KFC消费的人平均花费2.5美元!,2、市场调研中常见的假设检验问题,一项跟踪调查的结果表明,顾客对产品的了解程度比6个月前所做的类似调查中的显示要低。结果是否明显降低?是否低到需要改变广告策略的程度?一位产品经理认为其产品购买者的平均年龄为35岁。为检验其假设,他进行了一项调查,调查表明购买者平均年龄为38.5岁。调查结果与其观点的差别
7、是够足以说明此经理里的观点是不正确的?,3、问题在哪里?,某广告商宣称其代理的A产品的合格率达到99%,质检人员为了验证,随机抽取了一件产品,发现是一件次品。质检人员会是什么反应呢?,什么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理 小概率是在一次试验中,一个几乎不可能发生的事件发生的概率 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,原假设 (null hypothesis),又称“0假设”,研究者想收集证据予以反对的假设,用H0
8、表示 所表达的含义总是指参数没有变化或变量之间没有关系 最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 总是有符号 , 或 H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值 例如, H0 : 10cm,null,也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示 所表达的含义是总体参数发生了变化或变量之间有某种关系 备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 总是有符号 , 或 H1 : 某一数值 H1 : 某一数值 H1 : 某一数值,备择假设 (alternative hypothesis)
9、,【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设,提出假设 (例题分析),解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0 : 10cm H1 : 10cm,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备
10、择假设,提出假设 (例题分析),解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为H0 : 500 H1 : 500,【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为H0 : 30% H1 : 30%,提出假设 总结,H0: 通常是将研究者不愿相信的、不认可的、想拒绝的结论 H0 : = 某一数值 H0 :
11、某一数值 H0 : 某一数值 H1:与原假设是对立的,通常是研究者想要支持的、愿意相信的结果 H1 : 某一数值 H1 : 某一数值 H1 : 某一数值先确定备择假设,再确定原假设 原假设和备择假设必有一个成立,而且只有一个成立等号只能出现在原假设里 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验 (假设的形式),以总体均值的检验为例,7.1.2 怎样做出决策?,
12、7.1 假设检验的基本原理,假设检验的步骤,1.提出原假设H0和备择假设H1 2.构造适当的检验统计量 3.给定显著性水平 0.01, 0.05, 0.10 4.计算检验统计量的值 5.做出判断,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分布,H0,两类错误与显著性水平(了解),研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误 原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误 第类错误(错误
13、) 原假设为正确时拒绝原假设 第类错误的概率记为,被称为显著性水平 2. 第类错误(错误) 原假设为错误时未拒绝原假设 第类错误的概率记为(Beta),显著性水平 (significant level),事先确定的用于拒绝原假设H0时所必须的证据 能够容忍的犯第类错误的最大概率(上限值) 2. 原假设为真时,拒绝原假设的概率抽样分布的拒绝域 3. 表示为 (alpha)常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定, 错误和 错误的关系,依据什么做出决策?,若假设为H0=500, H1500。样本均值为495,拒绝H0吗?样本均值为502,拒绝H0吗? 做出拒绝或不拒绝原
14、假设的依据是什么? 传统上,做出决策所依据的是样本统计量,现代检验中人们直接使用由统计量算出的犯第类错误的概率,即所谓的P值,根据样本观测结果计算出对原假设和备择假设做出决策某个样本统计量 对样本估计量的标准化结果 原假设H0为真 点估计量的抽样分布,检验统计量 (test statistic),标准化的检验统计量,用统计量决策 (双侧检验 )H1 : m m0,I统计量I 临界值,拒绝H0,用统计量决策 (左侧检验 )H1 : m m0,统计量 -临界值,拒绝H0,抽样分布,H0,临界值,a,拒绝H0,1 - ,置信水平,Region of Rejection,Region of Nonre
15、jection,用统计量决策 (右侧检验 )H1 : m m0,统计量 临界值,拒绝H0,抽样分布,H0,临界值,拒绝H0,1 - ,置信水平,Region of Nonrejection,Region of Rejection,a,统计量决策规则,给定显著性水平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 作出决策 双侧检验:H1 : m m0,I统计量I 临界值,拒绝H0, 31.96,拒绝 左侧检验:H1 : m m0,统计量 临界值,拒绝H0, 31.96,拒绝当单侧检验时,只要统计量与z或 t大小比较方向与备择假设符合一致时,拒绝 不过,总
16、而言之,无论是哪一种检验形式,只要I统计量I 临界值,拒绝H0,用P 值决策 软件操作中的sig.即为P值 (P-value),如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,也就是我们拒绝原假设面临的风险 P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设 被称为观察到的(或实测的)显著性水平 决策规则:若p值, 拒绝 H0,即是说,拒绝原假设犯弃真错误的风险比事先假定的风险还小,所以拒绝原假设也无妨。,双侧检验的P 值,左侧检验的P 值,Z,拒绝H0,0,临界值,计算出的样本统计量,1/2 P 值,右
17、侧检验的P 值,Z,拒绝H0,0,计算出的样本统计量,临界值,1/2 P 值,用P值进行检验比根据统计量检验提供更多的信息 统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少,P 值决策与统计量的比较,拒绝H0,P 值决策与统计量的比较,拒绝H0的两
18、个统计量的不同显著性,Z,拒绝H0,0,统计量1,P1 值,统计量2,P2 值,拒绝H0,临界值,7.1.3 怎样表述决策结果?,7.1 假设检验的基本原理,假设检验不能证明原假设正确,假设检验的目的主要是收集证据拒绝原假设,而支持你所倾向的备择假设 假设检验只提供不利于原假设的证据。因此,当拒绝原假设时,表明样本提供的证据证明它是错误的,当没有拒绝原假设时,我们也没法证明它是正确的,因为假设检验的程序没有提供它正确的证据 这与法庭上对被告的定罪类似:先假定被告是无罪的,直到你有足够的证据证明他是有罪的,否则法庭就不能认定被告有罪。当证据不足时,法庭的裁决是“被告无罪”,但这里也没有证明被告就
19、是清白的,假设检验不能证明原假设正确,假设检验得出的结论都是根据原假设进行阐述的 我们要么拒绝原假设,要么不拒绝原假设 当不能拒绝原假设时,我们也从来不说“接受原假设”,因为没有证明原假设是真的 采用“接受”原假设的说法,则意味着你证明了原假设是正确的没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的,它仅仅意为着目前还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设 比如,在例6.2中,如果拒绝原假设,表明样本提供的证据证明该品牌洗涤剂的净含量与说明书所标识的不相符。如果不拒绝原假设,只能说这个样本提供的证据还不足证明净含量不是500克或500克以上,并不
20、等于证明了净含量就超过了500克 “不拒绝”的表述方式实际上意味着没有得出明确的结论,假设检验不能证明原假设正确,“接受”的说法有时会产生误导 这种说法似乎暗示着原假设已经被证明是正确的了 实事上,H0的真实值我们永远也无法知道,不知道真实值是什么,又怎么能证明它是什么? H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确 采用“不拒绝”的表述方法更合理一些,因为这种表述意味着样本提供的证据不够强大,因而没有足够的理由拒绝,这不等于已经证明原假设正确,假设检验不能证明原假设正确,【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的
21、水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意为着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?其人弗能应也,假设检验不能证明原假设正确,假设检验中通常是先确定显著性水平,这就等于控制了第类错误的概率,但犯第类错误的概率却是不确定的 在拒绝H0时,犯第类错误的概率不超过给定的显著性水平,当样本结果显示没有充分理由拒绝原假设时,也难以确切知道第类错误发生的概率 采用“不拒绝”而不采用“接受”的表述方式,在多数场合下便避免了
22、错误发生的风险 因为“接受”所得结论可靠性将由第类错误的概率来测量,而的控制又相对复杂,有时甚至根本无法知道的值,除非你能确切给出 ,否则就不宜表述成“接受”原假设,假设检验不能证明原假设正确, 在实际检验中,针对一个具体的问题,将检验结果表述为“不拒绝”原假设,这似乎让人感到无所是从比如,你想购买一批产品,检验的结果没有拒绝原假设,即达到合同规定的标准要求,你是否购买这批产品呢?这时,你可以对检验的结果采取某种默认态度,退一步说,你可以将检验结果表述为“可以接受”原假设,你但这并不等于说你“确实接受”它,统计上显著不一定有实际意义,当拒绝原假设时,我们称样本结果是统计上显著的(statist
23、ically Significant) 当不拒绝原假设时,我们称样本结果是统计上不显著的在“显著”和“不显著”之间没有清除的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著,“显著的”(Significant)一词的意义在这里并不是“重要的”,而是指“非偶然的” 一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的 如果得到这样的样本概率(P)很小,则拒绝原假设 在这么小的概率下竟然得到了这样的一个样本,表明这样的样本经常出现,所以,样本结果是显著的,统计上显著不一定有实际意义,统计上显著不一定有实际意义,在进行决策
24、时,我们只能说P值越小,拒绝原假设的证据就越强,检验的结果也就越显著 但P值很小而拒绝原假设时,并不一定意味着检验的结果就有实际意义 因为假设检验中所说的“显著”仅仅是“统计意义上的显著” 一个在统计上显著的结论在实际中却不见得就很重要,也不意味着就有实际意义 因为值与样本的大小密切相关,样本量越大,检验统计量的P值也就越大,P值就越小,就越有可能拒绝原假设,统计上显著不一定有实际意义,如果你主观上要想拒绝原假设那就一定能拒绝它 这类似于我们通常所说的“欲加之罪,何患无词” 只要你无限制扩大样本量,几乎总能拒绝原假设 当样本量很大时,解释假设检验的结果需要小心 在大样本情况下,总能把与假设值的
25、任何细微差别都能查出来,即使这种差别几乎没有任何实际意义 在实际检验中,不要刻意追求“统计上的”显著性,也不要把统计上的显著性与实际意义上的显著性混同起来 一个在统计上显著的结论在实际中却不见得很重要,也不意为着就有实际意义,7.2.1 总体均值的检验 (大样本),7.2 一个总体参数的检验,总体均值的检验 (大样本),1. 假定条件 大样本(n30) 使用z检验统计量 2 已知: 2 未知:,总体均值的检验( 2 已知),P164第1题相似 (例题分析大样本),【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中
26、随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,假设检验的步骤,1.提出原假设H0和备择假设H1 2.给定显著性水平 0.01, 0.05, 0.10,查表求临界值 3.构造适当的检验统计量 4.计算检验统计量的值并于临界值进行比较 5.做出判断|统计两|临界值,拒绝原假设,说明在统计上是显著的,总体均值的检验( 2 已知) (例题分析大样本),H0 : = 255 H1 : 255 = 0.05 n = 40 临界值(c):,检验统计量:,决策:,结论:不拒绝原假设,用Excel中的【NORMSDIST
27、】函数得到的双尾检验P=0.312945不拒绝H0,没有证据表明该天生产的饮料不符合标准要求,总体均值的检验(z检验) (P 值的计算与应用),第1步:进入Excel表格界面,直接点击【fx】 第2步:在函数分类中点击【统计】,并在函数名 菜单下选择【NORMSDIST】,然后【确定】 第3步:将 z 的绝对值1.01录入,得到的函数值为0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H0,总体均值的检验( 2 未知) (例题分析大样本),【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步
28、降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01) 样本均值为1.3152,左侧检验,总体均值的检验 (例题分析大样本),H0 : 1.35 H1 : 1.35 = 0.01 n = 50 临界值(c):,检验统计量:,-2.6061-1.96,于是 拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,总体均值的检验 (P 值的计算与应用大样本),第1步:进入Excel表格界面,直接点击【f(x)】 第2步:在函
29、数分类中点击【统计】,并在函数名的菜单下选择【ZTEST】,然后【确定】 第3步:在所出现的对话框【Array】框中,输入原始数据所在区域 ;在【X】后输入参数的某一假定值(这里为1.35);在【Sigma】后输入已知的总体标准差(若总体标准差未知则可忽略不填,系统将自动使用样本 标准差代替) 第4步:用1减去得到的函数值0.995421023 即为P值P值=1-0.995421023=0.004579 P值=0.01,拒绝H0, 用Excel计算P值,总体均值的检验 (P 值的图示),计算出的样本统计量=2.6061,P=0.004579,Z,拒绝H0,0,临界值,P 值,总体均值的检验(
30、2 未知) (例题分析),【例】某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2 。试检验改良后的新品种产量是否有显著提高? (=0.05),右侧检验,总体均值的检验( 2 未知) (例题分析),H0 : 5200 H1 : 5200 = 0.05 n = 36 临界值(c):,检验统计量:,拒绝H0 因为3.751.65,或者(P = 0.000088 = 0.05),改良后的新品种产量有显著提高,决策:,结论:,
31、总体均值的检验(z检验) (P 值的图示),总体均值的检验 (小样本),1. 假定条件 总体服从正态分布 小样本(n 30) 检验统计量 2 已知: 2 未知:,例7-2某市历年来对7岁男孩的统计资料表明,他们的身高服从均值为1.32米、标准差为0.12米的正态分布。现从各个学校随机抽取25个7岁男学生,测得他们平均身高1.36米,若已知今年全市7岁男孩身高的标准差仍为0.12米,问与历年7岁男孩的身高相比是否有显著差异(取 0.05)。 解:从题意可知, 1.36米, 1. 32米, 0.12米。 (1)建立假设:H0: 1.32, H1: 1.32 (2)确定统计量:,方差已知,(3)Z的
32、分布:ZN(0,1) (4)对给定的 0.05确定临界值。因为是双侧备择假设所以查表时要注意。因概率表是按双侧排列的,所以应查1-0.050.95的值,查得临界值 1.96。 (5)检验准则。|Z|1.96,接受H0,反之,拒绝H0。 (6)决策:因Z1.671.96;落在了接受域,因此认为今年7岁男孩平均身高与历年7岁男孩平均身高无显著差异,即不能拒绝零假设。,总体均值的检验 (例题分析小样本),【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商
33、提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?,总体均值的检验 (例题分析小样本),H0 : =12 H1 : 12 = 0.05 df = 10 - 1= 9 临界值(c):,检验统计量:,不拒绝H0,没有证据表明该供货商提供的零件不符合要求,决策:,结论:,总体均值的检验 (P 值的计算与应用t 检验),第1步:进入Excel表格界面,直接点击【fx】 第2步:在函数分类中点击【统计】,并在函数名的菜单下选择【TDIST】,然后【确定】 第3步:在出现对话框的【X】栏中输入计算出的t的绝对值0.7035,在
34、【Deg-freedom】(自由度)栏中输入本例的自由度9,在【Tails】栏中输入2(表明是双侧检验,如果是单测检验则在该栏输入1) 第4步:P值=0.499537958 P值=0.05,故不拒绝H0,一个总体均值的检验 (作出判断),样本量n,7.2.1 总体比例的检验,7.3 一个总体参数的检验,总体比例检验,假定条件 总体服从二项分布 可用正态分布来近似(大样本) 检验的 z 统计量, 0为假设的总体比例,总体比例的检验 (例题分析),【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女
35、性经常阅读该杂志。分别取显著性水平 =0.05和=0.01 ,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?,总体比例的检验 (例题分析),H0 : = 80% H1 : 80% = 0.05 n = 200 临界值(c):,检验统计量:,拒绝H0 (P = 0.013328 = 0.05),该杂志的说法并不属实,决策:,结论:,总体比例的检验 (例题分析),H0 : = 80% H1 : 80% = 0.01 n = 200 临界值(c):,检验统计量:,不拒绝H0 (P = 0.013328 = 0.01),没有证据表明“该杂志声称读者群中有80%为女性”的看法不正确,决策
36、:,结论:,例7-7某企业的产品畅销国内市场。据以往调查,购买该产品的顾客有50是30岁以上的男子。该企业负责人关心这个比例是否发生了变化,而无论是增加还是减少。于是,该企业委托了一家咨询机构进行调查,这家咨询机构从众多的购买者中随机抽选了400名进行调查,结果有210名为30岁以上的男子。该厂负责人希望在显著性水平0.05下检验“50的顾客是30岁以上的男子”这个假设。 解:(1)建立假设 由题意可知,这是双侧检验,故建立假设 H0: 50 H1: 50,(2)计算统计量 由于样本容量 40030, 40050200, 200,皆大于5,所以可以使用正态分布进行检验。 (3)ZN(0,1)
37、(4)对应于0.05的显著性水平,双侧检验临界值为1.96。 (5)若Z值不大于1.96,则接受原假设,否则,拒绝之。 (6)本例中,Z=1,处于接受域,故接受“50的顾客是30岁以上的男子”这个假设。,7.4.1 总体方差的检验,7.4 一个总体参数的检验(选学),总体方差的检验 ( 2检验),检验一个总体的方差或标准差 假设总体近似服从正态分布 使用 2分布 检验统计量,假设的总体方差,自学,总体方差的检验 (例题分析),【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样
38、很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.05的显著性水平检验装填量的标准差是否符合要求?,总体方差的检验 (例题分析),H0 : 2 42 H1 : 2 42 = 0.10 df = 10 - 1 = 9 临界值(s):,统计量:,不拒绝H0 (p=0.52185),没有证据表明装填量的标准差不符合要求,决策:,结论:,Excel中的统计函数,ZTEST计算Z检验的P值 TDIST计算t分布的概率 TINV计算t
39、分布的临界值 TTEST计算t分布检验的P值 FDIST计算F分布的概率 FINV计算F分布的逆函数(临界值) FTEST计算F检验(两个总体方差比的检验)单尾概率,假设检验知识结构,本章小结,假设检验的基本原理 一个总体参数的检验 用Excel进行检验 利用P 值进行检验,1、假设检验是预先对总体参数的取值做出假定,然后用样本数据验 证,做出是接受还是拒绝原来假设的结论的一种方法。2、假设检验的基本概念有:小概率原理、原假设和备择假设、检验 统计量、接受域和拒绝域、显著性水平、双侧检验与单侧检验、取伪错 误与弃真错误等。,3、假设检验的一般步骤包括: 建立原假设和备择假设; 构造检验统计量; 给出显著性水平,确定检验统计量的临界值和拒绝域; 根据样本数据,计算检验统计量的数值;判断并做出决策。,4、总体均值的假设检验是应用最为广泛的假设检验之一,其检验的基本原理同样适用于其他类型的假设检验。由于已知条件不同,所构造的检验统计量也不同,因此必须搞清统计量的形式及其服从的分布。5、P 值检验是统计检验的另一种形式。它是通过直接计算检验统计量在样本数据下的概率来检验原假设是否成立。,结 束,THANKS,