1、数据分析(方法与案例),2018-6-22,正如一个法庭宣告某一判决为“无罪(not guilty)”而不为“清白(innocent)”,统计检验的结论也应为“不拒绝”而不为“接受”。 Jan Kmenta,统计名言,第 6 章 假设检验,6.1 假设检验的基本原理 6.2 一个总体参数的检验6.3 两个总体参数的检验,hypothesis test,2018-6-22,学习目标,假设检验的基本思想和原理 假设检验的步骤一个总体参数的检验两个总体参数的检验P值的计算与应用用Excel进行检验,2018-6-22,正常人的平均体温是37oC吗?,当问起健康的成年人体温是多少时,多数人的回答是37
2、oC,这似乎已经成了一种共识。下面是一个研究人员测量的50个健康成年人的体温数据,2018-6-22,正常人的平均体温是37oC吗?,根据样本数据计算的平均值是36.8oC ,标准差为0.36oC 根据参数估计方法得到的健康成年人平均体温的95%的置信区间为(36.7,36.9)。研究人员发现这个区间内并没有包括37oC 因此提出“不应该再把37oC作为正常人体温的一个有任何特定意义的概念”我们应该放弃“正常人的平均体温是37oC”这个共识吗?本章的内容就将提供一套标准统计程序来检验这样的观点,6.1 假设检验的基本原理 6.1.1 怎样提出假设? 6.1.2 怎样做出决策? 6.1.3 怎样
3、表述决策结果?,第 6 章 假设检验,6.1.1 怎样提出假设?,6.1 假设检验的基本原理,2018-6-22,什么是假设?(hypothesis),在参数检验中,对总体参数的具体数值所作的陈述就一个总体而言,总体参数包括总体均值、比例、方差等分析之前必需陈述,我认为这种新药的疗效比原有的药物更有效!,2018-6-22,什么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理小概率是在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事
4、件一旦发生,我们就有理由拒绝原假设,2018-6-22,原假设(null hypothesis),又称“0假设”,研究者想收集证据予以反对的假设,用H0表示所表达的含义总是指参数没有变化或变量之间没有关系 最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 总是有符号 , 或H0 : = 某一数值H0 : 某一数值H0 : 某一数值例如, H0 : 10cm,null,2018-6-22,也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假
5、设,以支持备择假设 总是有符号 , 或 H1 : 某一数值H1 : 某一数值H1 : ”或“”,称为右侧检验,双侧检验与单侧检验,2018-6-22,双侧检验与单侧检验 (假设的形式),以总体均值的检验为例,2018-6-22,【例6-1】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设,提出假设(例题分析),解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择
6、假设为 H0 : 10cm H1 : 10cm,2018-6-22,【例6-2】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设(例题分析),解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为 H0 : 500 H1 : 500,2018-6-22,【例6-3】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假
7、设与备择假设,提出假设(例题分析),解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过30%”。建立的原假设和备择假设为 H0 : 30% H1 : 30%,2018-6-22,原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设(结论与建议),6.1.2 怎样做出决策?,6.1 假设检验的基本原理,2018-6-22,两类错误与显著性水平,研究者总是希望能做出正确的决策,但由于决策是
8、建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误 第类错误(错误)原假设为正确时拒绝原假设第类错误的概率记为,被称为显著性水平2.第类错误(错误)原假设为错误时未拒绝原假设第类错误的概率记为(Beta),2018-6-22,两类错误的控制,一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概
9、率定得高些一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率,2018-6-22,显著性水平 (significant level),事先确定的用于拒绝原假设H0时所必须的证据能够容忍的犯第类错误的最大概率(上限值)2.原假设为真时,拒绝原假设的概率 抽样分布的拒绝域3.表示为 (alpha) 常用的 值有0.01, 0.05, 0.104.由研究者事先确定,2018-6-22,依据什么做出决策?,若假设为H0:=500,H1: 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H
10、0,2018-6-22,用P 值决策 (P-value),如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设 被称为观察到的(或实测的)显著性水平决策规则:若p值, 拒绝 H0,2018-6-22,双侧检验的P 值, / 2, / 2,Z,拒绝H0,拒绝H0,0,临界值,计算出的样本统计量,计算出的样本统计量,临界值,1/2 P 值,1/2 P 值,2018-6-22,左侧检验的P 值,Z,拒绝H0,0,临界值,计算出的样本统计量,P 值,2018-6-22,
11、右侧检验的P 值,Z,拒绝H0,0,计算出的样本统计量,临界值,P 值,2018-6-22,P值是关于数据的概率,P值原假设的对或错的概率无关它反映的是在某个总体的许多样本中某一类数据出现的经常程度,它是当原假设正确时,得到目前这个样本数据的概率比如,要检验全校学生的平均生活费支出是否等于500元,检验的假设为H0:=500;H0:500 。假定抽出一个样本算出的样本均值600元,得到的值为P=0.02,这个0.02是指如果平均生活费支出真的是500元的话,那么,从该总体中抽出一个均值为600的样本的概率仅为0.02。如果你认为这个概率太小了,就可以拒绝原假设,因为如果原假设正确的话,几乎不可
12、能抓到这样的一个样本,既然抓到了,就表明这样的样本不在少数,所以原假设是不对的值越小,你拒绝原假设的理由就越充分,2018-6-22, 要证明原假设不正确,P值要多小,才能令人信服呢?原假设的可信度又多高?如果H0所代表的假设是人们多年来一直相信的,就需要很强的证据(小的P值)才能说服他们拒绝的结论是什么?如果拒绝H0而肯定H1 ,你就需要有很强的证据显示要支持H1。比如,H1代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量(因为拒绝H0要花很高的成本),多大的P 值合适?,2018-6-22,有了P值,我们并不需要用5%或1%这类传统的显著性水平。P值提
13、供了更多的信息,它让我们可以选择任意水平来评估结果是否具有统计上的显著性,从而可根据我们的需要来决定是否要拒绝原假设只要你认为这么大的P值就算是显著了,你就可以在这样的P值水平上拒绝原假设传统的显著性水平,如1%、5%、10%等等,已经被人们普遍接受为“拒绝原假设足够证据”的标准,我们大概可以说:10%代表有“一些证据”不利于原假设;5%代表有“适度证据”不利于原假设;1%代表有“很强证据”不利于原假设,固定显著性水平是否有意义,2018-6-22,用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,
14、根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少,P 值决策与统计量的比较,2018-6-22,拒绝H0,P 值决策与统计量的比较,拒绝H0的两个统计量的不同显著性,Z,拒绝H0,0,统计量1,P1 值,统计量2,P2 值,拒绝H0,临界值,6.1.3 怎样表述决策结果?,6.1 假设检验的基本原理,2018-6-22,假设检验不能证明原假设正确,
15、假设检验的目的主要是收集证据拒绝原假设,而支持你所倾向的备择假设假设检验只提供不利于原假设的证据。因此,当拒绝原假设时,表明样本提供的证据证明它是错误的,当没有拒绝原假设时,我们也没法证明它是正确的,因为假设检验的程序没有提供它正确的证据这与法庭上对被告的定罪类似:先假定被告是无罪的,直到你有足够的证据证明他是有罪的,否则法庭就不能认定被告有罪。当证据不足时,法庭的裁决是“被告无罪”,但这里也没有证明被告就是清白的,2018-6-22,假设检验不能证明原假设正确,假设检验得出的结论都是根据原假设进行阐述的我们要么拒绝原假设,要么不拒绝原假设当不能拒绝原假设时,我们也从来不说“接受原假设”,因为
16、没有证明原假设是真的采用“接受”原假设的说法,则意味着你证明了原假设是正确的没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的,它仅仅意为着目前还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设比如,在例6.2中,如果拒绝原假设,表明样本提供的证据证明该品牌洗涤剂的净含量与说明书所标识的不相符。如果不拒绝原假设,只能说这个样本提供的证据还不足证明净含量不是500克或500克以上,并不等于证明了净含量就超过了500克“不拒绝”的表述方式实际上意味着没有得出明确的结论,2018-6-22,假设检验不能证明原假设正确,“接受”的说法有时会产生误导这种说法似乎暗示着
17、原假设已经被证明是正确的了实事上,H0的真实值我们永远也无法知道,不知道真实值是什么,又怎么能证明它是什么?H0只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确采用“不拒绝”的表述方法更合理一些,因为这种表述意味着样本提供的证据不够强大,因而没有足够的理由拒绝,这不等于已经证明原假设正确,2018-6-22,假设检验不能证明原假设正确,【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意为着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5,同
18、样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?,2018-6-22,假设检验不能证明原假设正确,假设检验中通常是先确定显著性水平,这就等于控制了第类错误的概率,但犯第类错误的概率却是不确定的在拒绝H0时,犯第类错误的概率不超过给定的显著性水平,当样本结果显示没有充分理由拒绝原假设时,也难以确切知道第类错误发生的概率采用“不拒绝”而不采用“接受”的表述方式,在多数场合下便避免了错误发生的风险因为“接受”所得结论可靠性将由第类错误的概率来测量,而的控制又相对复杂,有时甚至根本无法知道的值,除非你能确切给出 ,否则就不宜表
19、述成“接受”原假设,2018-6-22,假设检验不能证明原假设正确, 在实际检验中,针对一个具体的问题,将检验结果表述为“不拒绝”原假设,这似乎让人感到无所是从比如,你想购买一批产品,检验的结果没有拒绝原假设,即达到合同规定的标准要求,你是否购买这批产品呢?这时,你可以对检验的结果采取某种默认态度,退一步说,你可以将检验结果表述为“可以接受”原假设,你但这并不等于说你“确实接受”它,2018-6-22,统计上显著不一定有实际意义,当拒绝原假设时,我们称样本结果是统计上显著的(statistically Significant)当不拒绝原假设时,我们称样本结果是统计上不显著的在“显著”和“不显著
20、”之间没有清除的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著,2018-6-22,“显著的”(Significant)一词的意义在这里并不是“重要的”,而是指“非偶然的”一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的如果得到这样的样本概率(P)很小,则拒绝原假设在这么小的概率下竟然得到了这样的一个样本,表明这样的样本经常出现,所以,样本结果是显著的,统计上显著不一定有实际意义,2018-6-22,统计上显著不一定有实际意义,在进行决策时,我们只能说P值越小,拒绝原假设的证据就越强,检验的结果也就越显著但P值
21、很小而拒绝原假设时,并不一定意味着检验的结果就有实际意义因为假设检验中所说的“显著”仅仅是“统计意义上的显著”一个在统计上显著的结论在实际中却不见得就很重要,也不意味着就有实际意义因为值与样本的大小密切相关,样本量越大,检验统计量的P值也就越大,P值就越小,就越有可能拒绝原假设,2018-6-22,统计上显著不一定有实际意义,如果你主观上要想拒绝原假设那就一定能拒绝它这类似于我们通常所说的“欲加之罪,何患无词”只要你无限制扩大样本量,几乎总能拒绝原假设当样本量很大时,解释假设检验的结果需要小心在大样本情况下,总能把与假设值的任何细微差别都能查出来,即使这种差别几乎没有任何实际意义在实际检验中,
22、不要刻意追求“统计上的”显著性,也不要把统计上的显著性与实际意义上的显著性混同起来一个在统计上显著的结论在实际中却不见得很重要,也不意为着就有实际意义,6.2 一个总体参数的检验 6.2.1 总体均值的检验 6.2.2 总体比例的检验 6.2.3 总体方差的检验,第 6 章 假设检验,6.2.1 总体均值的检验 (大样本),6.2 一个总体参数的检验,2018-6-22,总体均值的检验 (大样本),1.假定条件大样本(n30)使用z检验统计量 2 已知: 2 未知:,2018-6-22,总体均值的检验( 2 已知)(例题分析大样本),【例6-4】一种罐装饮料采用自动生产线生产,每罐的容量是25
23、5ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,2018-6-22,总体均值的检验( 2 已知)(例题分析大样本),H0 : = 255H1 : 255 = 0.05n = 40临界值(c):,检验统计量:,决策:,结论:,用Excel中的【NORMSDIST】函数得到的双尾检验P=0.312945不拒绝H0,没有证据表明该天生产的饮料不符合标准要求,2018-6-22,总体均值的检验(z检验) (P 值的计算与应用),第1步:
24、进入Excel表格界面,直接点击【fx】第2步:在函数分类中点击【统计】,并在函数名 菜单下选择【NORMSDIST】,然后【确定】第3步:将 z 的绝对值1.01录入,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H0,2018-6-22,总体均值的检验( 2 未知) (例题分析大样本),【例6-5】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,
25、检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01),左侧检验,2018-6-22,总体均值的检验(例题分析大样本),H0 : 1.35H1 : 1.35 = 0.01n = 50临界值(c):,检验统计量:,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,2018-6-22,总体均值的检验 (P 值的计算与应用大样本),第1步:进入Excel表格界面,直接点击【fx】第2步:在函数分类中点击【统计】,并在函数名的菜单下选 择【ZTEST】,然后【确定】第3步:在所出现的对话框【Array】框中,输入原始数据所 在区域 ;在【X】后输入
26、参数的某一假定值(这里为 1.35);在【Sigma】后输入已知的总体标准差(若总 体标准差未知则可忽略不填,系统将自动使用样本 标准差代替) 第4步:用1减去得到的函数值0.995421023 即为P值 P值=1-0.995421023=0.004579 P值5200 = 0.05n = 36临界值(c):,检验统计量:,拒绝H0 (P = 0.000088 = 0.05),改良后的新品种产量有显著提高,决策:,结论:,2018-6-22,总体均值的检验(z检验) (P 值的图示),2018-6-22,总体均值的检验 (小样本),1.假定条件总体服从正态分布小样本(n =0.05,故不拒绝H
27、0,2018-6-22,总体均值的检验 (用SPSS进行检验小样本t检验),第1步:选择【Analyze】下拉菜单,并选择【Compare MeansOne- Samples T Test】选项,进入主对话框第2步:将检验变量(零件长度)选入【Test Variable(s)】;在【Test Value】框内输入假设值(本题为12)第3步:点击【Options】,选择所需的置信水平(隐含值为95%)。点击【Continue】回到主对话框。点击【OK】,用SPSS进行检验,SPSS,2018-6-22,总体均值的检验 (用SPSS进行检验小样本t检验),不拒绝H0。没有证据表明该供货商提供的零件
28、不符合要求,2018-6-22,一个总体均值的检验(作出判断),样本量n,6.2.2 总体比例的检验,6.2 一个总体参数的检验,2018-6-22,总体比例检验,假定条件总体服从二项分布可用正态分布来近似(大样本)检验的 z 统计量, 0为假设的总体比例,2018-6-22,总体比例的检验 (例题分析),【例6-8】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 =0.05和=0.01 ,检验该杂志读者群中女性的比例是否为80%?它们的P值各是多少?,双侧检验
29、,2018-6-22,总体比例的检验 (例题分析),H0 : = 80%H1 : 80% = 0.05n = 200临界值(c):,检验统计量:,拒绝H0 (P = 0.013328 = 0.01),没有证据表明“该杂志声称读者群中有80%为女性”的看法不正确,决策:,结论:,6.2.3 总体方差的检验,6.2 一个总体参数的检验,2018-6-22,总体方差的检验 ( 2检验),检验一个总体的方差或标准差假设总体近似服从正态分布使用 2分布检验统计量,假设的总体方差,2018-6-22,总体方差的检验(例题分析),【例6-9】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由
30、于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.05的显著性水平检验装填量的标准差是否符合要求?,2018-6-22,总体方差的检验(例题分析),H0 : 2 42H1 : 2 42 = 0.10df = 10 - 1 = 9临界值(s):,统计量:,不拒绝H0 (p=0.52185),没有证据表明装填量的标准差不符合要求,
31、决策:,结论:,6.3 两个总体参数的检验 6.3.1 两个总体均值之差的检验 6.3.2 两个总体比例之差的检验 6.3.3 两个总体方差比的检验,第 6 章 假设检验,6.3.1 两个总体均值之差的检验,6.3 两个总体参数的检验,2018-6-22,两个总体均值之差的检验 (独立大样本),1.假定条件两个样本是独立的随机样本正态总体或非正态总体大样本(n130和 n230)检验统计量 12 , 22 已知: 12 , 22 未知:,2018-6-22,两个总体均值之差的检验 (例题分析独立大样本),【例6-10】某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职
32、员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?,2018-6-22,两个总体均值之差的检验 (例题分析独立大样本),H0 :1- 2 = 0H1 :1- 2 0 = 0.05n1 = 44,n2 = 32临界值(c):,检验统计量:,决策:,结论:,拒绝H0,该公司男女职员的平均小时工资之间存在显著差异,2018-6-22,两个总体均值之差的检验 (独立小样本: 12, 22 已知),假定条件两个独立的小样本两个总体都是正态分布 12, 22已知检验统计量,2018-6-22,两个总体均值之差的
33、检验 (独立小样本:12,22 未知但12=22),假定条件两个独立的小样本两个总体都是正态分布12、22未知但相等,即12=22检验统计量,其中:,自由度:,2018-6-22,两个总体均值之差的检验 (独立小样本:12,22 未知且不等1222),假定条件两个总体都是正态分布12,22未知且不相等,即1222样本量不相等,即n1n2检验统计量,自由度:,2018-6-22,两个总体均值之差的检验 (例题分析独立小样本,12=22),【例6-11】甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有12=22 。为比较两台机床的加工精度有无
34、显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据 。在=0.05的显著性水平下,样本数据是否提供证据支持 “两台机床加工的零件直径不一致”的看法?,2018-6-22,两个总体均值之差的检验 (例题分析12=22),H0 :1- 2 = 0H1 :1- 2 0 = 0.05n1 = 8,n2 = 7临界值(c):,检验统计量:,决策:,结论:,不拒绝H0,没有证据表明两台机床加工的零件直径不一致,2018-6-22,两个总体均值之差的检验 (用Excel进行检验),第1步:将原始数据输入到Excel工作表格中 第2步:选择【工具】下拉菜单并选择【数据分析
35、】选项 第3步:在【数据分析】对话框中选择 【t-检验:双样本等方 差假设】第4步:当对话框出现后 在【变量1的区域】方框中输入第1个样本的数据区域 在【变量2的区域】方框中输入第2个样本的数据区域 在【假设平均差】方框中输入假定的总体均值之差 在【】方框中输入给定的显著性水平(本例为0.05) 在【输出选项】选择计算结果的输出位置,然后【确 定】,进行检验,Excel,2018-6-22,两个总体均值之差的检验 (用Excel进行检验),Excel的输出结果,2018-6-22,两个总体均值之差的检验 (例题分析独立小样本,1222),【例6-12】甲、乙两台机床同时加工某种同类型的零件,已
36、知两台机床加工的零件直径(单位:cm)分别服从正态分布,并且有1222 。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的8个零件和乙机床加工的7个零件,通过测量得到如下数据 。在=0.05的显著性水平下,样本数据是否提供证据支持 “两台机床加工的零件直径不一致”的看法?,2018-6-22,两个总体均值之差的检验 (用Excel进行检验),第1步:将原始数据输入到Excel工作表格中 第2步:选择“工具”下拉菜单并选择【数据分析】选项 第3步:在【数据分析】对话框中选择 【t-检验:双样本异方 差假设】第4步:当对话框出现后 在【变量1的区域】方框中输入第1个样本的数据区域
37、在【变量2的区域】方框中输入第2个样本的数据区域 在【假设平均差】方框中输入假定的总体均值之差 在【】方框中输入给定的显著性水平(本例为0.05) 在【输出选项】选择计算结果的输出位置,然后【确 定】,进行检验,Excel,2018-6-22,两个总体均值之差的检验 (用Excel进行检验),Excel的输出结果,2018-6-22,用SPSS进行检验(独立小样本,12=22 ;1222), 在用SPSS中进行检验时,需要把两个样本的观测值作为一个变量输入(本例为“零件尺寸”),然后设计另一个变量用于标记每个观测值所属的样本(本例为“机床”,1表示机床1,2表示机床2)第1步:选择【Analy
38、ze】【Compare MeansIndependent-Samples T Test 】进入主对话框第2步:检验变量(零件尺寸)选入【Test Variable(s)】, 将分组变量(机床)选入【Grouping Variable(s)】,并选择【Define Groups】,在【Group1后输入1】,在【Group2后输入2】,点击【Continue】回到主对话框。点击【OK】,进行检验,SPSS,2018-6-22,两个总体均值之差的检验 (用SPSS进行检验),ESPSS的输出结果,Levenes Test for Equality of Variances:检验两个总体方差相等的假
39、设,2018-6-22,两个总体均值之差的检验(配对样本),假定条件两个总体配对差值构成的总体服从正态分布配对差是由差值总体中随机抽取的 数据配对或匹配(重复测量 (前/后)检验统计量,样本差值均值,样本差值标准差,2018-6-22,匹配样本 (数据形式),2018-6-22,两个总体均值之差的检验 (例题分析配对样本),【例6-13】某饮料公司开发研制出一新产品,为比较消费者对新老产品口感的满意程度,该公司随机抽选一组消费者(8人),每个消费者先品尝一种饮料,然后再品尝另一种饮料,两种饮料的品尝顺序是随机的,而后每个消费者要对两种饮料分别进行评分(0分10分),评分结果如下表。取显著性水平 =0.05,该公司是否有证据认为消费者对两种饮料的评分存在显著差异?,2018-6-22,两个总体均值之差的检验 (用Excel进行检验配对样本),第1步:选择“工具”下拉菜单,并选择【数据分析】选项第3步:在分析工具中选择【t 检验:平均值成对二样本分析】第4步:当出现对话框后 在【变量1的区域】方框内键入变量1的数据区域 在【变量2的区域】方框内键入变量2的数据区域 在【假设平均差】方框内键入假设的差值(这里为0) 在【】框内键入给定的显著性水平,然后【确定】,进行检验,Excel,2018-6-22,