1、第7章 假设检验,1,大学是为学生打造未来的人生框架,而不仅仅是职业框架。 大学要培养的,是一个能主宰你生命的心灵。,第7章 假设检验,2,大学是如何打造人生框架的呢?什么是大学生活的核心? 在我看来,最重要的就是disputation(论辩)。这种“论辩”,并不一定是公开的口头辩论,而更多的是在心灵中默然进行的是非辨析,是一种永无止境的精神努力。从大学诞生以来的八百多年中,“论辩”作为大学核心的精神从来没有丧失过。,第7章 假设检验,3,6.1 基本内容 一 .问题,公立医院与私立医院对各类指标的平均满意度是否有显著差异? 问用前面学过的方法可以检验吗? 如何检验?-两总体检验方法,第六章
2、两总体均值及方差的统计推断,第7章 假设检验,4,表1. 医院平均满意度指标,第7章 假设检验,5,问题2,检验国贸1班与2班统计分析平均成绩是否有差异? 问用前面学过的方法可以检验吗? 如何检验?两总体检验方法,-上述检验两个样本平均数差异的问题, 叫平均数的显著性检验。,知识点回顾:单个总体检验的步骤,第7章 假设检验,6,总体均值差异显著性检验,检验的目的在于由样本平均数之间的差异检验各自代表的两个总体之间的差异(1一2)。 仍然主要是依据抽样分布理论,不过还应稍作推导。,第7章 假设检验,7,如果:国贸1班与2班统计分析成绩分别为1与2 则两总体均值的差异显著性检验所对应的假设是: H
3、o:12 H1:12,由于这些假设的两端都是未知量,不便于进行检验,可以将它们变换成: Ho:D0 H1:D0,其中D1-2,第7章 假设检验,8,二. 检验方法与步骤,1.提出于原假设和备选假设2.确定检验统计量3.确定显著性水平与拒绝域4. 用样本进行判断如果落入拒绝域,就拒绝原假设,否则,因证据不足就接受零假设。,提出检验 的命题,给出检验 的工具,确定检验 原理与标准,临界值或P值法,第7章 假设检验,9,三 独立样本下的均值之差的三种检验情况,对总体均值之差进行 假设检验的分析方法主要依赖于两个总体所提供的方差。一般来说,共有三种可能,每种需要使用不同的计算方法。 总体方差已知 总体
4、方差未知且两总体方差相等 总体方差未知且两总体方差不等,第7章 假设检验,10,何谓独立样本? 两个样本内的个体是随机抽取,它们之间不存在一一对应关系(非确定性的)。 分为大样本下的检验与小样本下的检验。,第7章 假设检验,11,采用Z统计量 1. 两个总体方差均已知此时可根据两个样本的数据,计算样本统计量z进行判断.,(一)大样本下均值检验统计量,第7章 假设检验,12,2.两个总体方差未知,第7章 假设检验,13,采用t统计量检验 1.两个总体方差未知,但相等,(二)小样本下均值检验统计量,第7章 假设检验,14,2两总体方差未知但不相等,计算复杂,不再给出具体公式,第7章 假设检验,15
5、,四、Excel双样本检验分析工具的内容 双样本检验分析工具 F检验:双样本方差 t检验:双样本等方差假设 t检验:双样本异方差假设 t 检验:平均值的成对二样本分析 Z检验:双样本平均差检验 双样本等方差检验对话框,第7章 假设检验,16,6.2 独立样本均值之差检验,(一)双样本等方差下的均值差异假设 (两总体方差未知,但相等 ),第7章 假设检验,17,例:某学校管理学院考虑专业设置情况,现已知会计专业与财务专业皆为社会所需求,但似乎会计专业毕业生年薪高于财务专业。现在某地开发区随机抽取会计与财务专业的毕业生各12名,调查其参加工作第一年的年薪情况。试在假设由会计专业组成的总体与由财务专
6、业组成的总体的方差相等的情况下,以0.05显著性水平判断 (1) 会计专业毕业生的年薪是否高于财务专业毕业生的年薪,第7章 假设检验,18,分析: 命题是要证明会计专业毕业生的年薪高于财务专业毕业生的年薪-单侧检验。 设所有会计专业人员作为总体1,财务专业人员作为总体2。 问题转换:检验这两个总体的均值是否有差异。 检验命题: 原假设: 两个专业毕业生的年薪相同,即两个均值之差为零。 备择假设:会计专业毕业生年薪均值大于财务专业毕业生年薪均值,即两个均值之差大于零,第7章 假设检验,19,检验步骤,1) 提出假设 单侧2)检验统计量,小样本,第7章 假设检验,20,3)显著性水平拒绝域 P 4
7、)计算样本t值与p 值法采用Excel软件,选择其中双样本多方差 的t检验,可得以下结果:,第7章 假设检验,21,第7章 假设检验,22,(5)判断 由于p=0.020 t=1.17 计算样本t 值 t=2.18 因为t=2.18t=1.17.所以拒绝原假设H0.,第7章 假设检验,23,上机实现:选用t检验:双样本等方差检验,打开“第8章 均值之差推断.xls”工作簿,选择“等方差”工作表。如下页图所示。,第7章 假设检验,24,在“工具”菜单中选择“数据分析”选项,打开“数据 分析”对话框,选择“t检验:双样本等方差假设”, 单击”确定“按钮,打开双样本等方差分析对话框。,第7章 假设检
8、验,25,在“变量1的区域”中输入“A1:A13”。 在“变量2的区域”中输入“B1:B13”。 在“假设平均差”中输入数字“0”,选择“标志”选项,在显著水平a处选择0.05,单击“输出区域”,在右边空格中输入单元格D1,单击“确定”按钮。,第7章 假设检验,26,表1. 医院平均满意度指标,例题2. 公立医院与私立医院医生对升职机会的满意度是否有显著差异?(假设两医院总体满意度的方差相等),第7章 假设检验,27,解:设公立医院医生对升职机会的平均满意度为1,私立医院医生对升职机会的平均满意度为2 1.提出假设H0:1= 2, H1: 1 2 双侧2.检验统计量 t 统计量,总体方差未知,
9、但相等,第7章 假设检验,28,3、 显著性水平=0.05 拒绝域 P=0.05所以接受原假设H0,即在0.05的显著性水平下,可认为公立医院与私立医院医生对升职机会的满意度不存在显著差异,第7章 假设检验,29,表2. t-检验: 双样本等方差假设,第7章 假设检验,30,(二)不等方差下均值差异检验,两总体方差未知,但不相等,第7章 假设检验,31,例3 某供应电脑显示器的公司正考虑采用一种耐用时间更长的新灯泡。公司有以前灯泡样本的检验数据,也有最近得到的新灯泡样本检验数据。 根据这些数据,该公司能够在显著性水平为0.05的情况下认定新灯泡的平均寿命比旧灯泡长吗?,-两个总体均值是否相等的
10、检验问题,首先必须确定两总体方差是否相等, 这里假设新旧两总体的方差不等,第7章 假设检验,32,检验方法与步骤:,1. 提出假设 Ho:新旧 H1:新旧 单、右测,2.、统计量小样本,方差未知,且不等,3. 显著性水平 0.05,拒绝域 P0.05 4.计算样本t值与p 值法由Excel软件,选择双样本异方差的t检验,结果如下 (表3).,第7章 假设检验,33,表3 .t-检验: 双样本异方差检验,第7章 假设检验,34,5.判断因为 P值=0.02578=0.05.所以拒绝原假设H0, 即在0.05的显著性水平下新灯泡明显比旧灯泡更耐用。,第7章 假设检验,35,例题4.联合食品公司支付
11、方式研究,见问题(略) 计算各种支付方式下的平均金额,表4 三种支付方式的平均金额,(1)信用卡与支票支付方式的平均金额有差异吗? (2)支票支付方式的平均金额高于现金吗?,假设各子总体的方差不相等,第7章 假设检验,36,解:设信用卡支付方式的平均金额为1,支票支付方式的平均金额为2 1)提出假设H0:1= 2, H1: 1 2 双侧2)检验统计量 t 统计量,总体方差未知,不相等,(1)信用卡与支票支付方式的平均金额有差异吗?,第7章 假设检验,37,3、 显著性水平拒绝域 P =0.05所以接受原假设H0,即在0.05的显著性水平下,可认为信用卡与支票支付方式的平均金额不存在显著差异,第
12、7章 假设检验,38,表5. t-检验: 双样本异方差假设,第7章 假设检验,39,6.3 两总体方差差异检验,由上例产生的问题:事先如何确定两总体方差是相等还是不等? 如前面的护士满意度分析?在总体方差信息一无所知的情形下如何检验公立与私利医院满意度的差异是否存在? 如联合食品支付方式问题的检验?在总体方差信息一无所知的情形下如何检验使用信用卡群体与使用支票群体的方差是欧服相等?,两总体方差差异检验,第7章 假设检验,40,两总体方差差异检验的步骤,1、提出假设: 原假设 Ho:21=22备择假设 Ha:2122, 2、 检验统计量:F统计量df1=n1-1 df2=n2-1 与 为样本方差
13、,设有两总体,方差分别为21、22, 现检验两总体的方差是否相等。,第7章 假设检验,41,3、给定显著性水平 与拒绝域 4、计算样本F值与P值 5、判断 注意点: 1、尽量不要采用临界值法 2、 P值法 双侧 :样本的p值2 单侧:样本的p值,第7章 假设检验,42,例某供应电脑显示器的公司正考虑采用一种耐用时间更长的新灯泡。公司有以前灯泡样本的检验数据,也有最近得到的新灯泡样本检验数据试问在显著性水平为0.05的情况下,可否认为新旧灯泡平均寿命的方差相等?,第7章 假设检验,43,(1)提出假设:原假设 Ho:21=22备择假设 Ha:2122 双侧 (2)选用F统计量 (3)确定显著性水
14、平拒绝域 2P (4)计算样本F值与p值由 excel 计算,结果如下:,第7章 假设检验,44,表6 F-检验 双样本方差分析,第7章 假设检验,45,EXCEl上机实现过程: 打开“第8章 均值之差推断.xls”工作簿,选择 “异方差”工作表 。 在 “数据分析”对话框“分析工具”栏中选择“F检验:双样本方差”选项,打开“F检验:双样本方差”对话框。,第7章 假设检验,46,5. 判断 因为2P=0.0176760.05 ,所以拒绝原假设,即认为在0.05的显著性水平下,新旧灯泡两总体的方差不相等,第7章 假设检验,47,在“变量1区域”中输入A1:A23。在“变量2区域”中输入B1:B1
15、3。选择“标志”选项。输入显著性水平0.05,Excel分析工具通常将0.05作为默认值。 单击“输出区域”,在右边空格中给出输出地址C30,分析结果将会以C30为输出起点。单击“确定”按钮,分析结果如下页图所示。,第7章 假设检验,48,选中C39:E39,单击鼠标右键,打开快捷菜单,从菜单中选择“插入”选项,在出现的插入对话框中选择“活动单元格下移”选项,单击确定“按钮。,第7章 假设检验,49,在单元格C39中输入“双侧P值”,在D39单元格中输入公式“=D38*2”,显示的值是0.017676129。,第7章 假设检验,50,例题. 公立医院与私立医院医生对升职机会的满意度是否有显著差
16、异问题。检验假设两医院总体满意度的方差相等。 请问上述假设成立吗?,第7章 假设检验,51,(1)提出假设:原假设 Ho:21=22备择假设 Ha:2122 双侧 (2)选用F统计量 (3)确定显著性水平拒绝域 2P (4)计算样本F值与p值由 excel 计算,结果如下:,第7章 假设检验,52,表7. F-检验 双样本方差分析,第7章 假设检验,53,5. 判断 因为2P=0.05530.05 ,所以接受原假设,即认为在0.05的显著性水平下,两医院总体满意度的方差相等。,第7章 假设检验,54,综合案例研究:美国男女收入差异检验,背景分析 根据美国劳动部女工局资料显示,1994年,美国女
17、性劳动力约占46%,据预测到2005年可能会占48%。 这些数据表明女性是美国社会中的“半边天”。女性在为美国的经济发展中贡献近一半的力量,然而,其收入却同美国男性有着显著差别。 请利用均值之差检验,以0.05为显著性水平,对美国男女收入差异进行检验,以判断是否存在差异。,第7章 假设检验,55,分析思路: 1.样本容量?2.方差是否已知?3方差是否相等?4.单侧还是双侧?,具体: (1).在男女两总体方差未知情况下,对男女的平均收入是否相等做检验 即 检验(2) 两总体的方差是否相等?未知!所以首先要进行方差是否相等检验。,第7章 假设检验,56,(一)两总体方差是否相等检验,(1)提出假设
18、(2)检验统计量(3)确定显著性水平拒绝域 2p(4)计算样本F值与p值 利用EXCEL中的F检验:双样本方差检验计算,结果如下:,检验过程分两步走:,第7章 假设检验,57,(5)因为2P=0.020.05 ,所以拒绝原假设 即认为两总体的方差不相等 因此该题的均值检验应该进行异方差下的检验.,第7章 假设检验,58,(二)男女平均收入是否相等的检验,(1)建立假设,单测,(2) 确定统计量两总体方差未知,且不等,选择t统计量 (3)确定显著性水平=0.05 ,拒绝域 p (4)计算样本t值与p值利用excel中的t检验:双样本异方差检验计算,结果如下:,第7章 假设检验,59,表8 t-检
19、验: 双样本异方差假设,第7章 假设检验,60,(5) 判断 因为P=0.00076=0.05,所以拒绝原假设H0 , 即在0.05的显著性水平下可认为男女之间的收入有显著性差异,第7章 假设检验,61,6.4 成对样本检验,很多实验是以一个样本的每一变量 与另一样本的一个特定变量配对的方式进行的。这两个样本常常不独立. 对于相互不独立的两个样本,不能直接应用前述方法。两种同质对象分别接受两种不同的处理,如性别、年龄、体重、病情程度相同配成对。 同一受试对象或同一样本的两个部分,分别接受两种不同的处理。 自身对比。即同一受试对象处理前后的结果进行比较。,第7章 假设检验,62,一、问题的背景:
20、,问题: 1.研究某蔬菜对高血压病人治疗作用,用20名患者分组配对,(测得血压值如下表) ,问该蔬菜是否有降压作用。 安慰剂组 117 127 141 107 110 114 115 138 127 122 药物组 113 108 120 107 104 98 102 132 120 114,第7章 假设检验,63,2.:某种干电池,在一定温度下存放之后它的电压有可能升高也可能降低。我们取10个样品做实验。数据如下: 编号: 1 2 3 4 5 6 7 8 9 10 存前电压 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9存后电压 1.9 1.8 1.7 1.6
21、 1.5 1.4 1.3 1.2 1.1 1.0 考察存放对电压有没有影响?,第7章 假设检验,64,3. 学校新的管理制度是否有效分析? 调查对象:1班同学 新制度实施前: 30,29,28,26,28,30 新制度实施后 29,29,30,28,.29,第7章 假设检验,65,二、成对样本均值检验的本质,成对样本均值之差检验一般用于同一研究对象分别给于两种不同处理的效果比较或同一研究对象处理前后的效果比较。 前提:1.两样本观察数量相同。 2.两样本观察顺序不能随意改变 3.样本来自于正态分布的总体,第7章 假设检验,66,也即成对样本检验:是对来自同一总体的样本,在不同条件影响下获取的2
22、组样本进行分析,以评价不同条件是否对其有显著影响。不同条件可以是不同存放环境、不同的测量系统等。,第7章 假设检验,67,三、成对样本均值之差检验方法,问题的处理方法: 检验两个总体的均值相等的假设:1 = 2,等价于检验假设Ho: 12 =0。 令D= 12 ,问题可以简化为:D=0,于是假设检验为 H0: D=0 Ha: 则使用统计量:,第7章 假设检验,68,检验步骤:,(1)提出假设 H0: 1 = 2Ha :1 2 (2)判断是否属于配对样本检验问题,若不是,依照前述方法,若是 ,则令 D= 1 -2 (3) 检验检验统计量: t统计量(4)给出显著性水平.确定拒绝域 (5)计算样本
23、t值与P值 (6)判断,第7章 假设检验,69,例 某轮胎制造企业想知道一个新的橡胶配方是否能提高胎面摩擦力,即新轮胎与旧轮胎是否具有显著差异。 质量检查人员使用两套样本,一套是用传统配方制造的轮胎,另一套是用新配方制造的轮胎,两套轮胎除了在橡胶方面不同外其他各方面均相同。,第7章 假设检验,70,现随机选择6名汽车司机进行实验,每个小汽车配两个用原橡胶配方生产的轮胎和两个用新配方生产的轮胎,并且保证每个汽车的前轮和后轮均装有一个新配方的轮胎和用原配方制造的轮胎。开动汽车直到当有一轮胎破裂,对这个轮胎的里程寿命进行登记,然后继续开这辆车,直到所有的轮胎破裂为止,记录每个轮胎行程里数。 根据所得
24、数据,以0.05为显著性水平,制造企业是否有足够的证据证明用新配方制造的轮胎的平均寿命超过用原橡胶配方制造的轮胎的平均寿命?,第7章 假设检验,71,1)建立假设: Ho:新旧:Ha:新旧,由于每个用传统橡胶配方制造的轮胎和用新配方制造的轮胎相对应,因此,这些样本明显为配对数据。因此可用配对数据检验方法。令D 新旧 则 Ho:D 0,Ha: D02)利用 t统计量 进行检验3) ,拒绝域 P 4)计算样本t值与P值 利用EXCEl上机计算,结果如下:,第7章 假设检验,72,表9 t-检验: 成对双样本均值分析,6)判断 由于 P=0.01777. =0.05,所以拒绝与原假设H0.即在0.0
25、5的显著性水平下,可认为新配方的轮胎寿命显著高于旧轮胎.,第7章 假设检验,73,上机实现过程: 打开“第8章 均值之差推断.xls”工作簿,选择“配对”工作表,第7章 假设检验,74,2. 研究某蔬菜对高血压病人治疗作用,用20名患者分组配对,(测得血压值如下表) ,问该蔬菜是否有降压作用。 安慰剂组 117 127 141 107 110 114 115 138 127 122 蔬菜组 113 108 120 107 104 98 102 132 120 114,第7章 假设检验,75,1)2)选用t统计量3) ,拒绝域 P 4)计算样本t值与P值 利用EXCEl上机计算,结果如下:,配对
26、,双侧,第7章 假设检验,76,表 2 t-检验: 成对双样本均值分析,第7章 假设检验,77,5)判断 因为P= 0.001317 =0.05 所以拒绝原假设H0.即可认为在0.05的显著性水平下,无理由说明该蔬菜有降压作用。,第7章 假设检验,78,3:某种干电池,在一定温度下存放之后它的电压有可能升高也可能降低。我们取10个样品做实验。数据如下: 编号: 1 2 3 4 5 6 7 8 9 10 存前电压 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9存后电压 1. 4 1.7 1.8 1. 2 1. 5 1.4 1.5 1.6 1.7 1.6 考察存放对
27、电压有没有影响?,如何确定假设命题?,第7章 假设检验,79,1)2)选用t统计量3) ,拒绝域 P 4)计算样本t值与P值 利用EXCEl上机计算,结果如下:,配对,双侧,第7章 假设检验,80,表3 t-检验: 成对双样本均值分析,第7章 假设检验,81,5)判断 因为P= 0.403568 =0.05 所以接受原假设H0.即可认为在0.05的显著性水平下, 存放对电压没有显著影响 。,第7章 假设检验,82,例4 Firue是一家专门从事减肥项目的女子健美沙龙。以下是客户样本数据体重在历时六周的引导性项目之前和之后的情况,试在0.05的,显著性水平下,检验实施该减肥项目后,体重是否显著的
28、减轻?显然,这是配对数据的均值的检验问题,第7章 假设检验,83,1)2)选用t统计量3) ,拒绝域 P 4)计算样本t值与P值 利用EXCEl上机计算,结果如下:,第7章 假设检验,84,表10 t-检验: 成对双样本均值分析,第7章 假设检验,85,5)判断 因为P= 0.035159 =0.05 所以拒绝原假设H0.即可认为在0.05的显著性水 平下,该训练项目有显著的减肥效果,第7章 假设检验,86,练习: 下面是有关10种股票组成的1997年与1998年市盈率的样本数据资料, 1)在a0.05的显著性水平下,检验平均市盈率在两年中是否有变化?,第7章 假设检验,87,第7章 假设检验
29、,88,例5 某电视台对一个电视剧进行调查(见数据库), 在农村随机调查了250人,有35人收看了节目,在城市随机调查了300人,有27人收看了节目,请问,城市与农村在收看该电视剧方面是否不同呢?,如何检验?与前面的例题有何差别? -定型变量的比较:转化为收看比例,第7章 假设检验,89,6.5 两个总体比率之差推断 两总体比率之差的假设检验,P1、p2分别为总体1 与总体2的样本比例,第7章 假设检验,90,继续上例: 某电视台对一个电视剧进行调查(见数据库),在农村随机调查了250人,有35人收看了节目,在城市随机调查了300人,有27人收看了节目,请问,城市与农村在收看该电视剧方面是否不
30、同呢?,假设城市总体的收看比例为1,农村总体的收看比例为2,第7章 假设检验,91,1.提出假设2.检验统计量 3.显著性水平 4.采用临界值判断,第7章 假设检验,92,拒绝域:5.计算样本统计量值因为所以在0.1的显著性水平下拒绝原假设,第7章 假设检验,93,选择“总体比例之差的假设检验”工作表。,第7章 假设检验,94,思考题: (1)三种检验方法的适用条件与采用的检验统计量是什么? (2)对两个总体的均值之差进行检验时,首先应该进行什么检验?检验的统计量是什么?(3)当两个总体的方差未知但相等时,对这两个总体的均值之差进行检验,在excel中利用那个双样本检验分析工具?当两个总体的方
31、差未知但不相等时,对这两个总体的均值之差进行检验,在excel中利用那个双样本检验分析工具? (4)对两个总体的方差差异进行检验,在excel中利用那个双样本检验分析工具?,第7章 假设检验,95,1 某公司研究两家原材料供应商的送货时间,该公司对供应商A基本满意.如果其平均送货时间等于或小于供应商B,则该公司将继续选择A,但若发现B公司的平均送货时间小于A.则会选择从B出购买原材料, 1)这种情况下,原假设与备择假设分别是什么? 2) 现假设从A、B两家供应商处随机抽取了两组样本,数据如下,若选取显著性水平为0.01,那么你对1)中的假设有何结论?你对该公司有什么建议?,第7章 假设检验,9
32、6,第7章 假设检验,97,2 :下面是有关10种股票组成的1997年与1998年市盈率的样本数据资料, 1)在a0.05的显著性水平下,检验平均市盈率在两年中是否有变化? 2)分别给出1997年与1998年市盈率的99的置信区间,第7章 假设检验,98,第7章 假设检验,99,第三章 联合食品公司支付方式研究,试根据样本资料,在0.05的显著性水平下,判断当地消费者支票支付与信用卡支付的平均金额有无显著差异? (要求写出假设 并对数据结果进行分析,得出假设检验的结论,给出检验的P-值,并根据结果提出相应建议,第7章 假设检验,100,第7章 假设检验,101,问题3,联合食品公司各种支付方式的费用之间存在差异吗?,如何检验?三总体检验方法,第7章 假设检验,102,作业:联合食品方式研究 1.两总体方差相等的假设成立吗?为什么 如果不成立你是如何做得?请一位同学上台演示并讲解自己的结果。请一位同学予以对同学的结果与讲解进行评论,并对独立样本下两总体方差的检验进行简单总结。,