1、2008-2009,第6章 假设检验,2008-2009,客观 现象 数量 表现,统计 总体 数量 特征,统计研究的程序,统计研究目的,统计设计,统 计 调 查,统 计 整 理,推 断 分 析描 述 分 析,2008-2009,假设检验在统计方法中的地位,2008-2009,学习目标,假设检验的基本思想和原理 假设检验的步骤 总体均值的检验 总体比例的检验P值的计算与应用 用Excel进行检验,2008-2009,6.1 假设检验的基本问题,假设的陈述 两类错误与显著性水平 统计量与拒绝域 利用P 值进行决策,2008-2009,什么是假设?(hypothesis),对总体参数的具体数值所作的
2、陈述 总体参数包括总体均值、比例、方差等 分析之前必需陈述,我认为这种新药的疗效比原有的药物更有效!,假设的陈述,2008-2009,什么是假设检验?(hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理,2008-2009,原假设(null hypothesis),研究者想收集证据予以反对的假设 又称“0假设” 总是有符号 , 或表示为 H0 H0 : = 某一数值 指定为符号 =, 或 例如, H0 : 10cm,2008-2009,研究者想收集证据予以支持的假设
3、也称“研究假设” 总是有符号 , 或 表示为 H1 H1 : 某一数值,或 某一数值 例如, H1 : 10cm,或 10cm,备择假设(alternative hypothesis),2008-2009,【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设,提出假设,解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0 : 10cm H1 : 10
4、cm,2008-2009,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为H0 : 500 H1 : 500,500g,2008-2009,【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽
5、车的比例超过30%”。建立的原假设和备择假设为H0 : 30% H1 : 30%,2008-2009,原假设和备择假设是一个完备事件组,而且相互对立 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设的结论与建议,2008-2009,备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,2008-2009,假
6、设的形式,2008-2009,假设检验中的两类错误,第类错误(弃真错误) 原假设为真时拒绝原假设 第类错误的概率记为 被称为显著性水平 第类错误(取伪错误) 原假设为假时未拒绝原假设 第类错误的概率记为(Beta),两类错误与显著性水平,2008-2009,H0: 无罪,假设检验就好像 一场审判过程,统计检验过程,决策结果,2008-2009, 错误和 错误的关系,2008-2009,影响 错误的因素,1. 总体参数的真值 随着假设的总体参数的减少而增大 2. 显著性水平 当 减少时增大 3. 总体标准差 当 增大时增大 4. 样本容量 n 当 n 减少时增大,2008-2009,显著性水平
7、(significant level),1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,2008-2009,假设检验中的小概率原理,什么是小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定,2008-2009,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量 对样本估计量的标准化结果 原假设H0为真 点估计量的抽样分布,检验统计量
8、(test statistic),统计量与拒绝域,标准化的检验统计量,2008-2009,拒绝域,能够拒绝原假设的检验统计量的所有可能取值的集合。 由显著性水平围成的区域。 如果检验统计量的具体数值落在了拒绝域内,就拒绝原假设,否则就不拒绝原假设。 根据给定的显著性水平确定的拒绝域的边界值,称为临界值。(查表所得),2008-2009,显著性水平和拒绝域,抽样分布,双侧检验,2008-2009,双侧检验,2008-2009,2008-2009,单侧检验,2008-2009,左侧检验,2008-2009,2008-2009,右侧检验,2008-2009,2008-2009,决策规则,给定显著性水
9、平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 作出决策 双侧检验:I统计量I 临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H0,2008-2009,什么是P 值(P-value),在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率 双侧检验为分布中两侧面积的总和 反映实际观测到的数据与原假设H0之间不一致的程度 被称为观察到的(或实测的)显著性水平 决策规则:若p值, 拒绝 H0,利用P值进行决策,2008-2009,双侧检验的P值,2008-2009,左侧检验的P值,2008-2009,右侧检验的P值,2008-2009,假设检
10、验步骤的总结,陈述原假设和备择假设 从所研究的总体中抽出一个随机样本 确定一个适当的检验统计量,并利用样本数据算出其具体数值 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域 将统计量的值与临界值进行比较,作出决策 统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P值作出决策,2008-2009,6.2 总体均值的检验,大样本的检验方法 小样本的检验方法,2008-2009,一个总体参数的检验,2008-2009,总体均值的检验(作出判断),样本容量n,2008-2009,总体均值的检验(大样本),假定条件 正态总体或非正态总体大样本(n30) 使用z检验统计量 2 已知:
11、 2 未知:,大样本的检验方法,2008-2009,总体均值的检验( 2 已知),【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,2008-2009,由题已知 H0 : = 255 H1 : 255 = 0.05 n = 40 =5 临界值(c):,检验统计量:,决策:,结论:,不拒绝H0,样本提供的证据表明:该天生产的饮料符合标准要求,2008-2009,用Excel计算P
12、 值,第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数) 第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“NORMSDIST”,然后确定 第3步:将 z 的绝对值1.01录入,得到的函数值为0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H0,2008-2009,【例】 ( 2 未知)一种机床加工的零件尺寸绝对平均误差允许值为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新
13、机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01),左侧检验,总体均值的检验( 2 未知),2008-2009,由题已知 H0 : 1.35 H1 : 1.35 = 0.01 n = 50 临界值(c):,检验统计量:,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,2008-2009,2008-2009,用Excel计算P 值(z检验),第1步:进入Excel表格界面,直接点击“f(x)”(粘贴函数) 第2步:在函数分类中点击“统计”,并在函数名的菜单下选择 “ZTEST”,然后确定 第3步:在所出现的对话框Array框中,输入原始数据所
14、在区域 ;在X后输入参数的某一假定值(这里为1.35);在Sigma后输入已知的总体标准差(若未总体标准差未知则可忽略不填,系统将自动使用样本标准差代替) 第4步:用1减去得到的函数值0.995421023 即为P值P值=1-0.995421023=0.004579 P值=0.01,拒绝H0,2008-2009,【例】 ( 2 未知)某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标准差为120/hm2 。试检验改良后的新品种产量是否有显
15、著提高? (=0.05),右侧检验,2008-2009,H0 : 5200 H1 : 5200 = 0.05 n = 36 临界值(c):,检验统计量:,拒绝H0 (P = 0.000088 = 0.05),改良后的新品种产量有显著提高,决策:,结论:,2008-2009,2008-2009,总体均值(大样本)的检验方法的总结,2008-2009,总体均值的检验 (小样本),假定条件 总体服从正态分布 小样本(n 30) 检验统计量 2 已知: 2 未知:,小样本的检验方法,2008-2009,总体均值(小样本)检验方法的总结,注: 已知的拒绝域同大样本,2008-2009,【例】 一种汽车配
16、件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?,2008-2009,由题已知 H0 : = 12 H1 : 12 = 0.05 df = 10 - 1 = 9 临界值(c):,检验统计量:,不拒绝H0,该供货商提供的零件符合要求,决策:,结论:,2008-2009,用Excel计算P 值(t 检验),第1步:进入Excel表格界面,
17、直接点击“f(x)”(粘贴函数) 第2步:在函数分类中点击“统计”,并在函数名的菜单下选择“TDIST”,然后确定 第3步:在出现对话框的X栏中输入计算出的t的绝对值0.7053,在Deg-freedom(自由度)栏中输入本例的自由度9,在Tails栏中输入2(表明是双侧检验,如果是单侧检验则在该栏输入1) 第4步:P值=0.498469786P值=0.05,故不拒绝H0,2008-2009,6.3 总体比例的检验,大样本的检验方法,2008-2009,总体比例检验,假定条件 总体服从二项分布 可用正态分布来近似(大样本) 检验的z 统计量,0为假设的总体比例,2008-2009,总体比例检验
18、检验方法的总结,2008-2009,【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01 ,检验该杂志读者群中女性的比例是否为80%?它们的值各是多少?,双侧检验,2008-2009,H0 : = 80% H1 : 80% = 0.05 n = 200 临界值(c):,检验统计量:,拒绝H0 (P = 0.013328 = 0.05),该杂志的说法并不属实,决策:,结论:,2008-2009,H0 : = 80% H1 : 80% = 0.01 n = 200 临界值(c):,检验统计量:,不拒绝H0 (P = 0.013328 = 0.01),该杂志的说法属实,决策:,结论:,2008-2009,本章小节,假设检验的基本问题 总体均值的检验 总体比例的检验 用Excel进行检验 利用p值进行检验,