1、第六章 假设检验 Hypothesis Testing,参数估计与假设检验的关系,参数估计(Parameter estimate)和假设检验(Hypothesis testing)是统计推断的两个重要内容 参数估计是用样本统计量估计总体参数,总体参数在估计前是未知的 在假设检验中,是先对总体参数提出一个假设,再利用样本信息去检验这个假设是否成立 假设检验分为两类: 一类是关于总体参数的检验问题,称为参数检验 另一类是关于总体模型描述及随机变量概率分布的检验,称为非参数检验,本章主要内容,第一节 假设检验的一般问题 第二节 一个正态总体的参数检验 第三节 两个正态总体的参数检验,第一节 假设检验
2、的一般问题,假设检验的概念 假设检验的步骤 假设检验中的小概率原理 假设检验中的两类错误 双侧检验和单侧检验,假设(hypothesis) 是对总体参数(assumption)的一个假定. 参数是总体的均值或比例 参数必须在分析前已经确定 特点 采用逻辑上的反证法 依据统计上的小概率原理,我假设班级中大家的平均成绩为B !,What is a Hypothesis? 一、什么是假设?,假设检验的基本思想:通过提出假设,利用“小概率原理”和“概率反证法”,论证假设的真伪的一种统计分析方法。 小概率原理:也就是实际推断原理,它认为在一次实验中,概率很小的事件,实际上是不可能发生的。 概率反证法:如
3、果在其他因素给定的前提下,要证明某一事实(对总体参数假定)是否成立,只要假设该事实(参数假定)成立,在该事实成立的前提下,来证明由该事实(参数假定)和样本建构的统计量的取值概率较小以证明假定是否成立。,假设检验的过程 (提出假设抽取样本作出决策),二、假设检验的步骤 提出原假设和备择假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策,提出原假设和备择假设, 什么是原假设?(Null Hypothesis) 1. 待检验的假设,又称“0假设” 2. 如果错误地作出决策会导致一系列后果 3. 总是有等号 , 或 4. 表示为 H0 H0: 某一数值 指定为 = 号,即 或
4、 例如, H0: 3190(克), 什么是备择假设?(Alternative Hypothesis) 1. 与原假设对立的假设 2. 总是有不等号: , 或 3. 表示为 H1 H1: 某一数值,或 某一数值或 某一数 例如, H1: 3910(克),或 3910(克),提出原假设和备择假设, 什么检验统计量? 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 检验统计量的基本形式为,确定适当的检验统计量,规定显著性水平, 什么显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 3. 表示为 (alpha
5、) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,作出统计决策,计算检验的统计量 根据给定的显著性水平,查表得出相应的临界值Z或Z/2 将检验统计量的值与 水平的临界值进行比较 得出接受或拒绝原假设的结论,三、假设检验中的小概率原理,假设检验中的小概率原理, 什么小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定,什么是小概率,四、假设检验中的两类错误 (决策风险),假设检验中的两类错误,1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类
6、错误的概率为 被称为显著性水平 2. 第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为(Beta),H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程, 错误和 错误的关系,五、双侧检验与单侧检验注:研究者感兴趣的是备择假设,单侧假设的方向是按备侧假设的方向来说的。,双侧检验 (原假设与备择假设的确定),双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施 例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格 建立的原假设与备择假设应为H0: = 10 H1: 10,
7、双侧检验 (确定假设的步骤),1. 例如问题为: 检验该企业生产的零件平均长度为4厘米 2. 步骤 从统计角度陈述问题 ( = 4) 从统计角度提出相反的问题 ( 4) 必需互斥和穷尽 提出原假设 ( = 4) 提出备择假设 ( 4) 有 符号,单侧检验 (原假设与备择假设的确定), 检验研究中的假设 将所研究的假设作为备择假设H1 将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设 先确立备择假设H1,单侧检验 (原假设与备择假设的确定),例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上 属于研究中的假设 建立的原假设与备择假设
8、应为H0: 1500 H1: 1500 例如,改进生产工艺后,会使产品的废品率降低到2%以下 属于研究中的假设 建立的原假设与备择假设应为H0: 2% H1: 2%,单侧检验 (原假设与备择假设的确定),检验某项声明的有效性 将所作出的说明(声明)作为原假设 对该说明的质疑作为备择假设 先确立原假设H0 除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的,假设检验步骤的总结,陈述原假设和备择假设 从所研究的总体中抽出一个随机样本 确定一个适当的检验统计量,并利用样本数据算出其具体数值 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域 将统计量的值与临界值进行比较,作出决策 统
9、计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P值作出决策,第二节 一个正态总体的参数检验,一. 总体方差已知时的均值检验 二. 总体方差未知时的均值检验 三. 总体比例的假设检验,一个总体的检验,检验的步骤, 陈述原假设 H0 陈述备择假设 H1 选择显著性水平 选择检验统计量 选择n, 给出临界值 搜集数据 计算检验统计量 进行统计决策 表述决策结果,总体方差已知时的均值检验 (双尾 Z 检验),均值的双尾 Z 检验 (2 已知),1. 假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 2. 原假设为:H0: =0;备择假设为:H1: 0 使用z-
10、统计量,例 洗衣粉包装量服从正态分布,已知,随机抽取10袋,测得平均包装量为498克,能否认为洗衣粉包装量的均值为500克?(显著水平0.05) 解:设立原假设和备择假设 计算统计量 根据显著水平,查临界值得 故拒绝原假设,即不能认为洗衣粉的重量为500克。,总体方差已知时的均值检验 (单尾 Z 检验),均值的单尾 Z 检验 (2 已知),假定条件 总体服从正态分布 若不服从正态分布,可以用正态分布来近似 (n30) 2. 备择假设有符号 3. 使用z-统计量,均值的单尾 Z 检验 (提出假设),例 根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1030,1002)。现从最近生产的
11、一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05) 解:根据题意,设立原假设和备择假设:得到临界值 计算统计量则拒绝原假设,接受备择假设,认为这批产品的使用寿命有显著提高。,例 设某电子产品平均寿命5000小时为达到标准,现从一大批产品中抽出12件试验结果如下:5059,3897,3631,5050,7474,5077,4545,6279,3532,2773,7419,5116假设该产品的寿命 , 试问此批产品是否合格? 解:检验假设 故可接受原假设,即认为该批产品合格,总体方差未知时的均值检验 (双尾 t 检
12、验),均值的双尾 t 检验 (2 未知),1. 假定条件 总体为正态分布 如果不是正态分布, 只有轻微偏斜和大样本 (n 30)条件下 2. 使用t 统计量,例 健康成年男子脉搏平均为72次/分,高考体检时,某校参加体检的26名男生的脉搏平均为73.2次/分,标准差为6.2次/分,问此26名男生每分钟脉搏次数与一般成年男子有无显著差异?(置信水平0.05) 解:提出假设 计算统计量:临界值为故接受原假设,认为该校参加体检的男生每分钟脉搏次数与一般成年男子没有区别。,总体方差未知时的均值检验 (单尾 t 检验),例 已知某种元件的寿命服从正态分布,要求该元件的平均寿命不低于1000 小时,现从这
13、批元件中随机抽取 只,测得平均寿命 980小时,标准差65小时,试在显著水平0.05下,确定这批元件是否合格? 解:提出检验假设 未落入拒绝域,应接受原假设,即认为这批元件合格。,总体方差未知时的均值检验 (大样本),用样本方差代替总体方差 仍用Z统计量,例 某一燃料的等级服从正态分布,平均等级为98.0,抽取35桶新燃料进行测试,样本平均值为97.7,标准差0.8,能否认为新燃料的等级比原来的等级偏低?(显著水平0.05) 解:根据题意设立假设 属于大样本,而且是左侧检验,计算统计量 临界值为则拒绝原假设,接受备择假设,认为新燃料的等级确实偏低,总体均值检验,总体均值的检验,注:s 已知的拒
14、绝域同大样本,二、总体方差的检验 (2 检验),方差的卡方 (2) 检验,1. 检验一个总体的方差或标准差 2. 假设总体近似服从正态分布 3. 原假设为 H0: 2 = 02 4. 检验统计量,如果是右侧检验,则设拒绝域为如果是左侧检验,则设拒绝域为,右侧检验 左侧检验,总体方差的检验(检验方法的总结),三、总体比例的假设检验 (Z 检验),一个总体比例的 Z 检验,假定条件 有两类结果 总体服从二项分布 可用正态分布来近似 比例检验的 z 统计量,P0为假设的总体比例,例 某公司产品不合格率为0.02,今从五批产品中抽取500件作为样本给定货者检验,检查出不合格率只有0.01,在显著性水平
15、a=0.05下,能否认为该产品得合格率小于0.02? 解:这是大样本的假设检验,设检验假设为:,因此接受原假设,即该产品不合格率为0.02,例 某工厂生产一批产品,质量要求当次品率P0.05时,产品才能出厂,今从生产出的产品中随机抽查100件,发现8个次品,试问这批产品是否可以出厂?(a=0.05) 解:这是大样本的检验,设假设检验为:,因此接受原假设,即认为这批产品次品率小于5%,可以出厂,总体比例的检验(检验方法的总结),第三节 两个正态总体的参数检验,一. 两个总体均值之差的检验 两个总体方差是否相等的检验 两个总体比例之差的检验,两个正态总体的参数检验,一、两个正态总体均值差的检验,两
16、个独立样本之差的抽样分布,两个总体均值之差的Z检验 (12、 22 已知),1. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 原假设:H0: 1- 2 =0;备择假设:H1: 1- 2 0 检验统计量为,双侧检验当原假设成立时,统计量,拒绝原假设,否则接受原假设,如果是右侧检验,假设检验为:,拒绝原假设,,接受备择假设,如果是左侧检验,假设为,拒绝原假设,,接受备择假设,两个总体均值之差的Z检验 (假设的形式),两个总体均值之差的 t 检验 (12、 22未知 相等),检验具有等方差的两个总体的均值 假定条件 两个样
17、本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等12 = 22 检验统计量,其中:,双侧检验拒绝域,例 某物品在处理前与处理后抽样分析含脂率(%)如下: 处理前x:0.19 0.18 0.21 0.30 0.41 0.12 0.17 处理后y:0.13 0.15 0.07 0.24 0.19 0.06 0.08 0.12 设含脂率分别服从正态分布,且方差相等,对显著性水平0.05,试问:处理前后的平均含脂率有无显著性差异? 解: 根据题意设立假设,拒绝原假设,接受备择假设,,即处理后含脂率有显著差异,两个总体均值之差的 z检验 (12、 22未知 大样本),检验方差未知大样本的
18、两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知大样本 检验统计量,双侧检验右侧检验和左侧检验,拒绝原假设,例 对7岁儿童作身高调查,结果如表所示,能否说明性别对7岁儿童的身高有显著影响?(显著性水平0.05),解:建立假设根据题意属于大样本,用样本方差代替总体方差,采用Z统计量,则拒绝原假设,二、两个总体方差是否相等的检验 (F 检验),双侧检验选取统计量拒绝域为,如果是右侧检验其拒绝域为如果是左侧检验拒绝域为,例 某一橡胶配方中,原用氧化锌5g,现减为1g ,若分别用两种配方做一批实验,5g配方测9个值,得橡胶伸长率的样本差是;1g配方测3个值,橡
19、胶伸长率的样本差是。设橡胶伸长率遵从正态分布,问两种配方的伸长率的总体标准差有无显著差异?(显著性水平0.05),解:两种配方的伸长率的总体标准差有无显著差异,是通过样本值去判断两个总体方差是否相等的检验,检验假设:其临界值为,拒绝原假设,例 有甲乙两车床生产同一型号的滚珠,根据已有经验可以认为,这两台车床生产的滚珠都服从正态分布,问题是要比较台车床生产的滚珠的直径的方差。现在从这两台车床的产品中分别抽取8个和9个,经计算得甲的均值15.01,乙的均值14.99,甲的样本方差0.0955,乙的样本方差0.0261,对显著性水平0.05,试问:乙车床产品的方差是否比甲车床的小?,解:假设为,故拒
20、绝原假设,三、两个总体比例之差的检验 (Z 检验),1. 假定条件 两个总体是独立的 两个总体都服从二项分布 可以用正态分布来近似 检验统计量,两个总体比例之差的Z检验,双则检验拒绝域,如果是右侧检验 其拒绝域为 如果是左侧检验 其拒绝域为:,两个总体比例之差的检验 (假设的形式),例 随机调查了359名50岁以上的男性,其中205名吸烟者中有43人患慢性气管炎,在154名不吸烟者中,有15人患慢性气管炎,试在时检验吸烟者患此病的比率是否明显高于不吸烟者? 解:根据题意建立假设,落在拒绝域,所以拒绝原假设,本章小节,1. 假设检验的概念和类型 2. 假设检验的过程 基于一个正态总体的假设检验问题 4. 基于两个正态总体的假设检验问题,问题? Any Question?,