1、第七章 假设检验,第七章 假设检验,第一节 假设检验的一般问题 第二节 一个正态总体的参数检验 第三节 两个正态总体的参数检验 第四节 假设检验中的其他问题,假设检验在统计方法中的地位,学习目标,了解假设检验的基本思想 掌握假设检验的步骤 能对实际问题作假设检验 利用置信区间进行假设检验 利用P - 值进行假设检验,第一节 假设检验的一般问题,假设检验的概念 假设检验的步骤 假设检验中的小概率原理 假设检验中的两类错误 双侧检验和单侧检验,假设检验的概念与思想,什么是假设?, 对总体参数的一种看法 总体参数包括总体均值、比例、方差等 分析之前必需陈述,我认为该企业生产的零件的平均长度为4厘米!
2、,什么是假设检验?,概念 事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立 类型 参数假设检验 非参数假设检验 特点 采用逻辑上的反证法 依据统计上的小概率原理,假设检验的基本思想,. 因此我们拒绝假设 = 50,样本均值,m,= 50,抽样分布,H0,假设检验的过程 (提出假设抽取样本作出决策),假设检验的步骤 提出原假设和备择假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策,提出原假设和备择假设, 什么是原假设?(Null Hypothesis) 1. 待检验的假设,又称“0假设” 2. 如果错误地作出决策会导致一系列后果 3. 总是有
3、等号 , 或 4. 表示为 H0 H0: 某一数值 指定为 = 号,即 或 例如, H0: 3190(克),为什么叫0假设, 什么是备择假设?(Alternative Hypothesis) 1. 与原假设对立的假设 2. 总是有不等号: , 或 3. 表示为 H1 H1: 某一数值,或 某一数值 例如, H1: 3910(克),或 3910(克),提出原假设和备择假设, 什么检验统计量? 1. 用于假设检验问题的统计量 2. 选择统计量的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 检验统计量的基本形式为,确定适当的检验统计量,规定显著性水平, 什么显著性水平? 1.
4、 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,作出统计决策,计算检验的统计量 根据给定的显著性水平,查表得出相应的临界值Z或Z/2 将检验统计量的值与 水平的临界值进行比较 得出接受或拒绝原假设的结论,假设检验中的小概率原理,假设检验中的小概率原理, 什么小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定,什么是小概率,假设检验中的两类错误 (决策风险),假设
5、检验中的两类错误,1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为 被称为显著性水平 2. 第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为(Beta),H0: 无罪,假设检验中的两类错误 (决策结果),假设检验就好像一场审判过程,统计检验过程, 错误和 错误的关系,影响 错误的因素,1. 总体参数的真值 随着假设的总体参数的减少而增大 2. 显著性水平 当 减少时增大 3. 总体标准差 当 增大时增大 4. 样本容量 n 当 n 减少时增大,双侧检验和单侧检验,双侧检验与单侧检验 (假设的形式),双侧检验 (原假设与备择假设的确定)
6、,双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施 例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格 建立的原假设与备择假设应为H0: = 10 H1: 10,双侧检验 (确定假设的步骤),1. 例如问题为: 检验该企业生产的零件平均长度为4厘米 2. 步骤 从统计角度陈述问题 ( = 4) 从统计角度提出相反的问题 ( 4) 必需互斥和穷尽 提出原假设 ( = 4) 提出备择假设 ( 4) 有 符号,提出原假设: H0: = 4 提出备择假设: H1: 4,该企业生产的零件平均长度是4厘米吗?(属于决策中的假设),
7、双侧检验 (例子),双侧检验 (显著性水平与拒绝域 ),双侧检验 (显著性水平与拒绝域 ),双侧检验 (显著性水平与拒绝域 ),双侧检验 (显著性水平与拒绝域 ),单侧检验 (原假设与备择假设的确定), 检验研究中的假设 将所研究的假设作为备择假设H1 将认为研究结果是无效的说法或理论作为原假设H0。或者说,把希望(想要)证明的假设作为备择假设 先确立备择假设H1,单侧检验 (原假设与备择假设的确定),例如,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上 属于研究中的假设 建立的原假设与备择假设应为H0: 1500 H1: 1500 例如,改进生产工艺后,会使产品的废品率降低
8、到2%以下 属于研究中的假设 建立的原假设与备择假设应为H0: 2% H1: 2%,单侧检验 (原假设与备择假设的确定),检验某项声明的有效性 将所作出的说明(声明)作为原假设 对该说明的质疑作为备择假设 先确立原假设H0 除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的,单侧检验 (原假设与备择假设的确定),例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上 除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的 建立的原假设与备择假设应为H0: 1000 H1: 1000,提出原假设: H0: 1000 选择备择假设: H1:
9、 1000,该批产品的平均使用寿命超过1000小时吗?(属于检验声明的有效性,先提出原假设),单侧检验 (例子),提出原假设: H0: 25 选择备择假设: H1: : 25,学生中经常上网的人数超过25%吗?(属于研究中的假设,先提出备择假设),单侧检验 (例子),单侧检验 (显著性水平与拒绝域 ),左侧检验 (显著性水平与拒绝域 ),左侧检验 (显著性水平与拒绝域 ),右侧检验 (显著性水平与拒绝域 ),右侧检验 (显著性水平与拒绝域 ),第二节 一个正态总体的参数检验,一. 总体方差已知时的均值检验 二. 总体方差未知时的均值检验 三. 总体比例的假设检验,一个总体的检验,检验的步骤,
10、陈述原假设 H0 陈述备择假设 H1 选择显著性水平 选择检验统计量 选择n, 给出临界值 搜集数据 计算检验统计量 进行统计决策 表述决策结果,总体方差已知时的均值检验 (双尾 Z 检验),一个总体的检验,均值的双尾 Z 检验 (2 已知),1. 假定条件 总体服从正态分布 若不服从正态分布, 可用正态分布来近似(n30) 2. 原假设为:H0: =0;备择假设为:H1: 0 使用z-统计量,均值的双尾 Z 检验 (实例),【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为= 0.025 。今换一种新机床进行加工,抽取
11、n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(0.05),均值的双尾 Z 检验 (计算结果),H0: = 0.081 H1: 0.081 = 0.05 n = 200 临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,总体方差已知时的均值检验 (单尾 Z 检验),均值的单尾 Z 检验 (2 已知),假定条件 总体服从正态分布 若不服从正态分布,可以用正态分布来近似 (n30) 2. 备择假设有符号 3. 使用z-统计量,均值的单尾 Z 检验 (提出假设),均值的单尾Z检验
12、(实例),【例】某批发商欲从生产厂家购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为20小时。在总体中随机抽取100只灯泡,测得样本均值为960小时。批发商是否应该购买这批灯泡? (0.05),均值的单尾Z检验 (计算结果),H0: 1000 H1: 1000 = 0.05 n = 100 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命低于1000小时,决策:,结论:,均值的单尾Z检验 (实例),【例】根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布N(1020,1002)。现从最近生
13、产的一批产品中随机抽取16只,测得样本平均寿命为1080小时。试在0.05的显著性水平下判断这批产品的使用寿命是否有显著提高?(0.05),均值的单尾Z检验 (计算结果),H0: 1020 H1: 1020 = 0.05 n = 16 临界值(s):,检验统计量:,在 = 0.05的水平上拒绝H0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,总体方差未知时的均值检验 (双尾 t 检验),一个总体的检验,均值的双尾 t 检验 (2 未知),1. 假定条件 总体为正态分布 如果不是正态分布, 只有轻微偏斜和大样本 (n 30)条件下 2. 使用t 统计量,均值的双尾 t 检验 (实例)
14、,【例】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?,均值的双尾 t 检验 (计算结果),H0: = 1000 H1: 1000 = 0.05 df = 9 - 1 = 8 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明这天自动包装机工作正常,决策:,结论:,总体方差未知时的均值检验 (单尾 t 检验),均值的单尾 t 检验 (实例),【例】一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽
15、车重量和正常行驶条件下大于40000公里,对一个由20个轮胎组成的随机样本作了试验,测得平均值为41000公里,标准差为5000公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?( = 0.05),均值的单尾 t 检验 (计算结果),H0: 40000 H1: 40000 = 0.05 df = 20 - 1 = 19 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明轮胎使用寿命显著地大于40000公里,决策:,结论:,总体比例的假设检验 (Z 检验),适用的数据类型,离散数据,连续数据,数值型数据,数 据,品质数
16、据,一个总体的检验,一个总体比例的 Z 检验,假定条件 有两类结果 总体服从二项分布 可用正态分布来近似 比例检验的 z 统计量,P0为假设的总体比例,一个总体比例的 Z 检验 (实例),【例】某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信? ( = 0.05),一个样本比例的 Z 检验 (结果),H0: p = 0.3 H1: p 0.3 = 0.05 n = 200 临界值(s):,检验统计量:,在 = 0.05的水平上接受H0,有证据表明研究者的估计可信,决策:,结论:,总体方差的检验 (2 检验),一个总体的检验
17、,方差的卡方 (2) 检验,1. 检验一个总体的方差或标准差 2. 假设总体近似服从正态分布 3. 原假设为 H0: 2 = 02 4. 检验统计量,卡方 (2)检验 实例,【例】根据长期正常生产的资料可知,某厂所产维尼纶的纤度服从正态分布,其方差为0.0025。现从某日产品中随机抽取20根,测得样本方差为0.0042。试判断该日纤度的波动与平日有无显著差异?(=0.05 ),卡方 (2) 检验 计算结果,H0: 2 = 0.0025 H1: 2 0.0025 = 0.05 df = 20 - 1 = 19 临界值(s):,统计量:,在 = 0.05的水平上接受H0,有证据表明该日纤度的波动比
18、平时没有显著差异,决策:,结论:,第三节 两个正态总体的参数检验,一. 两个总体参数之差的抽样分布 两个总体均值之差的检验 假设检验中相关样本的利用 两个总体比例之差的检验,两个正态总体的参数检验,两个独立样本的均值检验,两个独立样本之差的抽样分布,两个总体均值之差的Z检验 (12、 22 已知),1. 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 原假设:H0: 1- 2 =0;备择假设:H1: 1- 2 0 检验统计量为,两个总体均值之差的Z检验 (假设的形式),两个总体均值之差的Z检验 (例子),【例】有两种方法
19、可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2= 50公斤,x1= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05),两个总体均值之差的Z检验 (计算结果),H0: 1- 2 = 0 H1: 1- 2 0 = 0.05 n1 = 32,n2 = 40 临界值(s):,检验统计量:,决策:,结论:,拒绝H0,有证据表明两种方法生产的产品其抗拉强度有显著差异,两个总体均值之差的 t 检
20、验 (12、 22未知),检验具有等方差的两个总体的均值 假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等12 = 22 检验统计量,其中:,两个总体均值之差的 t 检验 (例子),【例】一个车间研究用两种不同的工艺组装某种产品所用的时间是否相同。让一个组的10名工人用第一种工艺组装该产品,平均所需时间为26.1分钟,样本标准差为12分钟;另一组8名工人用第二种工艺组装,平均所需时间为17.6分钟,样本标准差为10.5分钟。已知用两种工艺组装产品所用时间服从正态分布,且s12s22 。试问能否认为用第二种方法组装比用第一中方法组装更好?( = 0.05),两个总
21、体均值之差的 t 检验 (计算结果),H0: 1- 2 0 H1: 1- 2 0 = 0.05 n1 = 10,n2 = 8 临界值(s):,检验统计量:,决策:,结论:,接受H0,没有证据表明用第二种方法组装更好,两个相关(配对或匹配)样本的均值检验,假设检验中相关样本的利用,两个总体均值之差的检验 (配对样本的 t 检验),1. 检验两个相关总体的均值 配对或匹配 重复测量 (前/后) 2. 利用相关样本可消除项目间的方差 3. 假定条件 两个总体都服从正态分布 如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 ),配对样本的 t 检验 (假设的形式),注:Di = X
22、1i - X2i ,对第 i 对观察值,配对样本的 t 检验 (数据形式),配对样本的 t 检验 (检验统计量),样本均值,样本标准差,自由度df nD - 1,统计量,【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5公斤以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:,配对样本的 t 检验 (例子),在 = 0.05的显著性水平下,调查结果是否支持该俱乐部的声称?,属于检验某项声明的假设!,配对样本的 t 检验 (计算表),配对样本的 t 检验 (计算结果),样本均值,样本标准差,H0: m1 m2 8.5 H
23、1: m1 m2 8.5 a = 0.05 df = 10 - 1 = 9 临界值(s):,检验统计量:,决策:,结论:,接受H0,有证据表明该俱乐部的宣称是可信的,配对样本的 t 检验 (计算结果),两个总体比例之差的检验 (Z 检验),经济、管理类 基础课程统计学,1. 假定条件 两个总体是独立的 两个总体都服从二项分布 可以用正态分布来近似 检验统计量,两个总体比例之差的Z检验,两个总体比例之差的检验 (假设的形式),两个总体比例之差的Z检验 (例子),【例】对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查60人,18人参加技术培训。乙厂调查40人,14人参加技
24、术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?( = 0.05),两个总体比例之差的Z检验 (计算结果),H0: P1- P2 0 H1: P1- P2 0 = 0.05 n1 = 60,n2 = 40 临界值(s):,检验统计量:,决策:,结论:,接受H0,没有证据表明乙厂工人参加技术培训的人数比例高于甲厂,第四节 假设检验中的其他问题,一. 用置信区间进行检验 利用P - 值进行检验,利用置信区间进行假设检验,利用置信区间进行假设检验 (双侧检验),求出双侧检验均值的置信区间,2已知时:,2未知时:,若总体的假设值0在置信区间外,拒绝H0,利用置信区间进行假设检验
25、 (左侧检验),求出单边置信下限,若总体的假设值0小于单边置信下限,拒绝H0,利用置信区间进行假设检验 (右侧检验),求出单边置信上限,若总体的假设值0大于单边置信上限,拒绝H0,利用置信区间进行假设检验 (例子),【例】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?( = 0.05),属于决策的假设!,香脆蛋卷,利用置信区间进行假设检验 (计算结果),H0: = 1000 H1: 1000 = 0.05 n = 49 临界值(s):,置信区间为,决策:,结
26、论:,假设的0 =1000在置信区间内,接受H0,表明这批产品的包装重量合格,利用 P-值进行假设检验,观察到的显著性水平 P-值,什么是 P 值? (P-Value),是一个概率值 如果我们假设原假设为真,P-值是观测到的样本均值不同于(实测值的概率 左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积 右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积 被称为观察到的(或实测的)显著性水平 H0 能被拒绝的的最小值,利用 P 值进行决策,单侧检验 若p-值 ,不能拒绝 H0 若p-值 , 拒绝 H0 双侧检验 若p-值 /2, 不能拒绝 H0 若p-值 /2, 拒绝 H0,双尾
27、Z 检验 (P-值计算实例),【例】欣欣儿童食品厂生产的盒装儿童食品每盒的标准重量为368克。现从某天生产的一批食品中随机抽取25盒进行检查,测得每盒的平均重量为x = 372.5克。企业规定每盒重量的标准差为15克。确定P - 值。,双尾 Z 检验 (P-值计算结果),双尾 Z 检验 (P-值计算结果),双尾 Z 检验 (P-值计算结果),双尾 Z 检验 (P-值计算结果),双尾 Z 检验 (P-值计算结果),双尾 Z 检验 (P-值计算结果),双尾 Z 检验 (P-值计算结果),单尾 Z 检验 (P-值计算结果),【例】欣欣儿童食品厂生产的某种盒装儿童食品,规定每盒的重量不低于368克。现
28、从某天生产的一批食品中随机抽取25盒进行检查,测得每盒的平均重量为x=372.5克。企业规定每盒重量的标准差为15克。确定P-值。,单尾 Z 检验 (P-值计算结果),样本统计量的Z值,计算的检验统计量为:,双尾 Z 检验 (P-值计算结果),单尾 Z 检验 (P-值计算结果),p-值为 P(Z 1.50),样本统计量的Z值,用备择假设找出方向,单尾 Z 检验 (P-值计算结果),p-值为 P(Z 1.50),样本统计量的Z值,用备择假设找出方向,从Z分布表:查找1.50,单尾 Z 检验 (P-值计算结果),p-值为 P(Z 1.50),样本统计量的Z值,用备择假设找出方向,从Z分布表:查找1.50,0.5000-0.43320.0668,单尾 Z 检验 (P-值计算结果),p-值为 P(Z 1.50)=.0668,样本统计量的Z值,用备择假设找出方向,从Z分布表:查找1.50,0.5000-0.43320.0668,单尾 Z 检验 (P-值计算结果),单尾 Z 检验 (P-值计算结果),检验统计量未在拒绝区域,(p-值 =0 .0668) ( = .05),不能拒绝H0,本章小节,1. 假设检验的概念和类型 2. 假设检验的过程 基于一个样本的假设检验问题 4. 基于两个样本的假设检验问题 5. 利用置信区间进行假设检验 6. 利用p - 值进行假设检验,结 束,