1、2019/4/14,商学院 李丽明,1,第三讲 参数检验,2019/4/14,商学院 李丽明,2,第一节 假设检验的一般问题,1、假设检验的概念 2、假设检验的步骤 3、假设检验中的小概率原理 4、假设检验中的两类错误 5、双侧检验和单侧检验,2019/4/14,商学院 李丽明,3,假设检验是在两种互相对立的行动之间,通过对样本的试验,在一定的保证条件下进行决策的统计分析方法。,什么是假设检验?(hypothesis testing),2019/4/14,商学院 李丽明,4,一个例子,某茶叶厂生产袋装茶叶,正常情况下每袋茶叶净重平均为500克,标准差为13克。最近,厂质检部门接到消费者投诉,认
2、为该厂新投放市场的一批茶叶似乎普遍分量不足。为此,从生产线中随机抽取了40袋茶叶,测得其平均重量为495克,能否认为该厂最近生产的茶叶包装分量确实不足?(显著性水平=1%),2019/4/14,商学院 李丽明,5,假设检验的过程 (提出假设抽取样本作出决策),2019/4/14,商学院 李丽明,6,假设检验的步骤,提出原假设和备择假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策,2019/4/14,商学院 李丽明,7,提出原假设和备择假设, 什么是原假设?(Null Hypothesis) 1. 待检验的假设,(研究者想收集证据予以反对的假设)又称“零假设” 2.
3、如果错误地作出决策会导致一系列后果 3. 总是有等号 =, 或 4. 表示为 H0 H0: =某一数值 指定为 = , 或 例如, H0: =500(克),2019/4/14,商学院 李丽明,8, 什么是备择假设?(Alternative Hypothesis) 1. 与原假设对立的假设(研究者想收集证据予以支持的假设) 2. 总是有不等号: , 即 3. 表示为 H1 H1: 某一数值, 某一数值 例如, H1: 500 (克), 500(克),提出原假设和备择假设,2019/4/14,商学院 李丽明,9,确定适当的检验统计量, 什么检验统计量? 1.用于假设检验问题的统计量 2.选择统计量
4、的方法与参数估计相同,需考虑 是大样本还是小样本 总体方差已知还是未知 检验统计量的基本形式为,2019/4/14,商学院 李丽明,10,规定显著性水平, 什么显著性水平? 1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,2019/4/14,商学院 李丽明,11,作出统计决策,计算检验的统计量 根据给定的显著性水平 ,查表得出相应的临界值Z或 Z/2 将检验统计量的值与 水平的临界值进行比较 得出接受或拒绝原假设的结论,2019/4/14,商学院 李丽明,12,假设检验中的小概
5、率原理, 什么是小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定,2019/4/14,商学院 李丽明,13,假设检验中的两类错误 (决策风险),在对原假设的真伪作判断时,由于样本的随机性可能使决策发生下面两类错误: 第一类错误(弃真错误):原假设H0为真,但由于样本的随机性,使样本观测值落入拒绝域,所下的决策是拒绝H0 ,这类错误称为第一类错误,其发生的概率称为犯第一类错误的概率,也称为拒真概率。 第二类错误(取伪错误):原假设H0为假,但由于样本的随机性,使样本观测值落入接受域,所下的
6、决策为保留H0 ,这类错误称为第二类错误,其发生的概率称为犯第二类错误的概率,也称为取伪概率 。,2019/4/14,商学院 李丽明,14,提出假设 (例题分析),【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设。,解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为:H0 : H1 : ,2019/4/14,商学院 李丽明,15,提出假设 (例题分
7、析),【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为H0 : 500 H1 : 500,2019/4/14,商学院 李丽明,16,提出假设 (例题分析),【例】一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,解:研究者想收集证据予以支持的假设是“
8、该城市中家庭拥有汽车的比率超过30%”。建立的原假设和备择假设为H0 : 30% H1 : 30%,2019/4/14,商学院 李丽明,17,提出假设 (结论与建议),原假设和备择假设是一个完备事件组,而且相互对立 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),2019/4/14,商学院 李丽明,18,双侧检验与单侧检验 (假设的形式),2019/4/14,商学院 李丽明,19,显著性水平和拒绝域 (双侧检验 ),2019/4/14,商学院 李丽明
9、,20,显著性水平和拒绝域 (左侧检验 ),2019/4/14,商学院 李丽明,21,显著性水平和拒绝域 (右侧检验 ),2019/4/14,商学院 李丽明,22,决策规则,给定显著性水平 ,查表得出相应的临界值z 或 z/2 , t 或t/2 将检验统计量的值与 水平的临界值进行比较 作出决策 双侧检验:I统计量I 临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H0,2019/4/14,商学院 李丽明,23,利用 P 值 进行决策,2019/4/14,商学院 李丽明,24,利用 P-值进行假设检验,什么是 P 值?(P-Value),1、是一个概率值 2、如果我们假设原假设为真,P-值是观
10、测到的样本均值不同于(实测值的概率 左侧检验时,P-值为曲线上方小于等于检验统计量部分的面积 右侧检验时,P-值为曲线上方大于等于检验统计量部分的面积 3、被称为观察到的(或实测的)显著性水平 H0 能被拒绝的的最小值 4、决策规则:若p值 , 拒绝 H0,否则接受H0。,2019/4/14,商学院 李丽明,25,说明:,在SPSS软件中直接显示的是双侧检验的p-值为 Sig(2-tailed),而没有显示单侧检验的p-值,因此,得到的p-值要进行处理,处理的原则是: 单侧的P值=双侧的P值/2 因此,利用SPSS软件操作所得到的p-值,可按如下的结论来进行决策: 双侧检验 若p-值 ,不能拒
11、绝 H0,即接受H0 若p-值 拒绝 H0 单侧检验 若p=双侧的P值/2 , 不能拒绝 H0,即接受H0 若p=双侧的P值/2 , 拒绝 H0,2019/4/14,商学院 李丽明,26,假设检验步骤的总结,陈述原假设和备择假设 从所研究的总体中抽出一个随机样本 确定一个适当的检验统计量,并利用样本数据算出其具体数值 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域 将统计量的值与临界值进行比较,作出决策 统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P值作出决策,2019/4/14,商学院 李丽明,27,第二节 一个正态总体的参数检验,一、总体均值的检验 (大样本),2
12、019/4/14,商学院 李丽明,28,总体均值的检验(单样本T检验) (大样本),1.假定条件 正态总体或非正态总体大样本(n30) 使用z检验统计量 2 已知: 2 未知:,2019/4/14,商学院 李丽明,29,案例5-1,2019/4/14,商学院 李丽明,30,案例5-2,2019/4/14,商学院 李丽明,31,单个总体均值假设检验的SPSS操作,AnalyzeCompare Means One-Sample T Test,操作,2019/4/14,商学院 李丽明,32,两个正态总体的参数检验(两独立样本T检验),一、两个总体均值之差的检验(独立大样本),2019/4/14,商学
13、院 李丽明,33,两个总体均值之差的Z检验 (假设的形式),2019/4/14,商学院 李丽明,34,两个总体均值之差的检验 (独立大样本),1. 假定条件 两个样本是独立的随机样本 正态总体或非正态总体大样本(n130和 n230) 检验统计量 12 , 22 已知: 12 , 22 未知:,2019/4/14,商学院 李丽明,35,两个总体均值之差的检验 (独立小样本),假定条件 两个独立的小样本 两个总体都是正态分布 12, 22已知 检验统计量,2019/4/14,商学院 李丽明,36,两个总体均值之差的 t 检验 ( 12 、 22未知),检验具有等方差的两个总体的均值 假定条件 两
14、个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等 12 = 22 检验统计量,2019/4/14,商学院 李丽明,37,两个总体均值之差假设检验的SPSS操作,AnalyzeCompare Means Indendent-Sample T Test,操作,2019/4/14,商学院 李丽明,38,两个正态总体的均值比较问题,应用范围较广,例如: 1、两台设备生产的产品的某种性质 2、两批原料生产的产品某种效果 3、两种药品的疗效 4、两种训练方法的效果 5、两种激励方法的效果 6、两种组织方法的效果 7、两种(税收、投资等)政策效果等,2019/4/14,商学院 李丽明,3
15、9,案例5-3,双侧检验,P=0.0010.05,拒绝H0,,即认为本地户口和外地户口的家庭人均住房面积的平均值存在显著差异。,2019/4/14,商学院 李丽明,40,案例5-4,2019/4/14,商学院 李丽明,41,案例5-4,双侧检验,P=0.038=0.05,拒绝H0,,即认为全国性公司与外资和合资企业公司中受高等教育员工比例的均值存在显著差异.,2019/4/14,商学院 李丽明,42,两个配对样本总体均值之差假设检验的SPSS操作,AnalyzeCompare Means Paired-Sample T Test,操作,2019/4/14,商学院 李丽明,43,案例5-5,喝茶
16、前平均体重为89.25公斤,喝茶后平均体重为70.05公斤,双侧检验,P=0.000.05,拒绝H0,,即认为此减肥茶减肥有显著效果。,2019/4/14,商学院 李丽明,44,案例分析4:“多吃谷物,是否有助于减肥”,大多数科学家认为:食用含有高纤维的谷物有助于降低癌症发生的可能性。然而一个科学家指出,如果人们在早餐中食用含有高纤维的谷物,那么平均而言,与早餐没有食用谷物的人群相比,食用谷物者在午餐中摄取的热量(大卡)将会减少(Toronto Star 1991)。如果这个观点成立,谷物食品的生产商又将获得一个很好的机会,他们会宣传说:“多吃谷物吧,早上也吃,这样有助于减肥”。为了验证这个假
17、设,随机抽取了35人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为两类,一类为经常食用谷类食物者(总体1),一类为非经常食用谷物者(总体2)。然后测定每人午餐的大卡摄取量。得到数据结果为表1,试验证命题是:早期食用较多的谷类食物有助于减少午餐中热量的摄取。,2019/4/14,商学院 李丽明,45,35人大卡摄入量,表1,2019/4/14,商学院 李丽明,46,解:由于此命题是一个尚未被证实的命题,在单侧检验中,原假设对此类命题应此否定态度,故建立的假设为: H0: 1- 2 0 H1: 1- 2 0 SPPS的操作为: AnalyzeCompare Means Indendent
18、-Sample T Test,2019/4/14,商学院 李丽明,47,表2,表3,2019/4/14,商学院 李丽明,48,结果分析:,1、从表2中可知,经常食用谷物者,摄取大卡量平均为583,不经常食用谷物者,摄取大卡量平均为629.25,两个样本的平均水平不等,它们之间的差异是否可得出两总体的平均水平是否显著不同,我们还需看表3。 2、从表3可看到,F检验概率值P=0.6520.05,在两个总体方差齐性的前提下(Equal variances assumed),检验统计量t=-2.431,自由度df=33,两样本数据之差的标准误差=19.16,单侧P=0.022/2=0.0110.05,所以,拒绝H0,即认为该命题是正确的,即 “多吃谷物,有助于减肥”。,2019/4/14,商学院 李丽明,49,你学会了吗?,