1、5 假设检验,【例5-1】 某一般中学男生的心率平均值0=75次/分,标准差=5.0次/分(大规模调查获得);我们通 过抽样调查,获得经常参加体育锻炼的某中学100名男生的心率平均值为 ;问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?,未知总体,第二种可能性:,已知总体,样本均数与拟比较的总体均数不等有两种可能:,抽样误差,本质差异运动的影响,n=100,第一种可能性:,解析:(1)抽样误差(2)环境因素上述两种可能是对立的,互不相容的,事实上只能是其中的一个,如何进行判断呢?我们可通过假设检验来回答这个问题。,5.1 假设检验的基本思想,无罪假设,无差异假设,统计推断,刑事诉讼,作
2、检验,学术上:唯证据原则反证法,找证据,基本思路:首先假定该样本来自的总体就是已知总体,即0,然后根据样本统计量的特征,找出它取样于或不取样于总体0的证据, 从而取得间接的判断。,H0:零假设,t 界值,-t 界值,根据P 值,得出结论,H1:备择假设,验证假设,建立假设,下结论,预设 =0.05,P 值,假设检验的小概率事件原则和检验水准 ,小概率事件(0.05 or 0.01),检验水准 (level of test),:假设检验中,定义发生概率 的事件叫小概率事件,并称为检验水准,一般取0.05。故对于H0 为真而言,检验统计量超过对应的临界值的概率P,对于一次随机抽样而言,一般是不会发
3、生的,所以如果出现这种情况,可以凭此作出拒绝H0的决策。,假设检验中的 P 值,:所谓P 值,由H0所规定的总体中作一次随机抽样,获得依据现有样本获得的检验统计量的概率,也即是H0成立的概率。 换言之,是指在H0 成立的前提下,出现统计量目前值及更不利于零假设数值的概率。,假设检验中的 P 值,-t 界值,t 界值,假设检验 (hypothesis test) 的概念: 亦称显著性检验(significance test),是依据样本提供的有限信息对总体作推断的统计学方法,是在对研究总体的两种对立的判断 之间做选择的决策程序。,选用适当方法根据样本对总体提供的信息作检验,对总体的参数或分布作出
4、某种假设,推断此假设应当拒绝或不拒绝,提出假设,验证假设,得出结论,5.2 假设检验的步骤,一、 对立假设、确定检验水准:,根据资料类型,选择检验方法; 2. 根据实际情况、确定单、双侧检验 3. 建立假设H0、H1 4. 确定检验水准,1. 明确资料类型、选择检验方法:,假设检验的方法很多,如t 检验、F 检验及 检验等,各有其适用条件和范围。应根据研究目的、设计类型和资料特点等因素选择合适的检验方法,并计算出对应统计量。,3. 根据数据特征和专业知识,确定单、双侧,t 临界值,- t 临界值,问:经常参加锻炼的男生与一般男生心率有何不同?,双侧检验:用于推断两总体有无差别时,对两总体间可能
5、存在的两种位置关系均要考虑在内。,t 临界值,问:经常参加锻炼的男生是否低于一般男生的?,2. 单侧检验:用于推断两总体有无差别时,仅考虑两总体间可能存在的两种位置关系的一种。,一般情况下,如结果不明确时,采用双侧假设 H1: 某一数值,如 0(双侧,包括 0和 0 两方面),如果从专业上能肯定其中一侧是不可能的,则采用单侧对立假设H1: 某一数值;如 0 (左单侧) H1: 某一数值;如 0 (右单侧),单侧、双侧检验的确定原则及描述方法:,3. 建立假设:提出无效假设和备择假设, 什么是零假设 (Null Hypothesis) ?,(1)一般是作没有差别的假设,又称“原假设”或“无效假设
6、” ,表示为 H0,即H0: = 某一数值,如 = 0 (2) 该假设将差异的原因归结为抽样误差, 什么是备择假设 (Alternative Hypothesis) ?,(1)与无效假设相对立有差别的假设,由不等号 , 或 组成,常表示为 H1;即H1: 某一数值;或 某一数值, 某一数值。(2) 该假设将差异的原因归结为环境因素,或是一种本质差异。,4. 确定检验水准 ,又称显著性水准,是判断应当拒绝或不拒绝H0 的水准。它规定什么是“不大可能”,规定概率不超过的事件就是小概率事件,依据的是 “小概率事件在一次随机试验中不大可能发生”的理论。,由研究者事先确定。 表示为 ,常用的 值有0.0
7、1、0.05; 是一个概率值,假设原假设为真时,拒绝原假设的概率,又被称为抽样分布的拒绝域。,注意:,二、 计算检验统计量:,检验统计量:属于样本指标,用来反应样本信息,用于计算“H0 成立”的概率P,从而抉择是否要拒绝H0。,各检验方法都有其相应的检验统计量,不同的检验统计量通常都依据于其特定的抽样分布。,举例:,三 、确定 p 值,P 值意义是:由 H0所规定的总体中作随机抽样,获得依据现有样本获得的检验统计量的概率,也即是H0成立的概率。换言之,在H0成立的前提下,统计量获得现有数值以及更不利于H0的可能性(概率)有多大。,指对 “ 假设的H0 是否真实” 作出判断的过程。即:比较 p
8、值和检验水准,得出拒绝或不拒绝无效假设的结论。,四 、做出推断结论,在两个对立的检验假设间二取一的规则是: (1)若 P ,意味着在H0成立的前提下不大可能发生当前,或是更不利的状况 拒绝 (2)若 P ,意味着在H0成立的前提下,发生当前状况或是更不利的状况的可能性还是比较大的 不拒绝,95%,t 分布图,5 假设检验,H0:零假设,t 界值,-t 界值,根据P 值,得出结论,H1:备择假设,验证假设,建立假设,下结论,预设 =0.05,P 值,5.3 单组样本资料的假设检验,某一般中学男生的心率平均值0=75次/分,标准差=5.0次/分(大规模调查获得);我们通过抽样调查,获得经常参加体育
9、锻炼的某中学100名男生的心率平均值为 ;问:经常参加体育锻炼的男生心率是否与一般中学男生的不同?,【例5-1】:,【案例解析】,首先考虑对原始数据进行正态性检验:结果表明,该样本所属总体来自正态分布。 2. 再者已知,故考虑用 Z 检验。 3. Z 检验统计量:,资料类型:定量资料设计类型:单样本,统计结论:已知 Z(0.05/2)=1.96,则 P 0.05 ,故拒绝H0,接受 H1 ,认为 与0的差别有统计学意义,可认为经常参加锻炼的中学男生人群的心率低于一般人群的心率。 专业结论:经常参加体育锻炼有助于增强男生的心功能。,检验过程:,1. 建立假设:,确定检验水平:,2. 计算检验统计
10、量:,3. 确定 p 值,作出推断结论:,某药物100mg溶解在1L溶剂中,溶解后的标准浓度是20.00mg/L。现采用某种测定方法进行溶解实验,重复实验11次获得的药物浓度分别为:20.99、20.41、20.10、21.11。请问:用该种方法测得的药物浓度与标准浓度20.0mg/l是否相同?,【案例5.2】,【案例解析】 资料类型:定量资料 设计类型:单样本首先考虑对原始数据进行正态性检验:结果表明,该样本所属总体来自正态分布。另外总体未知,样本含量 n =11较小,所以考虑用 t 检验。,t的检验统计量为:,检验过程:,1. 建立假设:,确定检验水平:,2. 计算检验统计量:,3. 确定
11、 p 值,作出推断结论:,统计结论:查t 界值表,得t (0.05/2,10) =2.228,按0.05 检验水准,拒绝H0,接受H1;认为这种方法测得的药物浓度与标准浓度不同。 专业结论:该方法测得的药物总体平均浓度高于标准,该方法的效果欠佳。,【电脑实现】 SPSS,正态性检验:,【电脑实现】 SPSS,样本的正态性检验:,【电脑实现】 SPSS,单组样本均数t 检验:,结果输出:,【结果报告】,单组样本的假设检验,主要报告以下内容:样本基本统计描述;假设检验的目的和实验设计方法;假设检验方法、单侧或双侧检验、检验水准、检验统计量及其P值总体参数的95%置信区间,变量变换 或秩和检验,单样
12、本定量资料要依据不同的前题条件选择适当的假设检验方法。,总体标准差已知时或 未知但 n 较大(如n50),未知,n较小(n50),且 样本来自正态分布的总体,t 检验,样本例数 n50且样 本来自偏态分布总体,变量变换或秩和检验,两 独 立 样 本,假设检验,单 样 本,配对资料,差值,正态,偏态,对子数,t 检验,n 50,正态,偏态,n 50,方差齐,t 检验,方差不齐,方差齐,变量变换或秩和检验,t 检验,5.4 假设检验的两类错误,假设检验是统计推的重要内容,它是应用数学上的反证法和小概率事件实际推断原则,根据样本 统计量对总体作出推断,结论具有概率性。,结论的风险性两类错误,I 类错
13、误 ( type I error ):,I 类 错误示意图(以单侧 t 检验为例),误诊 (假阳性),实事:H0 为真,II型错误示意图(以单侧 t 检验为例),漏诊 (假阴性),II 类错误 ( type II error ):,实事:H0 为假, H1 为真,假设检验中的两类错误:,1. 第一类错误(弃真错误) 拒绝了实际上存在的H0 第一类错误的概率为 ,2. 第二类错误(纳伪错误) 不拒绝实际上不存在的H0 第二类错误的概率为 ,定义:通常把1-,即拒绝不正确H0的概率称为检验功效,也称把握度。意义是:当两个总体确有差别时,按所规定的检验水准的水平,能发现这种差异的能力。 如1-=0.
14、80,理论上100次抽样检验中,平均有80次能够得出差别有统计学意义的结论。 一般情况下要求1-在0.80以上。,5.4.3 检验功效(power of test),由于所建立的检验主要是控制犯I类错误的概率,而对犯II类错误的概率却无法直接控制,即对一个检验犯II类错误的概率究竟怎样无所而知。,要谨慎对待 “不拒绝H0”的结论 即“阴性结果”,“阴性”极可能是 II类错误的概率 过高,或说检验功效(Power) 1- 过低,出现的假阴性结果。,某研究者对“中华医学杂志”、“中华血液学杂志”、“中华儿科杂志”、“解放军医学杂志”、“中华传染病杂志”的317篇研究报告中的641个阴性结论作Pow
15、er分析,结果发现17.0%的阴性结果可靠、3.7%基本可靠,3.6%基本不可靠,75.7%不可靠。 国外Friedman等对Power低于0.9的65个阴性结果重新将Power值提高到0.9,发现70%的阴性结果可转为阳性结论。,因此,Power值的大小已成为某些国际会议审查论文设计内容之一;有的已明确规定,若研究者根据P0.05下阴性结论时,必须提供Power值。,检验水准定的越大 总体参数间的差异越大个体差异(标准差)越小 样本含量越大,5.4.4 影响检验功效的因素:,检验功效越大,1. 越大, 越小,则Power越大,只有通过增加样本含量,你才可能同时减少两类错误!,样本含量一定时,
16、和的关系就像翘翘板,小就大, 大 就小。,当样本量取定时,要减小 b ,应把a 取大一些,2. 总体参数间的差异越大,Power越大,3. 个体差异越小,Power越大,4. 若两样本总体确有差异时, 在一定范 围内,样本含量n 越大,Power越大。,通过增大n的方法,达到增大Power的目的,检验功效/样本含量估算常用软件:,SASnQuery AdvisorEGRET SIZSample powerSASAPASSEXCEL,PASS (power analysis and sample size) 是Jerry开发的专业样本含量估算和效能分析软件。 PASS可以对均数间的比较、方差分析
17、、相关和回归分析、计数资料的假设检验和病例随访资料分析等检验条件下的检验效能和样本含量进行估计。,小 结,假设检验是依据样本提供的有限信息对总体做推断的过程。 假设检验的步骤为:建立假设计算统计量确定p值,作出推断结论 假设检验的基本思想是根据小概率的原理,认为“小概率事件在一次抽样中不太可能出现”。 假设检验中无论拒绝不拒绝H0,都有可能犯错误(类错误和类错误)。 假设检验的推断结果下结论时不能绝对化,并要结合专业知识。,步骤:,最佳选择题:,1.统计推断的内容是: A用样本指标推断总体指标 B检验统计上的“假设” CA、B均不是 DA、B均是,2.两样本比较时,分别取以下检验水准,下列何者
18、所取第二类错误最小: Aa=0.05 Ba=0.01 Ca=0.10 Da=0.20,3. 关于假设检验,下列那一项说法是正确的: A单侧检验优于双侧检验 B采用配对t检验还是两独立样本t 检验是由实验设计方法决定的 C检验结果若P值大于0.05,则接受H0犯错误的可能性很小 D用t 检验进行两样本总体均数比较时,不要求方差齐性,简答题:,1. 什么是一类错误?什么是二类错误?二者之间有什么关系?2. P 与有什么区别和联系?3.既然假设检验的结论有可能有错,为什么还要进行假设检验?,答案:,P值的大小和没有必然关系。,3. P是指H0成立的前提下,出现目前样本数据对应的统计量数值乃至比它更极端数值的概率。,是事先确定的检验水准。,4. 假设检验中,无论拒绝不拒绝H0,都可能会犯错误:表现为拒绝H0时,会犯第一类错误,不拒绝H0时,会犯第二类错误,但这并不能否认假设检验的作用。 . 因为只要涉及到抽样,就会有抽样误差的存在,因此就需要进行假设检验。 . 只是要注意假设检验的结论只是个概率性的结论,它的理论基础是“小概率事件不太可能原理”。 .,练习题:,提 问:,THANK YOU!,