1、医学统计学,第七章 t 检验,第一节 t 检验,假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同; 医疗卫生实践中最常见的是计量资料两组比较的问题,如两种疗法治疗糖尿病的疗效比较; t检验 (one-sample t-test) 是用于计量资料两组比较的最常用的假设检验方法。, 25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(mmol/L) 问两种疗法治疗后患者血糖值是否相同?,药物治疗,药物治疗合并饮食疗法,1,2,n1=12,=15.21,=10.85,n2=13,甲组,乙组,总体,样
2、本,?,推 断,t分布t 值与t分布的引入,X,0,N(,2),N(0,1),样本均数正态分布,观察值正态分布,t分布,标准正态分布,S代替,一、单个样本t 检验,又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数0的比较,比较目的是检验样本均数所代表的总体均数是否与已知总体均数0有差别。 已知总体均数0一般为标准值、理论值或经大量观察得到的较稳定的指标值。 单样t检验的应用条件是总体标准未知的小样本资料( 如n50),且服从正态分布。,1.单个样本 t 检验原理,已知总体,0,未知总体,样本,在 H0 : =0的假定下,可以认为样本是从已知总体中抽取的,
3、根据t分布的原理,单个样本t检验的公式为:,n-1,One sample t test,2.实例分析,例7-1 以往通过大规模调查已知某地新生儿出生体重为3.30kg.从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿体重不同? 本例已知总体均数0=3.30kg,但总体标准差未知,n=35为小样本, S=0.40kg,故选用单样本t检验。,One sample t test,3.检验步骤,(1) 建立检验假设,确定检验水准 H0:0,该地难产儿与一般新生儿平均出生体重相同; H1:0,该地难产儿与一般新生儿平均
4、出生体重不同; 0.05。 (2)计算检验统计量在=0成立的前提条件下,计算统计量为:,One sample t test,(3)根据P值,做出推断结论查附表2,得t0.05/2,34=2.032。因为t t0.05/2,34,故P0.05,表明差异无统计学意义,按 0.05水准不拒绝H0,根据现有样本信息,尚不能认为该地难产儿与一般新生儿平均出生体重不同。,One sample t test,二、配对样本均数t检验,配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是
5、否有差别。 配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。,应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率。 配对设计处理分配方式主要有两种情况: 异源配对:将两个同质受试对象配对分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别、年龄相近及病情相同的病人配成一对。 同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理。,Paired t test,1.配对样本均数t 检验原理,配对设计的资料具有对子内数据一一对应的特征,研究者关心是对子的效应差值。 配对样本t检验
6、的基本原理是假设两种处理的效应相同,理论上差值d 的总体均数d 为 0,现有的不等于0差值样本均数可以来自d = 0的总体,也可以来d 0的总体。,Paired t test,可将该检验理解为差值样本均数与已知总体均数d(d = 0)比较的单样本t检验.其检验统计量为:式中d为每对数据的差值,为差值样本的均数,Sd 为差值样本的标准差,即差值样本的标准误,n为配对样本的对子数。,Paired t test,2.实例分析,例7-2 某项研究评估咖啡因对运动者的心肌血流量的影响,先后测定了12名男性志愿者饮用咖啡前后运动状态下的心肌血流量(ml/min/g),数据如表7-1所示,问饮用咖啡前后运动
7、者的心肌血流量有无差异。,Paired t test,Paired t test,3.检验步骤,(1)建立检验假设,确定检验水准H0:d=0,饮用咖啡前后运动者的平均心肌血流量差异为零;H1:d0,饮用咖啡前后运动者的平均心肌血流量差异不为零;0.05(2)计算检验统计量 本例:,Paired t test,计算差值均数:计算差值标准差:计算差值的标准误:计算t值得:,Paired t test,(3)根据P 值,作出推断结论查附表2,t0.05/2,11 = 2.201,t t0.05,11,P 0.05,差别有统计学意义,拒绝H0,接受H1,可以认为饮用咖啡前后运动者的心肌血流量存在差异。
8、,Paired t test,三、两独立样本t 检验,两独立样本t检验(two-sample t-test),又称成组 t 检验。适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。 完全随机设计是将受试对象随机分配到两组中,每组患者分别接受不同的处理,分析比较处理的效应。,1.基本原理,两独立样本t检验的检验假设是两总体均数相等,即H0:1=2,也可表述为1-2=0,这里可将两样本均数的差值看成一个变量样本, 在H0条件下两独立样本均数t检验可视为样本与已知总体均数1-2=0的单样本t 检验, 统计量计算公式为,Two sample t-test,其中,Two
9、sample t-test,Sc2称为合并方差(combined/pooled variance),上述公式可用于已知两样本观察值原始资料时计算,当两样本标准差S1和S2已知时,合并方差Sc2为:,Two sample t-test,2.实例分析,例7-3 某项研究评估低氧环境(模拟高原环境)对运动者的心肌血流量的影响,将17名男性志愿者随机分成两组,分别在正常含氧环境(正常组)和低氧环境(低氧组)中测定运动后的心肌血流量(ml/min/g),数据如表7-2所示,问两种环境中运动者的心肌血流量有无差异。,Two sample t-test,Two sample t-test,3.检验步骤,建立
10、检验假设,确定检验水准 H0:1=2,两种环境中运动者的心肌血流量的总体均数相同; H1:12,两种环境中运动者的心肌血流量的总体均数不同; 0.05。计算检验统计量,Two sample t-test,由原始数据得:代入公式得:得出统计量t 值:,Two sample t-test,查t界值表,t0.05/2,15=2.131, t t0.05/2,(15),P 0.05,按0.05的水准拒绝H0,接受H1,差异具有统计学意义。故可认为该地两种疗法治疗糖尿病患者二个月后测得的空腹血糖值的均数不同。 几何均数资料 t 检验,服从对数正态分布,先作对数变换,再作 t 检验。,Two sample
11、 t-test,4. t 检验应用条件,样本对总体有较好代表性,对比组间有较好组间均衡性随机抽样和随机分组。 样本来自正态分布总体,配对t检验要求差值服从正态分布,实际应用时单峰对称分布也可以。 两独立样本均数t检验要求方差齐性两组总体方差相等。大样本时,用z 检验不要求正态和方差齐性。,Two sample t-test,第二节 方差不齐时两样本均数检验,一、两样本方差齐性检验 在正态分布情况下,检验统计量F值按下列公式计算 为较大的样本方差, 为较小的样本方差;若样本方差的不同仅为抽样误差的影响,F值一般不会偏离1太远。查附表3(方差齐性检验用的F界值表)可得P值。,n-1, 2= n-1
12、,例7-4 两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠体重增加量(g)如表7-3所示,问两组动物体重增加量的均数是否相等?,H0:1222,即高蛋白与低蛋白饲料喂养后小白鼠体重增加量的总体方差相同; H1:1222,即高蛋白与低蛋白饲料喂养后小白鼠体重增加量的总体方差不同; 0.05。计算检验统计量,对表的数据计算可得:,按公式计算确定P值,作出统计推论。查附表3的F界值表, F0.05(11,12) 3.34 ,F F0.05(11,12) ,P 0.05,认为两组体重增加量的总体方差不等。,二、 检验,当两总体方差不等(方差不齐)时,两独立样本均数的比较,可采用 检验,主要有S
13、atterthwaite法近似t检验、Welch法近似t检验和Cochran & Cox法近似t检验。其中Cochran & Cox法是对临界值校正 ;而Satterthwaite法和Welch法是对自由度进行校正。,检验的统计量的计算公式为Cochran & Cox法校正临界值 的公式为式中 ,,t-test,Satterthwaite法是统计软件中普遍使用的方法,其自由度校正公式为 根据自由度查t界值表,作出推断结论。,t-test,对例7-4资料进行检验 H0:12,即两种饲料小白鼠增重总体均数相同; H1:12,即两种饲料小白鼠增重总体均数不相同; 0.05 两总体方差不同,应选用t
14、检验,t-test,确定P值,作出推断结论 按Satterthwaite法计算校正自由度,得 查t界值表得t0.05,122.179, t t0.05,12, P 0.05 ,差异有统计学意义,可认为两种饲料饲养后小白鼠增重的均数不同。,t-test,按Cochran & Cox法计算校正界值,先查t界值表 得t0.05,112.201,t0.05,122.179,再按公式计算, P 0.05,结论同前。,t-test,第三节 t 检验中的注意事项,1. 假设检验结论正确的前提 2. 检验方法的选用及其适用条件3. 双侧检验与单侧检验的选择 4. 假设检验的结论不能绝对化5. 正确理解P值的统
15、计意义6. 假设检验和可信区间的关系,第四节 假设检验中两类错误,假设检验是针对H0,利用小概率事件的原理对总体参数做出统计推论。无论拒绝H0还是接受H0,都可能犯错误。,检验效能(power of a test),也称把握度,表示当两总体确实有差别时,按规定的检验水准能发现其差别的能力。给定的检验水准值越小,出现类错误的概率越大,反之亦然。若要同时减小 和 ,可以通过增加样本量的方法实现。,小 结,1. t 检验是计量资料两均数比较的一种假设检验方法,包括单样本均数的t 检验、配对样本均数的t 检验、两独立样本均数的t 检验。2. t 检验要求资料服从正态分布,且两总体方差相等。若两总体方差不等,可采用数据变换或 检验,也可以采用第十章的秩转换的非参数检验方法。,3.由两样本方差推断两总体方差是否相同的检验方法可用F 检验。4.假设检验能够说明组间是否具有差别,而可信区间则能够说明差别有多大,帮助判断结果是否具有实际意义。两者可以结合使用。5.检验效能是一个重要的概念,表示当两总体确实有差别时,按规定的检验水准能发现其差别的能力,增加样本量可以提高检验效能。,(陈永省),