1、医学统计学,李国春 医学博士,e-mail : Cell-phone: 13913841075,第5讲(上) t检验和u检验,(Medical statistics),Singapore College of TCM,2009.9,t test,单样本均数 t 检验 配对样本均数的t检验 两个独立样本均数的t 检验 正态性检验 两样本的方差齐性检验 两总体方差不等时均数比较的 检验 案例练习和思考小结,主要内容,-contents-,t 检验是假设检验中最见的一种方法,它是以t分布为基础。由于t分布的发现使得小样本统计推断成为可能,因而,它被认为是统计学发展史中的里程碑之一,在医学统计学中,
2、t检验是非常活跃的一类假设检验方法。,什么是t检验?,单样本t检验,配对样本t检验,两个独立样本t检验,同源配对,异源配对,t 检验的分类:,t 假设检验的应用条件:,(1)未知且n较小; (2)样本来自正态分布总体; (3)两样本均数比较时还要求所对应的两总体方差相等( 12 = 22 ),即方差齐性(Homogeneity of Variance); (4)独立性。,在实际应用中,与上述条件略有偏离,但对结果影响不大。,问题:已知,或n较大时,用什么检验?,z 检验,t 检验是根据t分布判断样本概率而进行的假设检验,而当样本量n很大时,t分布就接近标准正态分布,标准正态分布也称为u分布,而
3、国外教科书则称为Z分布,这时候根据u分布判断概率所进行的假设检验称为u检验。,应用条件: 已知或者未知且n足够大(如n100)。,复习,(1)样本均数与总体均数的比较,目的:推断该样本是否来自某已知总体;样本均数代表的总体均数与0是否相等。 总体均数0一般为理论值、标准值或经大量观察所得并为人们接受的公认值、习惯值。,未知总体,已知总体0,?,t 检验,例3.16 根据大量调查,已知健康成年男子听到最高声音频率的平均数为18000Hz。某医生随机抽查25名接触噪声作业的男性工人,测得可以听到的最高声音频率的均数为17200Hz,标准差为650Hz。试问能否认为接触噪声作业工人的听力水平与正常成
4、年男性的听力水平不同?,0=18000Hz 总体,健康成年男子,样本,接触噪声作业工人, 总体,=,未知总体,?,?,1、建立假设,确定检验水准。 H。(=。)接触噪声作业工人的听力水平与正常成年男性的听力水平相同。 H1 ( 。 )接触噪声作业工人的听力水平与正常成年男性的听力水平不同。=0.05,针 对 总 体,2、选定检验方法,计算检验统计量t值。,n =25 ,X=17200Hz,s =650Hz, 。=18000Hz,统计量t表示,在标准误的尺度下,样本均数与总体均数的偏离。这种偏离称为标准t离差(standard t deviation),假设检验步骤:,3、确定P值,作出推断结论
5、。,查t界值表双侧,0,t =6.154,现有统计量t=6.1542.797,P0.01。按=0.05水准,拒绝H。,接受H1,差异有统计学意义。结合本题 有理由认为接触噪声作业 的男性工人平均听力水平 低于正常成年男性。,-2.064,2.064,0, =24,0.025,0.025,t0.05,24=2.064 P =P ( |t| 2.064 )=0.05,P=P(|t|5.4545)0.05,思路解析:,0=18000Hz 总体,健康成年男子,样本, 总体,=,未知总体,0,0=18000Hz 总体,样本,假设该样本来自已知总体,0=18000Hz 总体,样本,这些样本是什么分布规律?
6、,这些样本是什么分布规律?,(1)这些样本的均数服从正态分布:,这里0=18000Hz,未知,因此这种正态分布往往是未知的,这样就没办法求目前手头这个样本( )在样本抽样分布中出现的概率就无法确认。即无法获得等于及大于(或等于及小于) 现有样本均数的 概率,也就无法 判断是否是小 概率。,?,只知道它服从正态分布,至于是什么样的正态分布,不清楚,这些样本的均数服从正态分布,但至于是什么样的正态分布,往往未知,这时我们不去追究,而是回避这个问题,采用t分布来解决。,(2)由这些样本的均数和标准差导出的新的统计量t服从的不是正态分布,而是t分布。,都是已知的,服从自由度为n-1的t分布,即v=25
7、-1=24的t分布。,t 仅分布与自由度有关,不同自由度下t界值对应的概率有差异,t 仅分布与自由度有关,P0.01,对这个样本是否来自这个总体产生了怀疑,因此从已知总体中抽样,获得这样的样本的概率太少了P0.01。从而认为这个样本很有可能来自于与已知总体有本质差别的另一总体。, 总体,u 检验,t 检验是根据t分布所进行的假设检验,而当样本量n很大时,t分布就接近标准正态分布,标准正态分布也称为u分布,而国外教科书则称为Z分析,这时候根据u分布所进行的假设检验称为u检验。,应用条件: 已知或者未知且n足够大(如n100)。,(n较大时),(。已知时),这些样本是什么分布规律?,这些样本的均数
8、服从正态分布:,。,它服从正态分布,至于是什么样的正态分布,是清楚的。,(。已知时),(n较大时),u 分布,例3.18 为了解医学院学生的心理健康状况,随机抽查某医科大学在校大学生210名,用SCL90症状自评量表进行测定,得出因子总分的均数为142.6,标准差为31.25。已知全国SCL90因子总分的均数(常模)为130。试问该医科大学在校学生的SCL90因子总分是否与全国水平相同?,0=130 总体,全国水平,样本,某医学大学在校学生, 总体,=,未知总体,?,?,(n较大时),u 分布,1、建立假设,确定检验水准。 H。(=。)该医科大学在校学生的SCL90因子总分与全国水平相同。 H
9、1 ( 。 )医科大学在校学生的SCL90因子总分与全国水平不同。=0.05,针 对 总 体,2、选定检验方法,计算检验统计量u值。,n =210100 ,X=142.6,s =31.25, 。=130,假设检验步骤:,3、确定P值,作出推断结论。,查u界值表双侧,即t界值表中v为时的一行,双侧:,0,u =5.843,现有统计量u=5.8432.58,P0.01。按=0.05水准,拒绝H。,接受H1,差异有统计学意义。结合本题 有理由认为医科大学在校 学生的SCL90因子总分与 全国水平不同。,(2)配对t检验,配对设计是研究者为了控制可能存在的主要的非处理因素而采用的一种实验设计方法。 配
10、对设计的形式,自身配对 同一对象接受两种处理,如同一标本用两种方法进行检验,同一患者接受两种处理方法; 异体配对 将条件相近的实验对象配对,并分别给予两种处理。,一般配对条件(异体配对),动物实验:同种、同品系、同性别、同体重、同窝别,临床实验:病种、病期、病情、病程、年龄与性别相同,配对设计注意事项:, 配对时应做到每个对子条件的齐同,齐同性要求为P0.20; 在慢性实验中,应保持配对因素的可比性,即实验全程配对因素应保持齐同; 在实际资料处理时,配对可能是成功的(属配对设计),也可能是不成功的,是完全随机设计。,设计模式:,研究 对象 N,合格 对象 Ne,组,组,D0,D1,C因素,T1
11、因素,统计分析,分组,施加因素,效应,配对P,随机R,若两处理因素的效应无差别,差值d的总体均数d应该为0,故可将该检验理解为样本均数与总体均数d =0的比较 差值均数的大小及其抽样误差反应因素的效应,配对设计t检验的思路:,例3.19 为研究某心理干预措施对抑郁症患者的疗效,对10名抑郁症患者于干预前、干预后分别进行生活满意度指数B(LSIB)的心理测试,结果如表3-7所示。问该干预措施是否有效?,1 2 3 4 5 6 7 8 9 10,编号 干预前 干预后 差值(d) d2,12 9 10 6 5 8 13 11 10 9,15 12 16 10 12 9 19 18 15 11,3 3
12、 6 4 7 1 6 7 5 2,9 9 36 16 49 1 36 49 25 4,合计 d=44 d2=234,表3-7 10抑郁症患者干预前后心理指标LSIB测试结果,d=0 总体, 总体,=,?,?,1、建立假设,确定检验水准。 H。(d =0) 干预措施实施前后无差别 H1 ( d 0 )干预措施实施前后有差别=0.05,针 对 总 体,2、选定检验方法,计算检验统计量t值。,n =10 ,d= d/n=44/10=4.4 ,,假设检验步骤:,3、确定P值,作出推断结论。,查t界值表双侧,0,t =6.563,现有统计量t=6.5633.250,P0.01。按=0.05水准,拒绝H。
13、,接受H1,差异有统计学意义。结合本题 有理由认为该项心理干预措 施对抑郁症患者有效。,(3)两组独立样本的t检验,有些研究的设计既不能自身配对,也不便异体配对,而只能把独立的两组相互比较。例如手术组与非手术组、新药组与对照组。两个样本均数比较的目的在于推断两个样本所代表的两总体均数1和2是否相等。,设计模式:,研究 对象 N,合格 对象 Ne,组,组,D0,D1,C因素,T1因素,统计分析,分组,施加因素,效应,亦称为成组比较,值得注意的是:两组必须具有可比性,即除了施加因素外,原则上要求其它方面两组间要齐同。否则两组间比较将失去意义。, 总体,2 总体,1 总体,=,?,样本1,样本2,两
14、个大样本均数比较。当样本含量较大(n50时),自由度足够大,可用u检验。,两个样本均数差值的标准误,例3.21 为评价交通污染对交通警察心理健康状况的影响,某医生随机抽取某市交警大队外勤警察212名(男性)作为暴露组,进行SCL90评定,测得均数为152.51,标准差为35.27。已知全国(男性,n=724)常模的均数为129.96,标准差为38.76。试问该市交警心理状况SCL90评分是否高于全国常模?,暴露组,对照组 或常模组,假设检验步骤: (1)、建立假设,确定检验水准。 H。(1=2)该市交警心理状况SCL90评分与全国常模相同 H1 ( 12 )该市交警心理状况SCL90评分高于全
15、国常模=0.05,针 对 总 体,(2)、选定检验方法,计算检验统计量u值。,n 1=212 ,X=152.51, s1 =35.27,n 2=724 ,X=129.96, s2 =38.76,(3)、确定P值,作出推断结论。,查u界值表双侧,即t界值表中v为时的一行,双侧:,0,u =8.001,现有统计量u=8.0012.58,P0.01。按=0.05水准,拒绝H。,接受H1,差异有统计学意义。结合本题 有理由认为该市交警心理 状况SCL90评分高于全国 常模。,两样本所属总体方差相等,如果两总体为正态分布,分别记为N(1,2)和( 2,2 ),检验假设为,H0:1=2,H1: 1 2,
16、t(n1+n2-2)分布,两样本之差标准误,两样本合并方差,时,当,例6-4 某口腔科测得长春市1316岁居民男性20人的恒牙初期腭弓深度均值为17.15mm,标准差为1.59mm;女性34人的均值为16.92mm,标准差为1.42mm。根据这份数据可否认为该市1316岁居民腭弓深度有性别差异?,H0 :12,男女腭弓深度相同; H1 :12 ,男女腭弓深度不相同。 双侧 =0.05。=n1n22=20342=52 按自由度52查附表2,t界值表得t0.5,52=0.679,P 0.50.05,差别无统计学意义,可以还不能认为13-16岁居民腭弓深度有性别差异。,正态性检验,(1)未知且n较小
17、; (2)样本来自正态分布总体; (3)两样本均数比较时还要求所对应的两总体方差相等( 12 = 22 ),即方差齐性(Homogeneity of Variance); (4)独立性。,方差齐性检验,(1)未知且n较小; (2)样本来自正态分布总体; (3)两样本均数比较时还要求所对应的两总体方差相等( 12 = 22 ),即方差齐性(Homogeneity of Variance); (4)独立性。,两样本所属总体方差不等(Satterthwaite近似法)如果12 =22 ,两样本所属总体方差不相等,如果两总体为正态分布,分别记为N(1,2)和( 2,2 ),检验假设为:,H0:1=2,
18、H1: 1 2,t t(v)分布,例6-5 为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的20只大鼠随机分成为两组。一组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大鼠血糖含量(mmol/L)。结果为,DV组12只,样本均数为6.5mmol/L,标准差为1.34mmol/L;D组8只,样本均数为13.7mmol/L,标准差为4.21mmol/L。试问两组动物血糖含量的总体均数是否相同?,H0:1=2 ,,H1: 1 2,双侧 =0.05,检验假设,DV组,D组,提示方差不齐,0,4.6817,配对设计与完全随机设计比较,由于配对设计的抽样误差较小,它的
19、实验效率往往优于完全随机设计,在实际工作中多数情况也如此,但也有特殊情况,主要有两个方面原因:,(1)标准误的大小,若采用两组的标准差计算配对设计的标准误:,(r为两列数据相关系数),当样本量相等时,完全随机设计的两组差值均数的标准误为:,因此,当r0配对成功,当r0或接近于0时,配对欠佳。,(2)自由度,配对设计的由自度要小于完全随机设计。,而自由度和t成反向变化,自由度大,则t小,容易出现差别,否则相反。,u 检验总结,u 检验(u test),亦称为z检验(z test)。根据研究设计,可分为大样本均数(率)与总体均数(率)比较的u检验,两大样本均数(率)比较的u检验。,u 检验(u t
20、est),大样本均数比较的u检验,大样本率比较的u检验,样本均数与总体均数比较,两样本均数比较的u检验,样本率与总体率比较,两样本率比较的u检验,这里不作介绍,u 检验,t 检验是根据t分布判断样本概率而进行的假设检验,而当样本量n很大时,t分布就接近标准正态分布,标准正态分布也称为u分布,而国外教科书则称为Z分布,这时候根据u分布判断概率所进行的假设检验称为u检验。,应用条件: 已知或者未知且n足够大(如n100)。,大样本均数比较的u检验,(1)样本均数与总体均数比较的u检验,假定样本数据X1、X2、X n 服从正态分布 ,当检验假设H。: =0 成立时,样本均数 服从正态分布 ,这里的总
21、体均数0一般是指已知的理论值、标准值或经过大量观察所得到的稳定值, 为总体方差,检验统计量为:,当总体标准差 未知,n60时,可用样本标准差S作为 的估计值,即:,例7-1 根据1983年大量调查结果,已知某地成年男子的脉搏均数为72次/分钟。某医生2003年在该地随机调查了75名成年男子,求得其脉搏均数为74.2次/分钟,标准差为6.5次/分钟,能否据此认为该地成年男子的脉搏数不同于1983年?,0=72次/分钟 总体,1983年大量调查结果,样本,2003年调查, 总体,=,未知总体,假设检验的步骤:,步骤一:建立检验假设,确定检验水准,H。: =72,即该地成年男子的平均脉搏没有变化,H
22、1 : 72,即该地成年男子的平均脉搏与1983年不同,=0.05 (认为这个事件不可能发生),步骤二:计算检验统计量-u值,步骤三:确定P值,作出推断结论,因此P0.01,对于H。为真时,这是一个小概率,根据反证法思想,按预先设定=0.05的检验水准,拒绝H。,接受H1,统计结论为差别有统计学意义,可认为该地成年男子的脉搏与1983年不同。,(2)两样本均数比较的u检验,该方法适用于完全随机设计中两组计量资料差别的比较。,例7-2 为研究孕妇补锌对胎儿生长发育的影响,将96名孕妇随机分为试验组和对照组,一组在孕期不同时间按要求补锌,另一组为对照组,观察两组孕妇所生新生儿体重有无不同。两组的例
23、数、均数、标准差分别为:补锌组:对照组:问:补锌对新生儿出生体重有无影响?,随机化分组,合格研究对象96,试验组,对照组, 总体,2 总体,1 总体,=,?,样本1,样本2,假设检验的步骤:,步骤一:建立检验假设,确定检验水准,H。: 1= 2 ,即两组新生儿出生体重的总体均数相等,H1 : 1 2 ,即两组新生儿出生体重的总体均数不相等,=0.05,步骤二:计算检验统计量-u值,步骤三:确定P值,作出推断结论,因此P0.05,按预先设定=0.05的检验水准,不拒绝H。,统计结论为差别无统计学意义,根据本试验结果尚不能推断补锌对新生儿出生体重有影响。,案 例,案例6-2 为研究不同药物对肥胖患
24、者的疗效,将BMI28的肥胖患者随机分成两组,每组10人,测得他们服药前及服药2个月后体重的变化(教材表6-10)。试评价:A、B两种药物对肥胖患者是否有效。A、B两种药物的疗效有无差别。,案例辨析 “同一受试对象处理前后的比较”严格地说不是合格的配对设计,因为处理前的个体接受的是空白处理,而处理后的同一个体接受的是“处理(长跑)+时间(5个月)”,因此,即便长跑前后的晨脉次数有差别,也不能就判断是长跑的作用,因为有5个月的时间效应混杂在其中。 正确做法 处理此类问题的最好办法是加一个平行对照,使“时间效应”在两组比较时互相抵消,从而可以更真实地揭示“长跑与否”产生的效应之间的差别有无统计学意义。,练习与思考,