1、6 两样本定量资料的比较,准确收集数据;准确录入数据;准确识别资料类型、选用最适当的统计分析方法、调用统计分析程序并实现;对输出的结果作出合理的解释。,统计学学习的重点是掌握如何:,有关样本资料的差异性比较,定量资料,定性资料,前提条件,t / Z检验,非参数检验-秩和检验,SPSS软件,6.2 配对设计两样本的比较,6.1 两独立样本的比较,6.1 两组独立样本的t 检验,方案 1,方案 2,完全随机设计(成组设计):,变量变换或秩和检验,两 独 立 样 本,假设检验,单 样 本,配对资料,差值,正态,偏态,对子数,t 检验,n 50,正态,偏态,n 50,方差齐,t 检验,方差不齐,方差齐
2、,变量变换或秩和检验,t 检验,又称成组 t 检验 它适用于完全随机设计两样本均数的比较 原理:假定两样本所代表的总体均服从正态分布N(1,1) 和 N(2,2),当关心两总体均数1、2 是否相等时,理论上应考虑是否两总体方差相同 ,即方差齐性(homogeneity)。,6.1 两组独立样本t 检验 two-sample/group t-test for independent samples,若:两个总体方差相等,则直接采用t 检验。 若:两个总体方差不同,可采用校正t 检验和变量变换或秩和检验等方法处理。,两样本均数的差值( )符合自由度为n1+n2-2 的 t 分布,故可用t 检验的原
3、理进行假设检验。,条件:要求来自两个不同的总体方差相等,t 检验:样本统计量是 t 值。根据方差齐性检验的结果,两样本来自的总体方差齐 ,另可将两方差合并,估计出两者的共同方差,即合并方差。, n1+n2 -2,注意:,t 检验:样本统计量是 t 值。如果两样本来自的总体方差不齐 ,采用校正t检验,对t 值进行校正;并同时校正自由度,公式如下:,6.1.3 两组样本资料的方差齐性检验,问题:即使两个样本方差相等,由于存在抽样误差,两个总体方差也可能不相等。因此要对此作出推断是否相等,即验证 ?,用F 检验,求得F值后,查附表C6(P572 )F界值,得 F(1,2)值,注意: 因为两个方差不定
4、哪个大?用双侧;两样本方差齐性用“上行概率0.1”,样本含量较小时,需要检验方差是否相等;当n1和n2均大于50时,不必做方差齐性检 验,样本越大,抽样误差越小(变异减小)。,【例6.1】 为研究某种新药治疗贫血患者的疗效,将20名贫血患者随机分成两组,一组用新药治疗,另一组用常规药物治疗,测得血红蛋白增加量(g/L)见表。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无差别?,表 6.1 两种药物治疗贫血患者结果,6.1.1 两样本总体方差相等 t 检验,资料识别:,资料类型:定量变量资料设计类型:两独立样本,1. 资料特点:定量、两组独立样本资料,处理组1:认为其所在总体均数为 1;
5、处理组2:认为其所在总体均数为 。.,2. 检验目的:两组间观察指标的差异性比较。, 正态性检验 由于有抽样误差的存在,必须对n50的资料近似正态分布的程度给予正态性检验。 常用K-S法、W法和D法,无论那种方法,计算较复杂,借用计算机软件完成。 检验水准选0.1水平, 减少假阴性的机会。,方差齐性检验,两样本均数比较的t检验,1. 建立假设:,确定显著性水平:双侧a =0.05,2. 计算检验统计量:,3. 确定 p 值,得出结论:t =2.10,查 t界值表, P 0.05; 按a = 0.05水准不拒绝H0,可以认为新药和常规药治疗贫血患者后血红蛋白增加量不同,根据样本均数的信息 ,认为
6、 ,即服用新药后平均增加量高于常规药。,H0: 1 = 2 H1 :1 2, 20 -218,1. 正态性检验: Analyze Descriptive Statistics Explore Dependent list框 Y Factor list框group Plots框Normality plots with tests Continue OK,【电脑实现】,结果输出:,2. 两独立样本的t 检验 Analyze Compare means Independent- sample T Test Test Variable(s) 框 y Grouping Variable框group De
7、fine Groups框 Group 1: 1; Group 2: 2 Continue OK,【电脑实现】SPSS,两样本比较的t 检验:,结果输出:,【结果报告】,【例 6.10】 为探讨硫酸氧钒对糖尿病大鼠血糖的影响,研究人员将已诱导糖尿病模型的100只大鼠随机分为两组,实验组给予硫酸氧钒治疗,对照组为空白对照。结果如下: 硫酸氧钒治疗组 n1=50,X1= 6.5mmol/L, S1=1.35mmol/L 对照组 n2=50,X2= 13.2mmol/L, S2 = 4.20mmol/L试问两种处理疗效的总体均数是否相同?.,6.1.2. 两独立样本的比较- 校正t 检验,方差齐性检验
8、F 检验:,正态性检验,3.再进行两样本均数的比较t 检验,(2)计算统计量:,【例6.3】某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁蛋白(g/L)含量,问肺炎患者与正常人平均血铁蛋白含量有无差别?肺炎患者:31 68 237 174 457 492 199 515 599 238正常人: 177 172 34 47 132 54 47 52 47 294 68 43 277 44 43 95,6.1.3 两组独立样本的比较的秩和检验,资料分析:,资料类型:定量变量、成组设计两独立样本 检验方法设计:,考察两样本的正态性,成组设计两独立样本,故不能用两样本均
9、数比较的t检验 Wilcoxon two-sample test,正态性的W检验P=0.010,在=0.10检验水准下,认为正常人血铁蛋白含量不服从正态分布,,需要一种可不考虑被研究对象为何种分布以及分布是否已知的统计推断方法。此类方法通常不会涉及到研究对象的参数,统计推断是比较分布而不是比较参数。,在总体分布不确定的情况下,如何利用数据包含的信息,进行统计推断?,非参数检验-秩和检验 (nonparametric statistics),主要特点:不受总体分布的限定,适用范围广,应用时可以不考虑被研究对象为何种分布或分布是否已知,对数据要求不像参数检验那样严格,包括无法测量得到,而只能以优劣
10、,次序先后等级资料或开口资料。但信息量损失较大,较粗略。,当两组小样本资料不符合t 检验的条件,如两组资料方差不齐,或不符合正态分布,此时,用非参数检验-两组独立样本秩和检验。,缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同。,对总体的分布类型不作任何要求,非参数检验 nonparametric statistics,特点:不受总体参数的影响,比较的是分布或分布位置。 适用范围:广,可用于任何类型资料。,秩和检验的基本思想,一组数据的最基本信息是次序,将数值从大到小排序,给出1、2、3,称为该数据的 秩(rank),每个
11、数值在整个数据中均有相应的位置和次序,即有它的秩。 在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。,秩和检验的基本思想:,秩和检验,非参数检验的常用条件: 1.不满足正态和方差齐性条件的小样本资料; 2.总体分布类型不明的小样本资料; 3.一端或二端是不确定数值(如0.002、65等)的资料(必选); 4.单向有序列联表资料; 5.各种资料的初步分析。,两样本比较的秩和检验的基本原理,1+2+4+5+8=20,3+6+7+9+10=35,【例6.3】某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁蛋白(g/L
12、)含量,问肺炎患者与正常人平均血铁蛋白含量有无差别?肺炎患者:31 68 237 174 457 492 199 515 599 238正常人: 177 172 34 47 132 54 47 52 47 294 68 43 277 44 43 95,Wilcoxon秩和检验的基本思想是:,假如H0成立,即样本含量分别为n1、n2两样本来自同一总体,或分布相同的两个总体时,则n1 样本的实际秩和(T)和其理论秩和 的差异仅为抽样误差所致,应相差不大。 当二者相差殊,超出抽样误差可解释的范围,则有理由怀疑该假设,从而拒绝H0。,编秩原则:将两组数据合并由小到大统一编秩。编秩时遇到相同数据: 在不
13、同组时,各取平均秩次, 在同一组时,可取其平均秩次,也可顺次编秩求秩和并确定检验统计量: 当两样本量不等时,取样本量小者(n1)的秩和为检验统计量T; 当两样本量相等时,可任取一组的秩和为T。,若T 值在上、下界值范围内,则P a ;若T值在上、下界值外或等于界值,则P a。,确定P 值的方法:,当n110, n2-n110时,查表法。查T界值表(附表10,P484:两样本比较的秩和检验用),检验步骤:,(1) 建立假设,确定检验水准:H0:两组小鼠生存日数总体分布相同H1:两组小鼠生存日数总体分布不同=0.05,(2) 计算检验统计量:,两组统一编秩: 以实验组的秩次为检验统计, 即n1=1
14、0, n2-n1=2, T=170,(3)确定P 值,作出推断结论:,据n1=10, n2-n1=2, T=170,查T 界值表双侧P 0.05。在 a =0.05水准上,拒绝H0 接受H1,可认为两组生存日数的总体分布不同。由于对照组平均秩次为83/12=6.92,实验组的为170/10=17,故可以认为实验组的生存日数长于对照组。,确定P 值的方法:,n1或 n2-n1 超出了T 界值表的范围,用正态近似法, 即Z 检验法:,N=n1+n2,连续性校正数,即若相持出现较多,如超过25%时,对Z值进行校正:,第 j次相同秩次的个数,检验步骤:,(1) 建立假设,确定检验水准:H0:肺炎患者与
15、正常人的血铁蛋白总体分布相同H1:肺炎患者与正常人血铁蛋白总体分布不同。=0.05,(2) 计算检验统计量:,两组统一编秩: 以实验组的秩次为检验统计, 即n1=10, n2-n1=6, T=183.5,(3)确定P 值,作出推断结论:,据n1=10, n2-n1=6, T=167.5,查T 界值表双侧P0.05。在 a =0.05水准上,拒绝H0 ,接受H1 ,肺炎患者与正常人血铁蛋白总体分布不同。由于肺炎患者平均秩次为183.5/10=18.4,正常人的平均秩次为167.5/16=1.1,故可以认为前者高于后者。,97 -173,1. SPSS过程:,2. SPSS结果输出:,【结果报告】
16、,3. 若两样本所属总体偏态变量变换后再t 检验或非参数检验,两 样本均数t 检验的前提条件是数据的正态性和方差齐性。,两独立样本资料假设检验的方法选择:,6.2 配对设计两样本的比较,A B,配对设计是将受试对象按一定条件配成对子(同种属、同体重、同年龄、同性别等),再随机分配每对中的两个受试对象到不同的处理组。,配对设计数值资料的假设检验方法选择:主要考虑差值分布的正态性: 若差值服从正态分布 配对t 检验(paired t test) 否则 配对资料的符号秩和检验(signed rank sum test),【例6.4】为研究某种抗癌新药对小白鼠移植性肉瘤S180的抑瘤效果,将20只小白
17、鼠按性别、体重、窝别配成对子。每对中随机抽取一只服用抗癌新药,另一只作为阴性对照,服用生理盐水,观察其对小白鼠移植性肉瘤S180的抑瘤效果,经过一定时间,测得小白鼠瘤重如表7.4所示。问小白鼠服用抗癌新药和生理盐水后平均瘤重有无不同?,资料类型:数值资料;设计类型:配对设计,检验原理:配对资料并不是两个独立样本,当对子内部相减之后,得到的差值资料实际上是一个样本。如无效假设作两组间效应同,那么考查的是其差值资料是不是来自于一个均数为0的已知总体的问题。故配对t 检验可看成差值d 的样本均数所代表的未知总体均数与已知总体均数0=0的比较,即 。, = 0=0.,检验目的:类似于单样本的检验,其实
18、质就是检验差值的均数(或中位数)是否等于零,即=0。,【案例解析】,1.配对设计资料,差值符合正态分布,考虑t 检验。,【案例解析】,2.计算公式:,特殊的单样本 t 检验:,【电脑实现】,【电脑实现】 SPSS,正态性检验:,结果输出:,配对t检验:,结果输出:,Paired Sample t-TEST,【结果报告】,6.2.2 配对资料的符号秩和检验,例6-5 留取12名在医用仪表厂工作的工人尿液,分成两份,一份用离子交换法,另一份用蒸馏法测得尿汞值如下,问两种方法测得尿汞值平均含量有无差别?,表6.8 两种方法测得的尿汞值含量(单位:mg/L),案例分析:,资料类型:配对设计的定量变量
19、检验方法选择:,差值不服从正态分布,配对设计的定量变量,对差值分布进行正态性检验,配对资料的符号秩和检验 即:Wilcoxon符号秩和检验,W=0.456,P=0.010,符号秩和检验的基本思想是:,如果两种方法测得的平均含量无差别的话,那么各观察值与已知总体中位数的差值的总体分布为对称分布,并且以0为中心,即差值的总体中位数为0; 也就相当于把这些差值按其绝对值大小编秩并标上原来的符号后,正秩和与负秩和应相差不大,即使有些差别,也只能是一些随机因素造成的、在一定范围内的差别,它们均应接近n(n+1)/4,n为有效对子数。 如正、负秩和相差殊,超出抽样误差可解释的范围,则有理由怀疑该假设,从而
20、拒绝H0。,编秩: 依差值绝对值的大小从小到大编秩; 编秩原则: 编秩时遇差值0,舍去不计,同时样本例数减1; 遇绝对值相等差数,符号相同顺次编秩;符号相反取平均秩次。 按差值的正负给秩次加上正负号。.求秩和并确定检验统计量: 以T+ 表示正秩和,T- 表示负秩和,T+T-n(n+1)/2 取T+ 和T-中较小者为检验统计量T。, 计算检验统计量:,若T 值在上、下界值范围内,则P a ; 若T值在上、下界值外或等于界值,则P a。, 确定P 值的方法:, 当5n50,用查表法:查T 界值表(附表9,P483:配对符号秩和检验用),当n50,用正态近似法,即u 检验:,计算u值:,当相同秩次多
21、时,应改用校正公式:,检验步骤:,(1) 建立假设,确定检验水准:H0:Md=0, 即两种方法测定的中位数相同;H1:Md0,即两种方法测定的中位数不同。=0.05,(2) 计算检验统计量:, 求差值: 按差值绝对值大小编秩,并按其正负给秩加符号。. 求秩和确定检验统计量:T+ 45,T-33.取T-33.为检验统计量,(3)确定P 值,作出推断结论:,本例n =12,T界值=(13,65),得P0.05。在a =0.05水准上,不能拒绝H0 ,不能拒绝Md为0,即尚不能认为两法测定结果有差别。,【电脑实现】,结果输出,【结果报告】,经配对资料的Wilcoxon符号秩和检验,得P0.05。在a
22、 =0.05水准上,不能拒绝H0 ,即尚不能认为两法测定结果有差别。,小 结,对于完全随机设计的两样本定量资料的假设检验,是采用t检验还是秩和检验要看资料是否符合各自的条件。t检验要求资料满足正态性和方差齐性。对于配对设计资料的假设检验,首先看差值是否符合正态分布,如果差值满足正态分布,可以采用配对t检验,否则,采用变量变换使之满足正态性要求或采用配对资料的符号秩和检验。,变量变换或秩和检验,两 独 立 样 本,假设检验,单 样 本,配对资料,差值,正态,偏态,对子数,t 检验,n 50,正态,偏态,n 50,方差齐,t 检验,方差不齐,方差齐,变量变换或秩和检验,t 检验,两样本定量资料平均
23、水平比较的分析思路,【案例6-1】为研究直肠癌患者手术前后血清CEA含量有无差异,作者收集了以下资料:,正确做法 :此案例涉及完全随机设计两小样本资料的假设检验,统计方法的选择一定要结合数据特征。通过对两组数据进行正态性检验,发现两样本均来自正态总体,但方差齐性检验结果表明,两总体方差不齐,所以最好的办法就是检验,此种情况一般不主张采用秩和检验,因为检验功效会大大降低。,【案例6-2】为研究不同药物对肥胖患者的疗效,将BMI28的肥胖患者随机分成两组,每组10人,测得他们服药前及服药2个月后体重的变化(见表7.6)。 试评价:A、B两种药物对肥胖患者是否有效;A、B两种药物的疗效有无差别。,正
24、确做法: 如果要分别评价A、B两种药物是否有效,可以首先按照自身对照设计资料,考虑采用配对 t 检验并结合专业与实际进行推断。另外,可以同时设定一个平行对照帮助推断。 如果欲评价A、B两种药物的疗效有无差别,可以采用以下两种方法之一:分别计算出各组治疗前后体重的差值,然后作完全随机设计两样本比较的t检验;以治疗前两组体重数据作为协变量的值,采用多重回归扣除治疗前体重的影响。,【案例6-3】:为研究长跑运动对增强普通高校学生的心功能的效果,某学校随机抽取15名男生,进行5个月的长跑锻炼,5个月前后测得的晨脉数据如教材表6-11所示,问:长跑锻炼前后的平均晨脉次数有无不同?,案例辨析 : “同一受
25、试对象处理前后的比较”严格地说不是合格的配对设计,因为处理前的个体接受的是空白处理,而处理后的同一个体接受的是“处理(长跑)+时间(5个月)”,因此,即便长跑前后的晨脉次数有差别,也不能就判断是长跑的作用,因为有5个月的时间效应混杂在其中。 正确做法: 处理此类问题的最好办法是加一个平行对照,使“时间效应”在两组比较时互相抵消,从而可以更真实地揭示“长跑与否”产生的效应之间的差别有无统计学意义。,最佳选择题:,1.统计推断的内容是: A用样本指标推断总体指标 B检验统计上的“假设” CA、B均不是 DA、B均是,2.两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小: Aa=0.05
26、 Ba=0.01 Ca=0.10 Da=0.20,3. 配对设计的目的: A提高测量精度 B操作方便 C为了可以使用t检验 D提高组间可比性,4. 当两总体方差不齐时,以下哪种方法不适用于两样本总体均数比较 At检验 Bt检验 Cu 检验(假设是大样本时) DF检验,5. 关于假设检验,下列那一项说法是正确的: A单侧检验优于双侧检验 B采用配对t检验还是两独立样本t 检验是由实验设计方法决定的 C检验结果若P值大于0.05,则接受H0犯错误的可能性很小 D用t 检验进行两样本总体均数比较时,不要求方差齐性,简答题:,1. 什么是一类错误?什么是二类错误?二者之间有什么关系?2.假设检验的注意事项是什么?3. P 与有什么区别和联系?4.既然假设检验的结论有可能有错,为什么还要进行假设检验?,答案:,P值的大小和没有必然关系。,3. P是指H0成立的前提下,出现目前样本数据对应的统计量数值乃至比它更极端数值的概率。,是事先确定的检验水准。,4. 假设检验中,无论拒绝不拒绝H0,都可能会犯错误:表现为拒绝H0时,会犯第一类错误,不拒绝H0时,会犯第二类错误,但这并不能否认假设检验的作用。 . 因为只要涉及到抽样,就会有抽样误差的存在,因此就需要进行假设检验。 . 只是要注意假设检验的结论只是个概率性的结论,它的理论基础是“小概率事件不太可能原理”。 .,THANK YOU!,