1、统计方法的选择与SPSS结果解释,一、t 检验,单样本 t 检验 配对 t 检验 两样本 t 检验,1. 单样本 t 检验,例1 为研究口服避孕药是否会增高血糖测量值,某研究人员随机抽取9名一直口服避孕药至少6个月的妇女,测量她们的空腹血糖值,结果如下所示。已知不服用避孕药妇女的空腹血糖值均值为3.8 mmol/L 。根据该样本提供的信息,是否有证据表明口服避孕药可以提高空腹血糖值? 4.71 3.61 4.92 4.85 4.66 3.92 5.10 3.55 4.78,Compare MeansOne Sample T Test,One Sample t Test对话框,结果解释,单样本
2、t 检验结果显示:(统计方法) 服用避孕药与不服用避孕药妇女空腹血糖值的差别有统计学意义(t =3.31,P0.011 )(统计结论) 口服避孕药可以增加血糖水平,平均增加0.66 (95% CI :0.201.11 )mmol/L(专业结论),2. 配对 t 检验(paired t-test),配对设计: 同一受试对象处理前后 两个同质受试对象分别接受两种不同的处理 同一受试对象分别接受两种不同的处理,(1) 同一受试对象处理前后,例2 用家兔10只实验某批注射液对体温的影响。体温在注射前每隔1小时测定1次,连续2次;在注射后1小时和2小时分别各测定1次,得到每只家兔注射前后体温的均数。问该
3、批注射液是否能引起家兔体温升高?,(2) 两个同质受试对象分别接受 两种不同的处理,例3 为研究某种抗癌新药对小白鼠移植性肉瘤S180的抑瘤效果 ,将20只小白鼠按性别、体重、窝别配成对子。每对中随机抽取1只服用抗癌新药“扶正消瘤汤”,另1只作为阴性对照,服用生理盐水,观察其对小白鼠移植性肉瘤S180的抑瘤效果。经过一定时间,测得小白鼠瘤重如表所示。问小白鼠服用抗癌新药和生理盐水后平均瘤重有无不同?,(3)同一受试对象分别接受 两种不同的处理,取20份样品,每份一分为二,分别用容量法和仪器分析测定。试判断容量法的测量结果是否低于仪器分析结果? 某医院用A、B两种血红蛋白测定仪器检测了16名健康
4、男青年的血红蛋白含量(g/L),问两种血红蛋白测定仪器的检测结果是否有差别? 某研究者为比较耳垂血和手指血的白细胞数,调查了12名成年人,同时采取耳垂血和手指血,试比较两者的白细胞数有无不同?,有12名接种卡介苗的儿童,8周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应直径(mm)如表所示。问两种结核菌素的反应性有无差别?,AnalyzeCompare Means Paired-Samples T test,将变量标准品和新制品成对选入 Paired Variables栏;单击OK,配对 t 检验结果显示:新制品结核菌素皮肤浸润
5、反应的直径均数低于标准品(t = 4.52, P = 0.001),均数差值为3.25 (95% CI: 1.674.83 )mm。,3. 两样本 t 检验,分别从两个研究总体中随机抽取样本,然后比较两样本某指标的均数; 随机抽取实验对象,将其随机分成两组,分别接受两种不同处理,然后比较两组的平均效应。,(1)分别从两个研究总体中随机抽取样本,然后比较两样本某指标的均数,例4 从两个品种的家兔分别测定其停食18小时后正常血糖值,问这两个品种家兔的正常血糖值有无差别?,(2)随机抽取实验对象,将其随机分成两组,分别接受两种不同处理,然后比较两组的平均效应。,例5 25例糖尿病患者随机分成两组,甲
6、组单纯用药物治疗,乙组采用药物治疗合并饮食治疗法,两个月后再次测空腹血糖,问两组患者血糖值是否相同?,SPSS操作:两样本t检验,例5.3 25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食治疗法,两个月后再次测空腹血糖,问两组患者血糖值是否相同?,AnalyzeCompare Means Independent-Samples T test,将变量血糖值选入Test栏;将组别选入grouping栏,单击Define Groups按钮,定义两个组的变量值,本例为1和2,单击Continue按钮;单击OK按钮。,经方差齐性检验,F=0.28,P0.60。按0.10水准,可
7、认为两总体方差齐性(如不齐用第2行数据)。 两样本 t 检验结果显示:单纯药物治疗的血糖值均数高于药物合并饮食治疗(t =2.64,P=0.015),均数差值为4.36(95% CI:0.947.78)mmol/L。,4. t 检验的应用条件,n较小时(如n1或n260),理论上要求样本取自正态总体。 两小样本均数比较时,要求两总体方差相等。,二、 方 差 分 析,1. 完全随机设计的方差分析,例6 为评价4种不同饲料对肝脏的影响,将16只体重相近的大鼠完全随机等分为4组,每组4只。用种不同的饲料喂养大白鼠,然后测其肝重占体重的比值(%)。试比较四组均数间有无差异?,建立数据文件;选用One-
8、Way,将变量x选入Dependent栏,将变量group选入Factor栏;分别单击Post Hoc和Options按钮,用于多个均数间的两两比较: 方差齐时: S-N-K 方差不齐时:Tamhans T2,计算各组的均数和标准差:Descriptive 进行方差齐性检验:Homogeneity,单击OK,各组均数和标准差,方差齐性检验,P0.257,方差齐吗?,完全随机设计的方差分析结果,完全随机设计资料的方差分析结果显示:四种不同饲料喂养大白鼠肝/体比值的均数不同(F=10.24,P=0.001)。,多个均数间的两两比较,显示了两个均衡子集,均衡子集内的各组均数差别无统计学意义,均衡子集
9、间的各组均数差别有统计学意义。 经多个样本均数间两两比较的SNK检验,按=0.05水准,可认为C与D饲料肝/体比值的均数高于A与B饲料,但尚不能认为A与B饲料,C与D饲料肝/体比值的均数不同。,如何阅读SNK法的结果,2. 随机区组设计的方差分析,例7 某单位欲研究3种药物对小白鼠肉瘤的抑制作用,将性别相同、体重相近的同一配伍组的3只小白鼠分别用3种药物抑癌,共5个配伍组。实验结果得瘤重(克)如下。试比较3种药物的抑癌作用有无差别?,AnalyzeGeneral LinearModelUnivariate 分别单击Model和Post Hoc按钮,将变量x选入Dependent Variabl
10、e栏,将group选入Fixed Factor(固定因素)栏,将block选入Random Factor(随机因素)栏。分别单击Model按钮和Post Hoc按钮,将变量group和block选入Model栏中。单击Continue按钮返回,将变量group选入Post Hoc Tests for栏,选择SNK法进行多个均数两两比较,单击Continue按钮返回。,单击OK按钮,随机区组设计资料的方差分析结果显示:3种药物的抑癌作用有差别(F=16.43,P = 0.001)。,经多个样本均数间两两比较的SNK检验,按=0.05水准,可认为B和C药的抑抑癌作用大于A药,但还不能认为B和C药的
11、抑癌作用有差别。,三、秩和检验,1. 非参数统计的适用情况,等级资料 偏态分布或分布不明(尤其n 30) 个别数据偏过大,或某一端无确定值 各组方差明显不齐,2. 判断资料分布类型的途径,据文献或以往经验:身高,血压,红细胞数为正态分布;尿铅,潜伏期,生存时间,住院天数为偏态分布。 若无文献可参考,则根据样本提供的信息判断。大样本时,用频数分布图;小样本时,用箱式图观察是否有极端值或离群值,或用P-P图观察散点是否接近直线,或将样本标准差与样本均数比较(如果测量值为正,标准差很大,接近甚至超过均数,则资料很可能是明显的偏态分布)。,3.配对样本比较的Wilcoxon 符号秩检验 Wilcoxo
12、n Signed Ranks Test,例8:临床某医生研究白癜风病人的白介素IL-6水平(u/ml)在白斑部位与正常部位有无差异,调查的资料如表所示:,表8 白癜风病人的不同部位白介素IL-6指标(u/ml),配对样本比较的 Wilcoxon符号秩检验 Wilcoxon Signed Ranks Test,SPSS结果解释,AnalyzeNonparametric Tests 2 Related Samples,将变量白斑部位和正常部位成对选入Test Pair(s) List 栏,其余用默认选择项,单击OK 按钮,结果:负秩和 =3,正秩和 =33,有0例相同秩次(Ties)。,经配对样本
13、比较的Wilcoxon符号秩检验, Z=2.1,P=0.036。按=0.05水准,正常部位白介素水平高于白斑部位。,4.两个独立样本比较的Wilcoxon秩和检验 Mann-Whitney U Test,例10 试检验两组小鼠存活日数有无差别?,两个独立样本比较的Wilcoxon 秩和检验,SPSS结果解释,AnalyzeNonparametric Tests2 Independent Samples,将变量day选入Test Variable List栏,将分组变量group选入Grouping Variable栏,单击Define Group按钮,定义分组变量值为1和2,单击Continu
14、e按钮返回;其余用默认选择项,单击OK 按钮,平均秩:1 实验组=17.0, 2 对照组=6.9,经两样本比较的秩和检验(Mann-Whitney Test),统计量Z=3.63,P=0.000。按=0.05水准,认为实验组生存日数(平均秩为17.0)较对照组(平均秩6.9)长。,5. 频数表等级资料,例11 44例健康人与24例慢性气管炎病人痰液嗜酸性粒细胞数的测量值(106/L)如表所示,问健康人与慢性气管炎病人痰液嗜酸性粒细胞数有无差别?,表11 两组人痰嗜酸性粒细胞,数据工作表(频数0可以不输入) 不要忘记:先加权Weight, 频数,平均秩和 提示 健康人的痰嗜酸性粒细胞数高于病人,
15、Exact sig. 没有了,为什么? 统计推断?,6.多个独立样本比较的 Kruskal-Wallis H 检验,Kruskal-Wallis H 检验,例12 试问三种不同手术方法治疗肝癌的效果有无差别?,AnalyzeNonparametric Tests K Independent Samples,结果解释:平均秩,经多个独立样本比较的Kruskal-Wallis H 检验,2=6.39,P = 0.041。可认为三种手术方法术后生存月数不同,其中乙法术后生存月数最长(平均秩12.0)。,四、2检验,四格表资料的卡方检验 配对四格表资料的卡方检验 行列表资料的卡方检验 多个样本率比较的
16、2 检验 两个或多个样本构成比的比较,1. 四格表资料的卡方检验,例13 某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组。结果如下:胞磷胆碱组52例,有效46例,有效率为88.5%;神经节苷酯组26例,有效18例,有效率为69.2%。问两种药物治疗脑血管疾病的有效率有无差别?,用变量“频数”加权:从菜单选择Data Weight cases,打开Weight cases对话框,选择Weight cases by,将“频数”选入Frequency栏,单击OK 按钮,AnalyzeDescriptive StatisticsCrosstabs,将行变量“分
17、组”选入Row(s)栏, 将列变量“疗效”选入Column栏, 分别单击Statistics,Cell (格子),选择 Chi-square,选择显示行百分数 Row,用四格表资料2检验的校正公式计算得, 2 = 3.14,P=0.076。 按=0.05水准,两种药物治疗脑血管疾病有效率的差别无统计学意义。,例14 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表。问两种方法的检测结果有无差别?,免疫:23/ 58= 0.397 乳胶:13 /58= 0.224,2. 配对四格表资料的卡方检验,配对四格表资料的2检验,如在Crosstabs过程中
18、进行,不显示配对2检验的2值,只显示四格表资料2检验的2值。,经配对四格表资料的2检验,P=0.035。 按=0.05水准,两种方法的检测结果有差别,即免疫荧光法的检出率高于乳胶凝集法 McNemar:麦克尼马尔检验,3. 行列表资料的卡方检验 (多个样本率比较的2 检验),例15:某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效。问三种疗法的有效率有无差别?,SPSS数据,结果解释,经2检验,2=21.04,P = 0.000。按=0.05水准,可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。,行列表资料的卡方检验 (两个或多个样本构成比的比较 ),例16 某医师
19、在研究血管紧张素I转化酶(ACE)基因I/D多态与型糖尿病肾病(DN)的关系时,将249例型糖尿病患者按有无糖尿病肾病分为两组,资料见表6-9。问两组型糖尿病患者的ACE基因型分布有无差别?,结果解释,经2检验,可认为DN组与无DN组的II型糖尿病患者的ACE基因型分布不同(2=7.91,P = 0.019)。,结果解释,经2检验, 2 = 21.04,P =0.000。按 =0.05水准,三种疗法有效率的差别有统计学意义。,五、线性相关与回归,1. 直线相关分析,例17 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)。问尿肌酐含量与年龄是否有直线相关关系?,绘制散点图:从菜
20、单选择GraphsScatter,由散点图可见,8名儿童的尿肌酐含量随年龄增大而增大,呈直线趋势。,AnalyzeCorrelate Bivariate,打开对话框,将X和Y选入Variables栏,单击OK,直线相关系数的假设检验,Pearson相关系数r = 0.882,P = 0.004。按 = 0.05水准,可认为正常儿童的尿肌酐含量与年龄之间有正的直线相关关系。,2. 直线回归分析,a为常数项(constant),是直线的截距; b为回归系数(regression coefficient),是直线的斜率。它的统计学意义是:X 每增(减)一个单位,Y平均改变b个单位。为给定X时Y的估计
21、值,直线回归分析,例15 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)。估计正常儿童的尿肌酐含量(mmol/24h)对其年龄(岁)的直线回归方程。,SPSS操作和结果解释,AnalyzeRegressionLinear;选择Y作为因变量进入Dependent栏,选择X作为自变量进入Independent(s);其余用默认选择项;单击OK。,结果解释,复相关系数(R)=0.882、决定系数(R Square, R2)=0.778、调整决定系数(Adjusted R Square)=0.740、剩余标准差(Std. Error of the Estimate)=0.1970,经
22、直线回归分析,可认为正常儿童的尿肌酐含量与年龄之间有直线关系(t = 4.58,P = 0.040),直线回归方程为:本例的决定系数为0.778,表示此例中年龄可解释尿肌酐含量变异性的77.8,另外约22的变异不能用年龄来解释。,直线回归的应用举例,对一种片剂进行稳定性研究,在5个时间间隔随机抽取了6次,每次3片,进行含量测定,得到下表中的数据: 要根据这些数据确定有效期,该片剂的标示量为50mg,但制造时的目标值是过量的52mg,如果规定每片药物重量减少至标示量的90%即45mg时失效,试求出回归直线方程和失效期。 参考答案:C=51.8-0.267 t ;失效期25.5月,加样回收率试验,
23、一种确定化学分析方法准确性的检验,成为回收率试验。它是先测定一份试样中被测成分的含量,往另一份相同试样中加入一定量被测成分标准后再进行含量测定。如果第二次与第一次测定结果之差等于或很接近于所加入的被测成分标准,即所加入的标准在测定中被完全或近于完全的回收,则所用的化学分析方法就是准确的。回收率以被测成分的百分率表示。 参考答案:Y=5.9+0.915X若测得Y=90,则X=(Y-5.9)/0.91592 (g),3. 等级相关 Spearman correlation,应用条件:X和Y都为随机变量,但不服从双变量正态分布(如相对数、等级资料、明显的偏态分布资料如尿铅含量)。,例16 两名放射科医师对13张肺部X线片各自作出评定,评定方法是将X片按病情严重程度给出等级。问他们的等级评定结果是否相关。,结果解释,Spearman等级相关系数为0.808,P = 0.001。按=0.05水准,可以认为两名医师的评定结果存在正相关关系。 两名医师的评定结果存在相关关系,并不能评价两名医生的评定结果一致。该资料还可以用Kappa值进行一致性分析。,