收藏 分享(赏)

第11章 非参数检验.ppt

上传人:gsy285395 文档编号:4390904 上传时间:2018-12-26 格式:PPT 页数:86 大小:1.01MB
下载 相关 举报
第11章 非参数检验.ppt_第1页
第1页 / 共86页
第11章 非参数检验.ppt_第2页
第2页 / 共86页
第11章 非参数检验.ppt_第3页
第3页 / 共86页
第11章 非参数检验.ppt_第4页
第4页 / 共86页
第11章 非参数检验.ppt_第5页
第5页 / 共86页
点击查看更多>>
资源描述

1、第11章 非参数检验,孔丹莉,2,主要内容,3,4,参数统计要求样本来自某种特定分布的 总体,而该分布中的某些参数未知,统 计分析的目的就是对这些未知参数进行 估计或推断,如t检验、方差分析都要求 原始数据来自于正态分布的总体,且方 差齐性。,参数统计(parametric statistics),5,优点:对资料的信息利用充分统计分析的效率高缺点:对资料的要求高适用范围有限,参数分析方法的优缺点,应用参数检验的情况,(1)总体分布类型已知,如率服从二项 分布、样本均数服从正态分布; (2)由样本统计量推断未知总体参数。这时,对总体参数m、p的假设检验称为参数检验。如 t 检验: F 检验:,

2、7,非参数统计对数据的总体分布类型不作严格假定,又称任意分布检验(distribution-free test),它直接对总体分布的位置作假设检验。,非参数统计(nonparametric statistics),8,非参数分析方法的优点,优点:不受总体分布条件的限制,适用范围广;某 些不便准确测定,只能以严重程度,好坏优劣, 次第先后等作记录的资料也可应用。对资料没有特殊要求,例如不受分布的影响(偏态、分布不明的资料)不受方差齐性的限制不受变量类型的影响不受样本量的影响,9,非参数检验方法的优点:1 适用范围广;2 计算方法简便,易于理解和掌握;3. 可用于不能或未加精确测量的资料,如等级资

3、料或某些计数资料。,10,非参数分析方法的缺点,缺点:适用于参数检验的资料若用非参数检验会造 成信息损失,导致检验效率较低。即当H0不真, 非参数检验可能不如参数检验能较灵敏地拒绝 H0 ,犯第二类错误的概率比参数检验大。 若资料适用于参数方法(如正态分布,方差 齐性等,就尽可能不用非参数方法),11,非参数检验方法的缺点:对信息的利用不充分检验效率低,仅及参数检验的95%。易犯型错误因此,凡适用于参数检验方法的资料,应首选参数检验。,12,应用非参数检验的情况,1.不满足正态和方差齐性条件的小样本资料; 2.总体分布类型不明的小样本资料; 3.一端或二端是不确定数值(如0.002、65等)的

4、资料(必选); 4.单向有序列联表资料; 5.各种资料的初步分析。,已知总体分布类型,对未知参数进行统计推断,依赖于特定分布类型,比较的是参数,参数检验(parametric test),非参数检验(nonparametric test),对总体的分布类型不作严格要求,不受分布类型的影响,比较的是总体分布位置,优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“50mg”等 ),缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同,14,常用的非参数检验方法,秩和检验 Rid

5、it 分析 卡方检验 K-S 法 秩相关分析(等级相关分析) cpd 法(积差交叉法) 游程检验,15,第一节 Wilcoxon 符号秩和检验,16,第一节 Wilcoxon 符号秩和检验,一、配对设计的两样本比较,什么叫配对设计?,是将实验对象按一定条件配成对子,如将年龄、 体重一致的动物配成对子,再随机分配每对中的两 个对象接受不同的处理方式;或同一样品用两种方法(或仪器等)检验的结果;或同一受试对象两个部位的数据。配对设计可增强组间的均衡性,提高实验效率。,符合参数条件时,采用两样本均数的配对t 检验,17,本章介绍的非参数统计方法 均基于秩次,秩次(rank)将数值变量值从小到大,或等

6、级变量值从弱到强所排列的序号,也就是秩号。 例1 11只大鼠存活天数:存活天数 4,10,7,50,3,15,2,9,13,60,60秩 次 3 6 4 9 2 8 1 5 7 10 1110.5 10.5,秩次相同(tie)取平均秩次!,18,例2 7名 肺炎病人的治疗结果: 危险程度治愈 治愈 死亡 无效 治愈 有效 治愈 秩次 1 2 7 6 3 5 4 平均 秩次 2.5 2.5 7 6 2.5 5 2.5,秩和:用秩次代替原始数据,在计算各组秩次之和; 秩和检验:基于秩和提供的信息,对不同总体的平均水平进行假设检验。,19,Wilcoxon符号秩和检验(Wilcoxon 配对法,或W

7、ilcoxon signed rank test) 是推断其差值是否来自中位数为零的总体的方法,可用于计量配对设计资料差值的比较和单一样本与总体中位数的比较,1配对样本差值的中位数与0的比较 2单个样本中位数和总体中位数比较,20,请看课本P152例题11-1,为观察血浆置换法治疗出凝血功能异常的临床疗效, 某医师治疗了11例出凝血功能异常患者,置换前后各患者的凝血酶原时间见表11-1。该医师采用两样本均数比较的检验,结果,差异有统计学意义,由此认为血浆置换治疗前后凝血酶原时间有差别。,21,问题(1)该资料为何种类型资料?(2)该研究属于何种设计方案?(3)该医师所选用的统计分析方法是否正

8、确?为什么?(4)该资料应采用何种统计方法进行分 析? 其步骤如何?,22,(1)该资料为计量资料。 (2)该研究属自身配对设计方案。 (3)该医师所选用的统计分析方法不正确。原因在于:自身配对设计资料一般选用配对检验,而该医师采用完全随机设计两样本均数比较的t检验,统计方法与设计类型不符;该医师未考 虑资料是否满足t检验的应用条件。,23,建立检验假设,确定检验水准H0:差值的总体中位数为零,即Md=0H1:Md0=0.05计算检验统计量求各对测量值的差值编秩:编秩原则,按照差值的绝对值从小到大编秩,差值为 0 者不参加编秩,绝对值相等,符号相同时顺次编秩,绝对值相等,符号相反时取平均秩次,

9、24,求秩和、确定检验统计量 T 值分别求出正、负秩和,正秩和以T+ 表示,负秩和以T- 表示。任取正秩和或负秩和为统计量T值。其中T+ + T- = n(n+1)/2,n 为有效对子数,确定P 值、作出统计推断结论,查表法:用于有效对子数 n50 (P345)若T 值在上、下界值范围内,则 P0.05若T 值在上、下界值上或范围外 ,则 P0.05,25,正态近似法:用于有效对子数 n501)当差值绝对值相同的个数n25%时 差值绝对值相同即指相同秩。指差值的绝对值 相等者取平均秩。也就是秩次相等的个数,可用tj 表示。如t1指第一个出现相同秩次的个数。本例中 有两个秩次为2.5(指绝对值)

10、,则t1=2; 有两个秩 次为6.5, 则t2=2。当tjn25%时,公式如下,26,2)当差值绝对值相同的个数n25%时上式中,tj 为第 j 个差值绝对值相同的个数,= ( 23-2 ) +( 23-2 )=12,如果还有相同的,再相应加上,依此类推,27,(2)单一样本与总体中位数比较(见课本P154例题11-2) 已知某地正常人尿汞含量的中位数为2.50g/L,某医师从该地某厂从事土法炼金(汞齐法)的汞作业工人中随机抽取10名工人,测得尿汞含量(g/L)为11.01,2.13,2.56,2.79,12.95,3.12,3.56,4.37,5.13,18.90。采用单样本检验对资料进行分

11、析,得,按水准,拒绝H0,接受H1,差异有统计学意义,可以认为该厂工人尿汞含量与正常人尿汞含量不同。,28,建立检验假设,H0:工人的尿汞含量总体中位数等于2.15,M =2.50 H1:M 2.50 单侧=0.05,计算检验统计量求差值:这里的差值是各观察值与已知总体中位数(2.50)之差 编秩:编秩原则同上求秩和、确定检验统计量 T 值:取T+ 和 T-的任意一个作为检验统计量确定P值、作推断结论,29,本例n=10,T=4.5,查T界值表(配对比较的符号秩和检验用,附表10),得P0.01,按=0.05检验水准拒绝H0,接受H1,可认为该厂工人尿汞含量高于当地正常人。1. Wilcoxo

12、n符号秩和检验的基本思想:在H0成立的前提下,差值(配对差值、样本各测量值和已知总体中位数M0的差值)的总体分布是对称的,总体中位数应为0;T+与T-应接近n(n+1)。若正、负秩和相差悬殊,则有理由怀疑H0的成立。,30,2. Wilcoxon符号秩和检验用于推断配对设计资料差值的总体中位数是否为0;亦用于推断样本所来自总体的中位数与某已知总体中位数是否相等。 3. Wilcoxon符号秩和检验适用于不满足t检验条件的配对设计的计量资料、等级资料和其它不能精确测量的资料。,31,第二节 两样本比较的秩和检验,32,第二节 成组设计两样本比较的秩和检验,一、成组设计的两样本比较(Wilcoxo

13、n 两样本比较法),什么叫成组设计?,也叫完全随机设计,是将按纳入标准确定的受试对象随机的分配到实验组和对照组。这种设计方法既贯彻了随机化原则,又设有对照。能更好反映出实验措施的效应。,本法利用两样本观察值的秩和来推断样本分别代表的总体分布是否相同。,33,(1)原始数据的两样本比较 例7.3 研究不同饲料对雌鼠体重增加的关系, 资料如下:,34,方法步骤: 建立检验假设,确定检验水准H0: 喂高蛋白的鼠与喂低蛋白的鼠平均增加体重的总体分布相同H1: 喂高蛋白的鼠与喂低蛋白的鼠平均增加体重的总体分布不同=0.05 计算检验统计量编秩:编秩原则,35,表7.3 不同饲料组雌鼠所增体重,36,编秩

14、:编秩原则将两组数据混合起来从小到大统一编秩数值相等且组别相同时顺次编秩数值相等但组别不同时取平均秩次求秩和、确定检验统计量 T 值:两样本例数不等时, 以样本例数小的秩和为T两样本例数相等时, 任取一组的秩和为T,37,确定P 值、作出统计推断结论查附表11(P246页)T界值表(两样本比较的秩和检验用),先从左侧找到n1(较小的n),本例为7,再从表上方找两组例数的差(n2-n1),本例n2-n1=12-7=5,在两者交叉处即为T的界值。 将检验统计量T值与T界值相比,若T值在界值范围内,其P值大于相应的概率;若T值等于界值或在界值范围外,其P值等于或小于相应的概率,本例概率为双侧0.05

15、对应的T界值为4694,T=44.5不在该范围内,故P0.05。,38,总的来说,P值可有如下两种方法确定查表法:用于 n110 且 n2-n110 (n1 n2)若T 值在上、下界值范围内,则 P0.05若T 值在上、下界值上或范围外 ,则 P0.05正态近似法:用于n110 或 n2-n110 (n1 n2)1)当相同秩次的个数 n25%时,39,2)当相同秩次的个数 n25%时上式中,tj 为第 j 个相同秩次的个数 (2)频数表资料或等级资料的两样本比较 见课本P157例题11-4,40,例11-4 某医师为探讨斯康杜尼和利多卡因应用于深牙周袋刮治术的临床局部麻醉效果。将患有牙周病需进

16、行深牙周袋刮治术的患者109人随机分为两组,观察斯康杜尼和利多卡因麻醉后的麻醉效果,结果见表11-5。为了解斯康杜尼和利多卡因麻醉效果是否有差异,该医师对此资料进行检验,得 232.61,查2界值表, 20.05,3=7.82, 2 20.05,3,故P0.05,按水准拒绝H0,接受H1,差异有统计学意义,可认为斯康杜尼和利多卡因麻醉效果不相同,斯康杜尼的麻醉效果好于利多卡因。,41,1建立检验假设,确定检验水准 H0:两种药物麻醉效果的总体分布相同 H1:两种药物麻醉效果的总体分布不同=0.05,2计算检验统计量:详见课本P158例题(代入公式如下),42,uc =4.79555/0.888

17、1=5.40,最后与1.96比较作出结论,P0.05,按 =0.05水准拒绝H0,接受H1,差异有统计学意义,可以认为斯康杜尼和利多卡因应用于深牙周袋刮治术的局部麻醉效果的总体分布不同,斯康杜尼的效果好于利多卡因。,43,两样本比较的Wilcoxon秩和检验用于完全随机(成组)设计两样本资料的比较,是针对呈偏态分布或方差不齐不满足t检验条件的计量资料、等级资料和其它不能精确测量的资料的比较。,44,第三节 多个样本比较的秩和检验,45,第三节 成组设计多个样本比较的秩和检验,一、Kruskal-Wallis 法,又称H 检验法,该法是由Kruskal和Wallis在Wilcoxon秩和检验的基

18、础上扩展的方法,又称为K-W检验或H检验。本法利用多个样本的秩和来推断各样本分别代表的总体分布有无差别。,(1)原始数据的多个样本比较,见课本P159例题11-5,46,例11-5为探讨血管紧张素转化酶抑制剂开博通抗动脉粥样硬化的机制,某医师将15只兔随机分为三组,即正常饮食组、高脂饮食组及高脂饮食加开博通组,喂养14周后测量兔血清总胆固醇(TC)水平,结果如下: 正常饮食组:0.86 0.78 1.38 0.88 1.70 高脂饮食组:40.35 41.79 44.00 40.72 27.05 高脂饮食加开博通组:41.20 33.04 40.60 32.05 40.49,47,该医师应用方

19、差分析对资料进行分析,F=104.41,P0.05,差异有统计学意义,采用t检验进一步作两两比较,得高脂饮食组及高脂饮食加开博通组均与正常组差异有统计学意义;但高脂饮食组与高脂饮食加开博通组两组间差异无统计学意义,故认为高脂饮食组及高脂饮食加开博通组的兔血清总胆固醇显著高于正常组;开博通对血脂无影响。,48,方法步骤: 建立检验假设,H0:三个总体的分布位置相同 H1:三个总体的分布位置不全相同 =0.05,Kruskal-Wallis 法,49,计算检验统计量编秩:将各组数据统一由小到大排序并编秩,如遇有相等数值则取平均秩次。求秩和:分别将各组秩次相加,得各组秩和计算检验统计量 H 值,当相

20、同秩次的个数 n25%时,用上式 Ti为各组的秩和,ni为各组对应的例数。,50,2)当相同秩次的个数 n25%时tj 为第 j 个相同秩次的个数,确定P 值、作出统计推断结论查表法:组数 k = 3,每组例数 ni 5时,可查H界值表 P347,51,近似法若组数 k = 3,每组例数 ni 5;或者k 3或者ni 5时,则H分布近似 服从自由度为k-1 的 分布, 可查 界值表确定P 值 (2)频数表资料(或等级资料)的多个样本比较 步骤同上 (详见课本P160例题11-6,此略),52,多个样本比较的秩和检验 (Kruskal-Wallis法,即H检验),例11-4 某医院外科用三种手术

21、方法治疗肝癌患者15例,每组5例,进入各组的患者系用随机方法分配,每例术后生存月数如表11-6的第、栏。试问三种不同手术方法治疗肝癌的效果有无差别。,53,11-6 三种手术方法治疗肝癌患者的术后表生存月数,54,1. 建立假设:H0:三个总体分布的中心位置相同。H1:三个总体分布的中心位置不全相同。 0.05,2. 编秩:将各组数据 混合由小到大编秩次,如遇相同数值时,若相同数值在不同组内,则取平均秩次。,55,表11-6 三种手术方法治疗肝癌患者的术后生存月数,56,3.求各组秩和:4.计算检验统计量H值:,57,分子为H值,分母C为校正数,,校正后,HcH,P值减小。,58,4. 确定P

22、值,判断结果:查附表12,H界值表, H0.05 5.78,按=0.05水准,得P0.05,拒绝H0,故三种手术方法术后生存月数不全相等。,59,(二)频数表法:,例 比较不同孕周产妇的乳量。,表11-8 分娩时孕周与乳量的关系,60,1建立假设:H0:三个总体分布的中心位置相同。H1:三个总体分布中心位置不全相同。 0.05,2编秩(第5、6、7列)3求秩和(第8、9、10列),61,4计算检验统计量:,62,5. 确定P值,判断结果:当样本组数或样本例数超过H界值表的范围,则认为H值近似服从2分布,查2界值表。本例:查2界值表,=k1=31=2,2 0.005,2=10.60,得P0.00

23、5,可认为分娩时的孕周对乳量有影响。,63,第四节 随机区组设计的秩和检验,64,第四节 随机区组设计的秩和检验,一、随机区组设计的秩和检验,什么叫随机区组设计?,也叫配伍组设计,是配对设计的扩大,是将条件相近的实验对象(三个及以上)配成一组,每组中的不同对象分别给以不同的处理措施。此种设计增强了各组间的均衡性,可进一步控制混杂性偏倚。,本法是由M-Friedman在符号检验的基础上提出来的,常称为Friedman检验,又称 M 检验。,65,【例11-7】 某医师为探讨多发伤后血清内皮细胞特异性分子-1(ESM-1)的变化,将12窝小白鼠(每窝3只)制作成多发伤动物模型,再把每窝3只多发伤小

24、白鼠随机分配到3个实验组,采静脉血4ml,分离血清,成批检测ESM-1(ng/ml),结果见表11-10。该医师采用两样本均数比较的t检验,结果三次两两比较的结果均为,差异均无统计学意义,故认为多发伤后三组的血清内皮细胞特异性分子-1(ESM-1)无差别。,66,(1)M 检验(Friedman法)查表法(用于区组数b15,处理组数k15)方法步骤: 建立检验假设 计算检验统计量编秩、求各处理组的秩和 Ri :每个区组的数据由小到大分别编秩,相同数据取平均秩次求平均秩和 b区组数 k处理组数求检验统计量M 值 确定P 值、作出统计推断结论(P162例题11-7),67,(2)F 检验(用于区组

25、数b15 或处理组数k15)方法步骤: 建立检验假设 计算检验统计量编秩:编秩原则 求各处理组的秩和 Ri计算所有数据秩次的平方和A 值 :若各区组内无相同秩次,可用:,68,计算B 值 :计算检验统计量F 值:,确定P 值、作出统计推断结论查F 界值表:1 = k-1 2 = (b-1) (k-1),69,第五节 多个样本两两比较的秩和检验,70,第五节 多个样本两两比较的秩和检验,成组设计多个样本两两比较的秩和检验Nemenyi 法例题11-8(以例题11-5为例),41/45,例11-5为探讨血管紧张素转化酶抑制剂开博通抗动脉粥样硬化的机制,某医师将15只兔随机分为三组,即正常饮食组、高

26、脂饮食组及高脂饮食加开博通组,喂养14周后测量兔血清总胆固醇(TC)水平,结果如下: 正常饮食组:0.86 0.78 1.38 0.88 1.70 高脂饮食组:40.35 41.79 44.00 40.72 27.05 高脂饮食加开博通组:41.20 33.04 40.60 32.05 40.49,71,该资料不服从正态分布,在进行多组间比较时采用Kruskal-Wallis 检验,推断结论为拒绝,接受,这与前面所介绍的多组比较方差分析类似,只能得出三组资料总体分布不同或不全相同的结论,不能判断三组资料中哪些组间差异具有统计学意义。若要对每两个总体分布做出有无不同的推断,需要做组间的两两比较。

27、,72,多组秩和检验中做进一步的两两比较,需调整检验水准。 检验水准的调整:对k个样本组进行多次两两比较,会增加第I类错误的概率。为保证第I类错误的概率总共不超过,每次比较的第I类错误概率应采用式(11-12)进行调整。= / 总的比较次数(1) = 2 / k(k-1)(多组两两比较)(2) = / k-1 (实验组与同一对照组比),73,方法步骤:(P165) 建立检验假设 确定检验水准 计算检验统计量两两比较:设为k个样本组,和分别为比较的第i组和第j组样本的秩和,其平均秩和分别为和。(1)精确法: 样本含量较小时,应采用两样本秩和检验的 方法,求得统计量的数值后,借助SAS和SPSS软

28、件的“exact” 功能得到相应的P值(包括该数值对应的概率和更极端情形的概率)。,74,(1)精确法: 样本含量较小时,应采用两样本秩和检验的 方法,求得统计量的数值后,借助SAS和SPSS软件的“exact” 功能得到相应的P值(包括该数值对应的概率和更极端情形的概率)。 (2)正态近似法:当各样本组例数较大时,按下式(11-15)求得第i组和第j组样本比较的值。,41/45,75,平均秩次 , , 公式的分母为 的标准误。,经多个样本比较的秩和检验,各组间有差别,试再进一步作两两比较。,76,表11-12 三组兔血清总胆固醇水平(mmol/L)的两两比较 利用标准正态分布或SAS和SPS

29、S统计软件求得统计量数值所对应的P值。将P值与调整以后的检验水准比较,若P ,则拒绝H0。 本例认为正常饮食组分别与高脂饮食组和高脂饮食加开博通组的兔血清总胆固醇水平的差别均有统计学意义,高脂饮食组和高脂饮食加开博通组的兔血清总胆固醇水平高于正常饮食组;而高脂饮食组与高脂饮食加开博通组的兔血清总胆固醇水平的差别无统计学意义。,77,表11-6 三种手术方法治疗肝癌患者的术后生存月数,78,1. 建立假设:H0:任何两个总体分布的中心位置相同。H1:任何两个总体分布的中心位置不同。 0.05,2. 计算各样本的平均秩次:,3. 计算t值: 本例N15,79,1组和2组比较:P0.05,80,1组

30、和3组比较: P0.05,81,2组和3组比较: P0.05,82,4. 确定P值,判断结果:按0.05水准,除了2组与3组比较,拒绝H0,其余每二组间均无差别,可认为乙法优于丙法。,83,二、随机区组设计多个样本间的多重比较与完全随机设计多个样本组间的多重比较类似,对于随机区组设计资料,当用Friedman M检验拒绝后,同样需要对各处理组间进行多重比较。采用调整检验水准,两两做相关样本的秩和检验,即配对wilcoxon符号秩和检验。,84,以例11-7说明随机区组设计资料多重比较的基本步骤。(P162)某医师为探讨多发伤后血清内皮细胞特异性分子-1(ESM-1)的变化,将12窝小白鼠(每窝3只)制作成多发伤动物模型,再把每窝3只多发伤小白鼠随机分配到3个实验组,采静脉血4ml,分离血清,成批检测ESM-1(ng/ml),结果见表11-10。,42/45,85,小 结,1. 掌握非参数检验的概念及秩和检验的优缺点。,2. 掌握配对设计资料、两组和多组完全随机设计资料秩和检验的编次方法。,3. 掌握如何确定配对设计资料、两组和多组完全随机设计资料秩和检验的检验统计量。,86,Thanks for listening !,THE END,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 经营企划

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报