1、诊断试验的评价,刘 晴 武汉大学公共卫生学院 流行病学与卫生统计学系,定义 诊断试验(diagnostic test)是指应用各种实验、医疗仪器等手段对病人进行检查,以确定或排除疾病的试验方法。,第一节 概述,1.对诊断试验的应用价值进行科学评价2.为临床医生合理选用诊断试验并正确解释其结果提供科学依据。,诊断试验评价的意义,如:癌胚抗原(CEA)诊断结肠癌价值的 报告。最初报道测定36例晚期结、直肠癌 病人CEA中35例(97.2)升高,对照组 是未患结肠癌的其他病人,结果他们多数 CEA水平较低。,夸大所考核诊断试验的敏感度和 特异度 ,使其最初被寄予较大希望, 而经过多年临床实践后被冷落
2、。,诊断试验评价的意义,研究者根据此结果认为:CEA是 筛选结肠癌的有效试验。以后经多家 观察将试验对象用于包括早期结肠癌 及其他胃肠道疾病对象时,发现最初 报道的CEA检查结果不正确,不能将 早期结肠癌与其他胃肠病人鉴别开来, 因此,CEA的诊断价值明显降低。,第二节 诊断试验的评价,1.建立标准诊断方法金标准:指目前医学界公认诊断某种疾病最准确的诊断方法。 2.选择研究对象:应能代表该方法可能应用的靶人群。 病例组应包括所研究疾病的各种临床类型,以使病例组对该病患者总体具有代表性。 非病例组应选择确定无该病的其他病例或健康人,尤其应包括易与该病混淆的其他病例,以考察该方法的鉴别能力。 3.
3、样本含量的估计 4.评价,评价程序,试 验 对 象,金标准,病人,非病人,待评价筛检或诊断试验,阳性,阴性,阳性,阴性,评 价,盲法检测,真阳性,假阴性,假阳性,真阴性,评价内容 真实性(validity) 可靠性(reliability) 收益,第二节 筛检和诊断试验的评价,a真阳性,d真阴性,c假阴性,b假阳性,评价指标 真实性(validity):又称有效性,是指诊断试验所获得的测量值与实际值的符合程度。,第二节 诊断试验的评价,似然比(likelihood ratio, LR) 病人中出现某种试验结果的概率与非病人中出现相应结果的概率之比,说明病人出现该结果的机会是非病人的多少倍。,正
4、确诊断指数(Youdens index) r = 1-(假阳性率+假阴性率) = (灵敏度+特异度)-1,例:某临床医师用酶联免疫吸附试验法(ELISA)检查柯萨奇B组(COXB)病毒的感染情况,以微量中和试验作为标准诊断,检查结果见表,试对该法的真实性进行评价。,表 ELISA法与微量中和试验检查COXB病毒感染的比较,灵敏度=a/(a+c)=85/100=85% 假阴性率=c/(a+c)=15/100=15% 特异度=d/(b+d)=160/200=80% 假阳性率=b/(b+d)=40/200=20% 阳性是然比=85/204.25 阴性似然比=15/800.19 正确诊断指数=100(
5、2015)0.65,第二节 诊断试验的评价,可靠性(reliability):又称可重复性,是指诊断试验在同样条件下,进行重复操作获得相同试验结果的稳定程度。 评价指标 计量资料:变异系数(CV)计数资料:Kappa值、符合率 影响因素 方法的差异 被观察者的个体生物学变异 观察者的变异,第二节 诊断试验的评价,收益:是指经诊断试验可使多少原来未发现的病人得到正确诊断和早期治疗,改善其预后,以及其创造的经济价值和社会价值如何。 评价指标 预测值(predictive value) 成本效益分析(cost-effect analysis),第二节 筛检和诊断试验的评价,收益 预测值(predic
6、tive value)预测值的影响因素: 灵敏度和特异度 患病率,第二节 筛检和诊断试验的评价,又称预告值、诊断价值。是试验结果表明有无疾病的概率。一个诊断方法有其一定的特异度、灵敏度,但是当应用它筛检或诊断患病率不同的人群时,阳性(或阴性)结果所表示的意义却不同。,灵敏度越高,阴性预测值越高 特异度越高,阳性预测值越高 与受检人群目标疾病患病率(P)密切相关,阳性预测值(positive predictive value):是指筛检试验阳性者患目标疾病的可能性阴性预测值(negative predictive value): 是指筛检试验阴性者不患目标疾病的可能性,患病率与预测值关系,表A1
7、 在患病率高的男病人组中运动后心电图与冠状动脉造影的比较,灵敏度=/(c)=55/104=53 假阴性率=c/(c)=49/104=47 特异度=d/(bd)=84/91=92 假阳性率=b/(bd)=7/91=8 患病率=(c)/(bcd)=104/195=53 阳性预测值=/(b)=55/62=89 阴性预测值=d/(cd)=84/133=63,表A2 在患病率低的男病人组中运动后心电图与冠状动脉造影的比较,灵敏度=55/104=53 (与前表相同)假阴性率=49/104=47 (与前表相同)特异度=478/520=92 (与前表相同)假阳性率=42/520=8 (与前表相同)患病率=10
8、4/624=17阳性预测值=55/97=57阴性预测值=478/527/91,1、30岁的男性,有冠状动脉狭窄的“患病率”大约是5。进行运动试验,则阳性预测值为26,阴性预测值为97。2、62岁的男性,有典型的心绞痛,这种人所代表的样本的“患病率”大约是94。进行运动试验,则阳性预测值为99,阴性预测值为11。如果试验是阳性则该病人有冠心病的机会只从94上升到99;如果是阴性,则有冠心病的机会只降至89。3、46岁男性,冠心病“患病率”大约是46,阳性预测值为84,阴性预测值为78。如果是阴性,则有冠心病的机会降至22,如果是阳性,则有冠心病的机会升至84。,试验指标 客观指标 主观指标 半客
9、观(或半主观)指标,第三节 诊断试验的指标与标准,诊断标准的划分 1.正态分布法: 2.百分位数法 3.根据实际情况来确定正常值的范围,选择诊断标准的原则,假阳性、假阴性重要性相等时,一般把标准定在“特异度=灵敏度”分界线处,或定在正确诊断指数最大处; 有些严重疾病,若能早期诊断可获得较好治疗效果,否则后果严重,故应达灵敏度高的诊断标准,保证所有病人尽可能被筛检或诊断,减少漏诊,即标准定低; 治疗效果不理想,确诊及治疗费用昂贵时,选特异度较高的诊断标准,以减少误诊,即标准定高; 如果某病的患病率低、正常人占绝大多数,此时如果特异度稍有下降,将出现大量的假阳性,因此,应以提高特异度为主,判断标准
10、定高; 从治疗的实际出发(按可治疗界限划分)。,似然比的应用,似然比又称可能性(Likelihood ratio), 是评价诊断试验性能 的指标之一,具有 区别有病、无病的能力,分为阳性似然比 和阴性似然比,其主要优点是非常 稳定, 比敏感度、特异度更稳定,不受患病率的 影响。,似然比(likelihood ratio, LR),是同时反映灵敏度和特异度的复合指标有病者中得出某一筛检试验结果的概率与无病者得出同一概率的比值,阳性似然比:筛检试验结果的真阳性率与假阳性率之比阴性似然比筛检试验结果的假阴性率与真阴性率之比,似然比可克服预测值随患病率而 变化的不足,不随患病率变化而变化。 似然比还能
11、克服仅用敏感度和特异度 表达某一诊断试验指标的不足。因为 四格表必须将连续测定的变量人为地 以某点作为划分阳性和阴性的界限, 然后再计算出敏感性和特异性。,一篇报道老年人缺铁性 贫血诊断时用血清铁蛋白测定的文章, 共有 1334 位 65岁以上贫血患者,259人 符合入选条件,其中235人做了骨髓检查, 测定的数值见下表:,血清铁蛋白的测定情况分布,血清铁蛋白 缺铁性贫血 无缺铁性贫血 (gL) (n) (n)100 8 10845100 7 271845 23 1318 47 2总计 85 150,表6 血清铁蛋白对缺铁性贫血的诊断,血清铁蛋白 缺铁性贫血 合 计 (45gL) 有 无 70
12、(a) 15(b) 85(ab) 15(c) 135(d) 150(cd)合 计 85(a+c)150(b+d) 235(N),Se=82.4(7085) PPV=82.4(7085) Sp=90(135150) NPV=90(135150),血清铁蛋白对缺铁性贫血的诊断,Se=55.3(4785) PPV=95.9( 4749) Sp=98.7(148150) NPV=79.6(148186),血清铁蛋白 缺铁性贫血 总计(18gL) 有 无 47 2 49 38 148 186总 计 85 150 235,se:n. rule out;sp:p. rule in,上述例子中以45gL作为分
13、界,45gL被认为有缺铁性贫血,那么 测定值为5gL 和 40gL时都属于 阳性。若以敏感度、特异度为基础计算 的阳性似然比均为8.2,不能区分两者患 缺铁性贫血概率的差别。,如果将连续变量的似然比划分为 不同区间进行计算,就可将二者加以 区别,并得到更多的信息。现将铁蛋白测定值以18gL、 1845gL 、45100gL和 100gL分别为界点,分别计算 其各区间的似然比。,表10 血清铁蛋白对缺铁性贫血诊断的似然比,似然比的含义是诊断试验的结果 使验前概率提高或降低了多少,根据 诊断试验前病人的患病率(验前概率) 和做某项试验后得出的似然比,应用 下述公式可以得出验后概率。,验后概率(po
14、st-test probability)验后概率=验后比(1+验后比)验后比=验前比似然比验前比=验前概率(l验前概率)验前概率=患病率,在诊断试验中,如果患病率为验前概率,那么阳性预测值即为验后概率。,例:某男性,60岁,有胸痛症状。已知心绞痛的验前概率为0.60,则:验前比= 0.60/(1- 0.60)=1.5;若LR=4.4,则:验后比= 1.5 4.4=6.6验后概率= 6.6/ (1+6.6)=0.8684 即患者检查结果为阳性时,目前心绞痛发生的可能性增加到86.84%。,似然比=1,表示验前与验后概率相同,不需做此试验。似然比l,表示在做试验后患该病的可能性增大。似然比越大,患
15、该病可能性越大。似然比1,表示患病可能性小,似然比越小,患病的可能性越小,,表11 似然比对验后概率变化的影响,似然比的应用:,似然比应用步骤,1、从文献中找出某一症状的似然比或找出不同 诊断水平的似然比以及联合诊断的似然比; 2、确定其可行性和诊断试验在理论上的结果; 3、估计病人的验前概率,应用公式及似然比计算出第一个诊断试验后的验后概率; 4、第一个验后概率是下一个诊断试验的验前概率,重复上述过程,即可得到最后的诊断。,表12 根据试验结果产生的验后概率,*验前概率,ROC工作曲线,血糖界限值 敏感性 特异性 Youden指数 (mg/dl) (%) (%) (%) 80 100.0 1
16、.2 1.290 98.6 7.3 5.9100 97.1 25.3 22.4110 92.9 48.3 41.2120 88.6 68.2 54.8130 81.4 82.4 63.8140 74.3 91.2 65.5150 64.3 96.1 60.4160 55.7 98.6 54.3170 52.9 99.6 52.5180 50.3 99.8 50.1190 44.3 99.8 44.1200 37.1 100.0 37.1,不同血糖界值筛检糖尿病的敏感性和特异性,ROC曲线也可用来比较两种和 两种以上诊断试验的诊断价值, 从而帮助临床医师作出最佳选择。,诊断准确度较低(,0.7,
17、),0.0,0.2,0.4,0.6,0.8,1.0,0.0,0.2,0.4,0.6,0.8,1.0,FPR,T,P,R,A,0.664,A,0.830,诊断准确度较高,(,0.9,),0.0,0.2,0.4,0.6,0.8,1.0,0.0,0.2,0.4,0.6,0.8,1.0,FPR,T,P,R,A,0.938,ROC曲线下面积(Area)与诊断准确度高低 高 0.90-1.00 = excellent (A) 中 0.80-0.90 = good (B) 0.70-0.80 = fair (C) 低 0.60-0.70 = poor (D) 0.50-0.60 = fail (F),联合试验 平行试验 系列试验,第四节 提高试验效率的办法,第四节 提高试验效率的办法,全部筛检对象 先用第一种试验初筛 阳性 阴性 再用第二种试验复筛 阳性 阴性 筛检阴性 筛检阳性 进一步确诊 非病人 病人,(平行试验),第四节 提高试验效率的办法,全部筛检对象 先用特异性高的试验初筛 阴性 阳性 筛检阴性 再用第二种试验复筛 阴性 阳性 筛检阴性 筛检阳性进一步确诊 非病人 病人,(系列试验),选择患病率高的人群,第四节 提高试验效率的办法,大家辛苦了,