1、基于 Bayes 理论的计算机辅助诊断系统在孤立性肺结节 CT 诊断中的应用陈伟 刘进康 李文政 熊曾 龙学颖 周晖 (中南大学湘雅医院放射科,湖南长沙 410008)摘要: 目的 初步探讨基于 Bayes理论的计算机辅助诊断(computer-aided diagnosis, CAD)系统在孤立性肺结节(solitary pulmonary nodule, SPN)CT 诊断中的价值。方法 依据 Bayes理论先从 352例 SPN训练集(恶性135例,良性 217例)中求出恶性 SPN的验前比及各临床和 CT表现的似然比,再建立基于 Bayes理论的 CAD系统,用它计算每个 SPN的恶性
2、概率。并前瞻性地检验该系统在 132例 SPN测试集(恶性 61例,良性 71例)中的诊断效能,与 2位高年资和 2位低年资放射科医生常规阅片的表现作比较。结果 成功构建基于Bayes理论的 CAD系统,它诊断训练集 SPN的敏感度、特异度和符合率分别为88.9、93.1、91.5,诊断测试集 SPN的敏感度、特异度、符合率、阳性预测值及阴性预测值分别为 88.5、85.9、87.1、84.4、89.7,其诊断符合率与高年资甲、乙医生比较无统计学差异( P均 0.05) ,但高于低年资丙、丁医生( P均 0.05) 。 结论 基于 Bayes理论的 CAD系统将是一个有效的诊断辅助工具,可以提
3、高医生尤其是低年资医生对 SPN良恶性质的正确判断,并在指导 SPN的临床决策中有一定的参考作用。关键词: 硬币病变,肺;体层摄影术,X 线计算机;诊断,计算机辅助;Bayes理论Application of Bayesian theory based computer-aided diagnosis system in the CT diagnosis of solitary pulmonary nodulesCHEN Wei, LIU Jin-kang, LI Wen-zheng, XIONG Zeng, LONG Xue-ying, ZHOU Hui. (Department of Ra
4、diology, Xiangya Hospital, Central South University, Changsha 410008, China)Abstract Objective To preliminarily explore the value of computer-aided diagnosis (CAD)system based on Bayesian theory in the diagnosis of solitary pulmonary nodules (SPNs) with CT. Methods Three hundred and fifty-two consec
5、utive SPN cases (malignancy n=135, benignity n=217) were collected retrospectively to form the training set. According to Bayesian theory, the prior odds of malignant SPNs and the likelihood ratios of clinical and CT findings were derived from the training set firstly, then a Bayesian theory based C
6、AD system was constructed and the probability of malignancy in each SPN was obtained from this system. SPs with 50% calculated probability were judged as malignancy and those with 50% calculated probability was judged as benignity. On the test set (malignancy n=61, benignity n=71), the Bayesian theo
7、ry based CAD system was tested prospectively for its diagnostic validation, compared with the performance of the two chest radiologists and two radiologic residents using routine diagnostic method. Results The Bayesian theory based CAD system was constructed successfully. The sensitivity, specificit
8、y, accuracy of this system for the training set were 88.9%, 93.1%, 91.5% respectively. On the test set, the sensitivity, specificity, accuracy, positive predictive value, negative predictive value of this system were 88.5%, 85.9%, 87.1%, 84.4% and 89.7% respectively, its accuracy showed no statistic
9、ally significant with chest radiologist A (80.3%, 2=2.37, P=0.122) and B (79.5%, 2=3.12, P=0.076), and was higher than radiological residents C (74.2%, 2=7.05, P=0.012) and D (74.2%, 2=6.56, P=0.009). Conclusion The Bayesian theory based CAD system will be a potentially useful diagnostic aid which c
10、an help physicians differentiate benign from malignant SPNs, especially for less experienced physicians, and play a reference role in guiding the management of SPNs.Key words coin lesion, pulmonary; tomography, X-ray computed; diagnosis, computer-assisted; Bayes theorem基金项目:湖南省自然科学基金资助项目(07JJ5010)Su
11、pported by the Natural Science Foundation of Hunan (07JJ5010)作者简介:陈伟,男,湖南祁东人,硕士研究生,主要从事 CT图像后处理及质量控制工作。电话:(0731)4327441,E-mail: chenwei_通讯作者:刘进康,电话:(0731)4327441,Email: 孤立性肺结节(solitary pulmonary nodule, SPN)是指在 X线上表现为肺内单发的直径3cm 的圆形或类圆形不透光区,不伴有区域性淋巴结肿大、阻塞性肺不张或肺炎 1。SPN 的定性诊断往往是放射和临床医生共同面临的一个挑战。尽管近年以研究
12、分类决策树、神经网络等高级数据挖掘技术辅助诊断 SPN为热点,但是传统的计量诊断方法因其可以预测 SPN的恶性概率而具有较大的临床应用价值 2。本研究运用计量诊断中的 Bayes分析结合计算机技术编制一个简便易行的计算机辅助诊断(computer-aided diagnosis, CAD)系统,以期为 SPN的定性诊断和临床决策提供帮助。1 资料与方法1.1 临床资料病例纳入标准:CT 上表现为肺内单发的长径与短径平均值3cm 的圆形或类圆形不透光区;可出现空洞、钙化或伴有卫星病灶;经病理或临床证实者。排除标准:伴有区域性淋巴结肿大、阻塞性肺不张或肺炎;图像存在明显伪影致形态学评价或 CT值测
13、量不可靠者。搜集我院(三级综合性医院)CT 室 2005年 1月至 12月的连续 SPN病例 352例作为本研究的训练集,其中,恶性 135例,男 92例,女 43例,年龄 1987 岁,平均 59.0岁;良性 217例,男 149例,女68例,年龄 781 岁,平均 44.4岁。另搜集我院 2007年 3月至 6月经 CT发现的 132例 SPN作为测试集,其中,恶性 61例,男 44例,女 17例,年龄 1976岁,平均 57.1岁;良性 SPN 71例,男 47例,女 24例,年龄 1970 岁,平均47.7岁。全部病例中,196 例恶性 SPN均经手术或穿刺活检的病理证实,包括鳞癌 2
14、6例,腺癌 82例,细支气管肺泡癌 28例,孤立性转移瘤 15例,组织类型未明的恶性肿瘤 45例;除 40例结核瘤和 21例炎性假瘤经病理证实外,其余 227例良性 SPN由 CT随访缩小、消失及 2年以上稳定等临床途径证实。除测试集中56例经临床证实者为随访截尾时病例,其余均为新发病例。追查每例 SPN患者的临床信息,包括年龄、发病时的主要症状、吸烟史及有无恶性病史等。1.2 CT扫描方法采用 PHILIPS Brilliance 16层螺旋 CT机。扫描范围自肾上腺水平至肺尖,平静呼吸下屏气时扫描。无碘对比剂禁忌症,平扫图像无较大空洞和弥漫性钙化,直径 1030mm 的 SPN患者行增强扫
15、描。增强扫描使用非离子型对比剂和高压注射器,注射总量按每千克体重 1.5ml计算,注射流率为 2ml/s,常规增强扫描的延时时间为 80s,动态增强方案为注药开始后第 1、2、3、4、5 分钟对全结节行螺旋扫描。主要技术参数为:120kVp,100250mAs, 探测器组合 161.5mm,螺距 0.60.9,重建层厚 2mm,重建间隔 1mm,重建矩阵 512512。1.3 图像测量及评价CT图像的测量和征象评判均在工作站中的实时 MPR图像上进行。结节大小测量的窗宽为 1200HU,窗位为-600HU。强化值测量的窗宽为 200HU,窗位为 40HU,兴趣区选择结节强化最明显的实质区,取增
16、强后 CT值(动态增强为强化峰值)与平扫 CT之差值作为结节的强化值。结节的形态学评判参照国内外文献公认的标准,部分可量化指标规定如下:结节出现 1个以上弧弦距与弦长比值4/10 的分叶征象归为“深分叶”(包括棘突征),余为“浅分叶” ;结节有2 条较平直或成角的规整边缘为“多边形”的轮廓形态 3;以长度5mm 毛刺为主的毛刺征归为“长毛刺” ,余为“短毛刺” ;结节内出现直径5mm 的透光区为空洞,而仅出现直径5mm 的透光区为空泡征。先由 2名具有 15年以上胸部 CT阅片经验的高年资放射科医生甲、乙盲法分别评价全部病例的 SPN形态学征象,存在分歧时通过协商达成一致,并独立估计测试集 S
17、PN的恶性概率。再由具有 5年左右工作经验的低年资放射科住院医生丙、丁参照高年资医生已认定的 CT征象,各自独立作出测试集 SPN恶性概率的估计。1.4 Bayes理论及 CAD系统的建立本研究运用 Bayes理论中的似然比和相对比(odds)形式 4 ,将恶性 SPN的验前比、验后比及对定性诊断可能有意义的临床表现和 CT征象以线性方式关联起来,并以此计算 SPN的恶性发病概率。用下列公式表示: 公式(1)1preprerPO 公式(2)(/)aMMBXYLRP 公式(3)12pospre mOLRLR 公式(4)1POSPS其中 Ppre、P pos分别代表恶性 SPN的验前概率(即恶性构
18、成比)和验后概率,Opre、O pos分别代表恶性 SPN的验前比和验后比,P(X a/YM)、P(X a/YB)分别代表某判别指标 Xa 在恶性 SPN (Y M)和良性 SPN (Y B)中的发生概率(可由样本频率估计) , LR代表某判别指标的似然比(likelihood ratio, LR) ,用来表示某临床表现或影像学特征出现或不出现时 SPN恶性发病与良性发病机会的比例,其取值0至无穷大,越大于 1,越提示恶性诊断;越趋于 0,越提示良性诊断;而取值为1时,对 SPN的良恶性诊断无任何鉴别意义。本研究参照文献纳入 4项临床指标和 13项 CT指标作为鉴别 SPN良恶性质的判别指标,
19、共 47种状态(见表 1) ,将年龄、吸烟量、结节大小和强化值等计量资料转换成等级资料,并假定各判别指标和指标下的各状态相互条件独立。在 352例训练集中,运用公式(1) 、公式(2)分别求出恶性 SPN的验前比和各判别指标在不同状态下的似然比。 。再根据所得验前比、似然比及公式(3)和公式(4) ,运用 VC+语言在 Microsoft Visual C+6.0编译环境下制作了一个简便易行的基于 Bayes理论的 CAD系统,运用它计算出全部 SPN的恶性概率,计算概率50判为恶性,50判为良性。2 结 果2.1恶性 SPN的验前比为 0.61,SPN 相关的各项临床信息和 CT表现在不同状
20、态下的似然比见表 1。表 1 SPN 相关临床信息和 CT 表现在不同状态下的似然比似然比 似然比年龄 钙化模式40 岁 0.19 无钙化 1.3340-59岁 1.06 良性钙化 0.0360 岁 2.79 难定性钙化 0.80症状 卫星病灶基本无症状 1.15 有 0.19以咯血为主 1.24 无 1.43以胸痛为主 0.95 毛刺征以发热为主 0.23 无毛刺 0.74其他(咳嗽等) 0.88 长毛刺 0.63吸烟量 短毛刺 4.57400 支年 0.70 胸膜凹陷征400-799支年 2.25 有 1.78800 支年 3.43 无 0.41恶性病史 血管集束征有 3.42 有 2.2
21、6无 0.91 无 0.17部位 支气管征上/中叶 1.08 有 1.85下叶 0.89 无 0.72结节大小 空洞4-10mm 0.24 无空洞 1.1211-20mm 0.77 良性空洞 0.2021-30mm 1.66 恶性空洞 1.61衰减密度性质 空泡征实性结节 0.84 有 4.98部分实性结节 2.61 无 0.81非实性结节 3.21 强化值结节轮廓 20HU 0.08平滑 0.26 20-59HU 2.98浅分叶 1.16 60HU 0.19深分叶 3.88多边形 0.142.2 根据表 1结果和 Bayes分析的公式,成功构建基于 Bayes理论的 CAD系统(图 1) 。
22、该系统回代检验 352例训练集 SPN,其敏感度、特异度和符合率分别为88.9、93.1、91.5,它前瞻性地检验 132例测试集 SPN的阳性预测值和阴性预测值分别为 84.4、89.7,与 4位医生诊断 SPN的真实性指标及其比较见表 2。AD 为同一 SPN病例,手术病理为低分化腺癌,男,41 岁,咳嗽、咳痰,无恶性病史,不吸烟。A:示左肺上叶大小为 29mm27mm30mm的实性结节,见深分叶和胸膜凹陷征;B:示支气管征和血管集束征;C:示强化值为 41HU;D:示基于 Bayes理论的 CAD系统预测该 SPN的恶性概率为 98.4。E 和 F为同一 SPN病例,手术病理为错构瘤,男
23、,56 岁,体检时胸片发现异常,无恶性病史,吸烟 36年,30 支/日,基于 Bayes理论的 CAD系统预测其恶性概率为 0.6。E:示右肺上叶大小为 27mm25mm26mm的实性结节,见浅分叶;F:示良性钙化。图 1 基于 Bayes 理论的 CAD 系统诊断 SPN 实例表 2 Bayes 分析与 4 位医生诊断 132 例测试样本的真实性指标及其比较敏感度()特异度()符合率() 2值 P值Bayes分析 88.5 85.9 87.1 高年资甲医生 77.0 83.1 80.3 2.37a 0.124a高年资乙医生 86.9 73.2 79.5 3.12a 0.077a低年资丙医生
24、55.7 90.1 74.2 7.05a 0.008a低年资丁医生 72.1 76.1 74.2 6.56a 0.010a注: a代表 4位医生常规阅片法与 Bayes分析法诊断符合率的比较,为无数据3 讨 论SPN是胸部放射线检查常见的病变之一,大多在胸部 X线片上被偶然发现,近年随着肺癌 CT筛查的应用和多层螺旋 CT的普及,被发现的 SPN越来越多,其诊断和处理一直是临床上的难点。3.1 基于 Bayes理论的 CAD系统在 SPN定性诊断和临床决策中的应用价值。SPN的病因多达二三十种,引人关注的焦点还是在 SPN良、恶性的二分类定性诊断,旨在尽可能切除可治愈的恶性结节和避免良性结节的
25、不必要手术。但是,与 SPN相关的临床信息和影像学表现在良恶性 SPN中存在部分重叠,导致多数SPN的性质难以确定或诊断正确率不高,尤其体现在经验欠缺的低年资医生的诊断过程中。Bayes 理论指出:如果事件的结果不确定,那么量化它的唯一方法就是该事件的发生概率。本研究运用的 CAD系统能够综合 SPN的恶性发病率、与SPN相关的各临床及 CT表现等已知信息计算、预报 SPN恶性的发病概率。从表 2得知,运用该系统预报的恶性概率对 SPN进行定性判断的符合率与经验丰富的高年资医生对 SPN定性诊断的符合率相当( P 0.05 ) ,明显高于经验欠缺的低年资医生( P 0.05) 。此外,运用该系
26、统预报的恶性概率来指导 SPN处理措施的抉择具有一定的实际意义。譬如,参照相关权威组织提供给 SPN患者的建议 5,6,低的恶性概率采取 CT随访等温和的观察手段,高的恶性概率可以立即进行手术,而中等的恶性概率可以行 PET检查或穿刺活检等,如此以较低医疗成本和风险获得最佳效果。3.2 基于 Bayes理论的 CAD系统与其他数据挖掘技术的比较。数据挖掘是一种能从大量的、模糊的随机数据中提取有用知识的信息处理技术。它用在 SPN的诊断中,极大地扩大了医生有限的个人知识和经验,可以提高分析判断的客观性和全面性,且可重复性好,不易疲劳。在 CAD系统中用到的数据挖掘方法主要有统计方法(计量诊断)
27、、决策树、神经网络,以及遗传算法、模糊逻辑等技术。与同为计量诊断的最大似然法相比,本系统利用了 SPN的验前概率,判别的符合率有所提高;与 logistic回归严格的判别指标筛选相比,本系统充分利用了 SPN相关的临床和影像信息,符合医生常规的诊断思维;与人工神经网络“暗箱式”的推理不可理解性和复杂性相比,本系统具有概率推理、逻辑简单、可处理缺省数据和操作性好的特点;与分类决策树赋值的无特定意义相比,本系统报告的恶性概率可用来定性 SPN和指导 SPN的临床决策 1。尽管,基于 Bayes理论的 CAD系统有相当于高年资医生的诊断符合率,但对于个体病人来说,运用该方法仍然可能在其身上发生不可料
28、想的误诊或漏诊。因此,该系统可以作为医生在鉴别 SPN时的一个有力的辅助工具,但并不能取代医生的地位作完全的“自动化”诊断。参 考 文 献:1 Jeong YJ, Yi CA, Lee KS. Solitary pulmonary nodules: detection, characterization, and guidance for further diagnostic workup and treatmentJ. AJR Am J Roentgenol, 2007, 188(1): 57- 68.2 陈卉, 王晓华. 数据挖掘技术在计算机辅助肺癌诊断中的应用J. 中国组织工程研究与临床
29、康复,2007,11(5):879- 8813 Furuya K, Murayama S, Soeda H, et al. New classification of small pulmonary nodules by margin characteristics on high resolution CTJ. Acta Radiol, 1999, 40(5): 496- 504. 4 Gurney JW. Determining the likelihood of malignancy in solitary pulmonary nodules with Bayesian analysis
30、. Part I. TheoryJ. Radiology, 1993, 186(2): 405- 413.5 Khan A. ACR Appropriateness Criteria on solitary pulmonary noduleJ. J Am Coll Radiol, 2007, 4(3): 152- 155.Gould MK, Fletcher J, Iannettoni MD, et al. Evaluation of patients with pulmonary nodules: when is it lung cancer?: ACCP evidence-based clinical practice guidelines (2nd edition) J.Chest, 2007, 132(3 suppl): 108s- 130s. 6