收藏 分享(赏)

基于深度学习的ct脑影像分类方法用于阿尔茨海默病的初步筛查.doc

上传人:无敌 文档编号:152729 上传时间:2018-03-22 格式:DOC 页数:8 大小:117.50KB
下载 相关 举报
基于深度学习的ct脑影像分类方法用于阿尔茨海默病的初步筛查.doc_第1页
第1页 / 共8页
基于深度学习的ct脑影像分类方法用于阿尔茨海默病的初步筛查.doc_第2页
第2页 / 共8页
基于深度学习的ct脑影像分类方法用于阿尔茨海默病的初步筛查.doc_第3页
第3页 / 共8页
基于深度学习的ct脑影像分类方法用于阿尔茨海默病的初步筛查.doc_第4页
第4页 / 共8页
基于深度学习的ct脑影像分类方法用于阿尔茨海默病的初步筛查.doc_第5页
第5页 / 共8页
点击查看更多>>
资源描述

1、基于深度学习的 CT 脑影像分类方法用于阿尔茨海默病的初步筛查 惠瑞 高小红 田增民 中国人民解放军海军总医院神经外科 布莱根妇女医院神经外科 密德萨斯大学计算机科学部 摘 要: 目的 本研究旨在探讨卷积神经网络 (Convolutional Neural Network, CNN) 深度学习在脑 CT 影像分类中的应用, 达到提高影像分类智能化程度的目的, 为临床筛查阿尔茨海默病 (Alzheimer Disease, AD) 提供便利。方法 收集20142016 年 3 个类别的脑 CT 影像资料, 其中包含 AD、器质性病变 (如肿瘤、脑出血等) 和正常老年化的受试者的数据。由于本组 C

2、T 脑图像高度方向 (z 轴, 层厚 5 mm) 单位长度相对水平方向大的特点, 本研究将 CT 二维轴位 CNN 图像和三维分割组块进行融合运算分类后对照已有的诊断。结果 AD、器质性病变和正常老年化的分类准确率分别为 84.2%、73.9%和 88.9%, 平均为 82.3%。结论 本研究为初筛 AD 提供了新的方法。关键词: 卷积神经网络; 图像分类; CT 影像; 阿尔茨海默病; 作者简介:惠瑞, 邮箱:收稿日期:2017-11-08基金:国家 863 计划 (2007AA420100-1) CT Brain Image Classification Based on Deep Lea

3、rning in Application of Screening of Alzheimer DiseaseHUI Rui GAO Xiaohong TIAN Zengmin Department of Neurosurgery, Navy General Hospital of the Chinese Peoples Liberation Army; Department of Computer Science, Middlesex University; Abstract: Objective The study aims to discuss the application of dee

4、p leaning based on the convolutional neural network (CNN) in the CT imaging classification, so as to improve the intelligent image classification for clinical screening of Alzheimer disease (AD) . Methods Three categories of brain CT image data, including the data from AD patients, organic lesion pa

5、tients (eg. tumor, cerebral hemorrhage) and normal aging patients were collected. For the reason that the relative horizontal direction in CT brain image was high (z axis, seam thickness 5 mm) , we fused the two dimensional and three dimensional CNN data in this study, and the results were compared

6、with the diagnostic results. Results The accuracy rates of diagnosis for AD patients, organic lesion patients and normal aging patients were 84.2%, 73.9% and 88.9% respectively, with mean rate of 82.3%. Conclusion Our results supply a new method for preliminary screen of AD.Keyword: convolutional ne

7、ural network; image classification; CT image; Alzheimer disease; Received: 2017-11-08引言阿尔茨海默氏症 (Alzheimers Disease, AD) 在全世界 65 岁以上老年人的发病率约为 4%6%, 最近统计数据表明全球已有将近 4000 万名 AD 患者1。事实上, 估计有 60%的老年人有类似 AD 的表现但无法得到确诊2。此外, 患者到达 AD 中晚期后治疗手段非常有限, 因此 AD 的早期诊断显得尤为重要。计算机断层扫描 (CT) 因其快速、简单、廉价, 同时又具备较好的成像质量的特点, 几乎

8、在每一家医院使用。此外, CT 还可能是第一个被引入到人类大脑研究的成像工具3。然而, 虽然大多数可疑的脑病患者虽都需要进行 CT 检查, 但就功能性脑病患者而言, 其主要目的为排除其他可能的器质性疾病 (例如, 颅内肿瘤、脑出血、脑梗死等) 。因为 CT 影像对软组织的对比度较差, 且检查人员在手工测量脑结构 (例如内侧颞叶、海马结构等) 时会出现一些误差, 所以对于 AD 等功能性疾病, CT 并没有作为主要诊断工具4。另外, 在 CT 脑影像对 AD 的辅助诊断方面, 特定的脑萎缩不仅与 AD 有关, 也与正常老化和脑血管疾病有关。比如, 内侧颞叶萎缩已被证明是 AD 最重要的诊断标志物

9、, 但这不具备很强的特异性。此外, AD 患者中也发现了海马 (尤其是左侧海马) 的萎缩, 这也会出现在健康的老年人身上5。然而, 通过精确测量CT 影像中颞角和鞍上池萎缩比率可以提高 90.2%的诊断准确性5。因此, 基于CT 影像的线性测量在 AD 患者诊断过程工作是很有价值的。目前已有利用核磁共振影像 (MRI) 训练神经网络模型以早期诊断 AD 的文献报道, 例如利用基于改进的 Alex Net 神经网络模型进行 MRI 数据训练, 已取得了较好的测试结果6。但在实际临床工作中 CT 较 MRI 更易获得, 所以本研究以CT 影像为主要研究对象。为了降低在人工测量过程中可能出现的较大误

10、差4, 本研究是利用卷积神经网络 (Convolutional Neural Network, CNN) 的最新技术, 对阿尔茨海默病的 CT 影像数据的分类、分割和测量进行非监督的自动处理。在本研究中, 对 AD 患者 CT 影像的分类, 即对健康 (正常) 老年化和脑内病变CT 影像的识别是本研究的重点。深层学习模型是一类机器学习层次结构, 通过从低层级构建高级特性8-9, 从而进行自动化特征构建。这些结构模型中应用较广的是卷积神经网络9。CNN由一组机器学习算法构成, 包括涉及学习的算子处理层 (线性和非线性) 等多个层级 (深层) , 因此必须通过从低层级数据构建高层级的数据, 从而实

11、现信息或特征的自动化构建10。已经证明, 在适当的规则下训练, 神经网络在不依赖手工采集特征的条件下可以很好的实现对物体的识别, 如尺度不变特征变换、加速稳健特征11-12。此外, 神经网络已被证明对存在一定变量的输入数据相对不敏感10。受生物视觉信号处理机制的启发, CNN 运用前馈人工神经网络来模拟变化的多层感知器13。利用此特性, 它被广泛地用于图像和视频的识别。目前, CNN已经被证明是理解图像内容的有效模型, 在图像识别、图形分割、图像检测与提取等方面可以得到很好的结果14。Liu 等15利用了 5 个卷积层的 CNN 结构设计, 采用最大池化的方法进行了 3 次降采样取得预训练网络

12、来计算 MRI 图像在各层的特征, 从而对 AD 等不同疾病进行分类。此外, 计算机硬件技术的进步已经使 CNN 在图像处理方面的应用成为现实。然而, CNN 在计算机视觉信息处理领域的成功应用主要基于二维图像的处理。虽有少数研究报道 CNN 可以在处理二维视频中发挥作用13, 但在一定程度上对三维图像进行处理却与此不同。在本研究中, 我们使用二维和三维模式的CNN 来处理 CT 脑影像。1 材料和方法1.1 数据预处理和三维 CT 影像平均化本研究共收集了 342 位受试者的 CT 数据, 其中 71 人为 AD 患者, 138 人患有各种类型的器质性病变, 133 人为老年正常受试者。在我

13、们的资料中, 每位受试者 CT 数据的层数和像素有所不同, 层数为 26 到 35 层, 像素为 512512 或912912 (图 1) 。图 1 本研究受试者的 CT 影像 下载原图注:a.AD 患者;b.器质性病变患者;c.正常对照者。对于二维影像, 每个层面都进行图像分割并标准化为 360360 像素。对于正常人和 AD 患者的 CT 影像数据, 取中间的 20 个层面作为此类影像的研究数据库。而对于有器质性病变的 CT 影像数据, 只选取包含可见病变 (例如肿瘤) 的层面作为研究数据库。结果显示, 虽然而对于有器质性病变的 CT 影像研究数据库是3 类中最大的, 但其层面的总数与其他

14、数据相近。同时, 对于三维影像, 每个受试者的 CT 影像数据分别进行注册、图像分割并标准化为 20020020 像素的三维图像。这样, CT 数据相对层厚为 5 mm。由于CT 可很好地显示脑周围的骨性结构, 我们选择刚体几何变换如公式 (1) 所示。其中, T 为需要确定的包含平移、旋转和缩放参数的变换矩阵, I moving为要注册的源图像, I fixed为图像模板。因此, 为了实现 T 中各参数的确定, 公式 (2) 需被最小化。其中, x i指从图像模板 (作为参考) 和源图像 (作为源) 图像中选择的若干对应点。为了补偿每个图像可能因强度不同而出现的缩放, 增加了一个额外的强度缩

15、放因子 sa。为了实现公式 (2) , 我们选择一个有 30 个层面的 CT 数据模版作为图像模版, 其他 CT 图像数据则与之对齐。完成标准化后, 每个三维 CT 图像数据被分解为 404010 像素的组块。与处理二维 CT 图像类似, 对于 AD 患者和正常人的数据, 所有组块都被用于数据训练, 而对于有器质性病变 CT 图像数据, 只使用含有可见病变的组块。1.2 二维与三维 CNN 的实现在本研究中, 二维 CNN 是沿大脑轴位方向使用基于 Mat Conv Net16-17的Matlab 软件实现的。图 2 显示二维和三维 CNN 的融合过程。具体来说, 针于训练图像数据 (x, y

16、) , 图像 x 为三维图像, y 为图像 x 的指示符向量, 图像的特征参数, 即 w1wL, 将通过处理基于 CNN 的公式 (3) 来完成数据训练。图 2 二维和三维 CNN 的融合过程 下载原图其中, 为适当的损失函数 (如 hinge 损失函数或 log 损失函数) 。为获得这些特征参数, 二维 CNN 使用二维卷积算法在同层面的卷积层提取上一层面的特征参数, 然后应用叠加性偏差, 结果通过 S 函数传递, 如公式 (4) 中所示。在公式 (4) 中, tanh (.) 表示双曲正切函数;m 为上一层 (i-1) th 的数据参数指数;b ij指特征参数的偏差;w ijk是指在位置

17、(p, q) 的内核连接到的第 k 个特征参数;p i, Qi是指内核的高和宽。在二次采样层, 通过池化上一层面提取的特征参数使该层特征参数的分辨率降低, 从而增加不变扭曲的输入。CNN 的架构可以通过交替的方式堆叠多层卷积和二次采样来实现。在 CNN 的参数中, 如偏差参数 bij和权重参数 wijk通常使用监督或无监督的训练方法8,17-18。另外, 为了保留 CT 影像 Z 轴方向的信息, 人们对三维 CNN 进行了探索。在三维CNN 中, 通过三维内核向 x-y 轴方向 (即二维) 及 z 轴方向的卷积来实现, 在这里公式 (4) 可以扩展为公式 (5) 用来计算在 ith层面上 jt

18、h特征参数中某点位置的值。其中 Ri 为三维内核在 z 轴方向的数值, w ijm为内核 (p, q, r) th连接到上一层的特征参数 mth的数值。此外, 三维池化也被引入以增加输入图像中失真和噪声中的不变参数19。1.3 融合运算结果在二维 CNN 模型中, 每个层面的二维图像应用于训练模型, 而三维 CNN 模型则使用立方体组块 (404010) 。因此, 分类是在整体数据的级别上进行的, 且均结合了这两个模型。对于正常老年化组, 使用二维和三维数据分别对模型进行训练后, 其 95%以上的二维层面数据和全部的三维组块被标记为“正常老年化”。因 AD 或病变通常表现于一个以上的层面, 虽

19、然有 5%的二维数据 (即一个层面) 没有被标记, 但并不影响最终结果。而对于 AD 组和器质性病变组, 因某 CT 影像可能同时具有 AD 组和器质性病变组的特征, 经二维和三维模型训练后, 在用于测试的 CT 数据时, 如果标记为 AD 的层面或组块多, 则分类为 AD组, 反之则分类为器质性病变组。2 结果表 1 为图像处理过程中的数据信息。一个受试者的 CT 影像通常包含 26 到 35 个层面, 共有 342 个三维影像数据, 5876 个二维层面。这些数据被分为 3 组, 应用 CNN 完成训练、验证 (避免过度拟合) 和数据测试。表 1 每个运算过程中使用影像数据的数量 (n)

20、下载原表 总共有 180 组数据被随机抽选用来测试 CNN 分类系统, 其中包含 2700 个二维图像和 3795 个三维组块。每个组之间的数据的划分是随机选择的, 测试的混淆矩阵, 见表 2。CNN 分类完成后, 对照受试者的诊断计算分类准确率。表 2 3 个类别测试结果的混淆矩阵及准确率 (例) 下载原表 最终, 经过 CNN 分类运算及与原诊断对照, 3 类 CT 影像 AD 组、脑器质性病变组和正常老年化组的分类准确率分别为 84.2%、73.9%和 88.9%, 平均为82.3%。3 讨论与结论本研究应用了目前流行的 CNN 深度学习的方法为一组脑 CT 影像分类, 该组 CT影像的

21、受试者已明确诊断为 AD、脑器质性病变和正常老年化, CNN 完成了自动分类运算并具有很高的准确性。在本组数据中, 虽然属于脑器质性病变的类别中包含最多的影像数据 (n=138) , 但并非每个二维层面或三维组块都包含病变信息。因此, 脑器质性病变组图像数目实际最少, 只有 1717 个层面, AD 组和正常老年化组分别为 1430 和 2729个层面。虽然 3 个类別的数据总量差异不显著, 特别是 AD 和脑器质性病变组数据量十分接近, 分类准确率的结果似乎与每组数据的数量有相关性。例如, 正常老年化组的数据量最大, 总共有 2729 个层面, 其分类准确率 88.9%也在 3 类中是最高的

22、。所以, 可以得到的结论是, 更多的数据将获得更好的分类结果。此外, 虽然 CT 影像实际为三维影像, 但因其层厚较大 (5 mm) 导致三维 CT 影像的分类不如二维影像分类精确。因此, 本研究融合使用二维和三维 CT 影像数据, 以获得更好的结果。结果显示, 对 AD 患者的 CT 影像分类准确率达到 84.2%,其高准确性使该方法可以作为 AD 的初筛工具使用, 为早期诊断 AD 提供重要保证。参考文献1Querfurth HW, Laferla FM.Alzheimers diseaseJ.New Engl J Med, 2010, 362 (4) :329. 2Dementia:ht

23、tps:/www.gov.uk/government/news/EB/OL.2015-03. 3Waldemar G, Hgh P, Paulson OB.Functional brain imaging with single-photon emission computed tomography in the diagnosis of Alzheimers diseaseJ.Int Psychogeriatrics, 1997, 91 (1) :223.2. 4Jobst KA, Smith AD, Szatmari M, et al.Detection in life of confir

24、med Alzheimers disease using a simple measurement of medial temporal lobe atrophy by computed tomographyJ.Lancet, 1992, 340 (8829) :1179-1183.3. 5Zhang Y, Londos E, Minthon L, et al.Usefulness of computed tomography linear measurements in diagnosing Alzheimers diseaseJ.Acta Radiologica, 2008, 49 (1)

25、 :91-97. 6吕鸿蒙, 赵地, 吃学斌.基于增强 Alex Net 的深度学习的阿尔茨海默病的早期诊断J.计算机科学, 44 (6) :50-60. 7Oksengaard AR, Haakonsen M, Dullerud R, et al.Accuracy of CT scan measurements of the medial temporal lobe in routine dementia diagnosticsJ.Int J Geriatr Psych, 2003, 18 (4) :308-12. 8Fukushima, K.Neocognitron:A self-orga

26、nizing neural network model for a mechanism of pattern recognition unaffected by shift in positionJ.Biol Cyb, 1980, 36:193-202. 9Lcun Y, Bottou L, Bengio Y, et al.Gradient-based learning applied to document recognitionJ.P IEEE, 1998, 86 (11) :2278-2324. 10Lecun Y, Huang FJ, Bottou L.Learning methods

27、 for generic object recognition with invariance to pose and lightingA.Computer Vision and Pattern RecognitionC.Washington:Proceedings of the 2004 IEEE Computer Society Conference on IEEE, 2004, 2:97-104. 11Kumar P, Henikoff S, Ng PC.Predicting the effects of coding non-synonymous variants on protein

28、 function using the SIFT algorithmJ.Nat Protoc, 2009, 4 (7) :1073-1081. 12Feng Q, Xu W, Zhang X, et al.Research of image matching based on improved SURF algorithmJ.Telk Indon J Elec Engin, 2013, 12 (2) :1395-1402. 13Lecun Y.Le Net-5, convolutional neural networksJ. 14张柏雯, 林岚, 吴水才.深度学习在轻度认知障碍转化与分类中的应

29、用分析J.医疗卫生装备, 2017, 38 (9) :105-111. 15Liu F, Shen C.Learning deep convolutional features for MRI based Alzheimers disease classificationEB/OL.https:/ 16Xu W, Xu W, Yang M, et al.3D Convolutional Neural Networks for Human Action RecognitionJ.IEEE T Pattern Anal, 2012, 35 (1) :221-231. 17Vedaldi A, Le

30、nc K.Mat Conv Net:Convolutional neural networks for MATLABJ.2014:689-692. 18Marc, Huang FJ, Boureau Y, et al.Unsupervised learning of invariant feature hierarchies with applications to object recognitionA.Columbus:Computer Vision and Pattern RecognitionC, 2007:1-8. 19Lazar NA, Luna B, Sweeney JA, et al.Combining brains:a survey of methods for statistical pooling of informationJ.Neuroimage, 2002, 16 (2) :538-550.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 期刊/会议论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报