收藏 分享(赏)

数学建模 乳腺癌问题模型.doc

上传人:jinchen 文档编号:6031458 上传时间:2019-03-25 格式:DOC 页数:7 大小:301.50KB
下载 相关 举报
数学建模 乳腺癌问题模型.doc_第1页
第1页 / 共7页
数学建模 乳腺癌问题模型.doc_第2页
第2页 / 共7页
数学建模 乳腺癌问题模型.doc_第3页
第3页 / 共7页
数学建模 乳腺癌问题模型.doc_第4页
第4页 / 共7页
数学建模 乳腺癌问题模型.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

1、乳房癌的诊断模型马 壮 于翠影 张宏硕指导教师:王镁(内蒙古大学,呼和浩特 010021)摘要 本文对乳房癌的诊断问题,应用神经网络与模糊数学的理论,给出了几种乳房癌的量化诊断方案首先,建立了 LVQ 神经网络模型,使用 500 组数据的前 400 组作为训练样本,用后 100 组数据对网络性能进行检测,诊断正确率达 98%然后对这 500 个特征向量进行了回归分析,从 30 个特征中筛选出了 6 个特征,它们分别是:细胞核直径均值、标准差和最坏值、紧密度的均值、面积的最坏值、周长的均值并将以上 6 个特征用于 LVQ 网络,诊断正确率达 95%进一步考虑到神经网络与模糊数学各自的特点,将二者

2、有机结合构造了神经模糊系统,并用以上的 6 个特征对系统进行训练,诊断正确率达 96%本文构造的模型具有良好的稳定性,对于模式识别问题具有很强的实用价值,最后本文提出了神经网络和模糊数学深层次结合的方向一. 问题的重述乳房癌通过穿刺采样进行分析可以确定其为良性或恶性医学研究发现乳房肿瘤病灶组织的细胞显微图像的 10 个量化特征:细胞核直径,质地,周长,面积,光滑度,紧密度,凹陷度,凹陷点数,对称度,断裂度与该肿瘤的性质有密切关系现有 500 个已确诊病例,每个病例的一组数据包括采样组织中各细胞核的这十个特征量的平均值,标准差和“最坏值” (各特征的 3 个最大特征的平均值)共 30 个数据根据

3、这 500 组数据建立诊断模型,并将其用于另外 69 名已做穿刺采样的患者为节省费用发展一种只用此 30 个特征数据中的部分特征来区分乳房肿瘤是良性还是恶性的方法 二. 问题的假设1所给的 500 组病例具有广泛的代表性2500 组病例所反映的良性与恶性的概率分布符合病例的自然分布三. 问题的分析本问题是一个典型的模式识别问题,要求根据它的特征量来进行分类对于模式识别问题,现今有两类解决办法一类是传统的线性模型另一类是近年来发展起来的非线性模型本题是一个典型的非线性问题,用传统的线性模型解决有一定的困难,而且识别率不高所以非线性模型是解决此类问题的首选现今常用的非线性模型有神经网络模型和模糊系

4、统模型神经网络由许多并行运算的简单单元组成,单个神经元的结构及其简单,但大量神经元相互连接组成人工神经元网络显示出人脑的某些特征:1) 分布存储和容错性;2) 大规模并行处理;3) 自学习、自组织和自适应性;24) 它并不是各单元行为的简单相加,而表现出一般复杂非线性动态系统的特性神经元可以处理一些环境信息十分复杂、知识背景不清楚和推理规则不明确的问题,如乳房癌诊断问题模糊集打破了传统的分明集只有 0 和 1 的界限,任意元素可同时部分地属于多个模糊子集,隶属关系用隶属的程度来表示这更接近人的表述方式模糊规则是定义在模糊集上规则,常采用“If-then” (若则)的形式,可用来表示专家的经验、

5、知识等由一组模糊规则构成的模糊系统可代表一个输入、输出的映射关系从理论上说,模糊系统可以近似任意的连续函数模糊系统除了模糊规则外,还包括模糊逻辑推理和去模糊化的部分由于模糊集能处理非定量的信息,因此在模式识别(尤其是具有模糊特点的识别问题)中模糊系统具有很大的优势,本题肿瘤的良性、恶性正是模糊概念,所以用模糊系统进行模式识别会得到很好的效果为了避免量纲的影响,在应用数据之前对数据经行了标准化标准化方法:用每个数据与整体均值的差除以整体标准差四. 模型的建立与求解(一)神经网络模型学习向量量化(LVQ)是在监督状态下对竞争层进行训练的一种学习算法LVQ 网络由一个竞争层和一个线性层组成竞争层的神

6、经元将输入向量分成组,由现行层组合到期望的类中在任何给定的时刻,线性层的输出神经元只有一个非零输出 1,该神经元就是竞争中得胜者假定获胜的元为 ,它之所以获胜的原因是它受到了最大的输入刺激,那jN么, 的总加权输入为jNiNijjxS1其中, 表示 的状态, 表示第 个元到第 个元的权值, 表示第 个输入分量其jSjijjiixi矩阵形式为jSjWx若元 获胜,就意味着jNkmkj xx ,21a若连接到每个输出层神经元的权向量 都是规范化的,上式等),(21mkkTW价于TkmkTj xWx ,21in网络输入模式为 时,具有权向量 与 最近的元将获得竞争的胜利若元 竞kxj jN争获胜,将

7、权值作如下调整(1) TjkTjx3使获胜者的权向量向输入向量移近一小段距离,这使网络在遇到 或与 接近的模kxk式时,元 可以有更大的获胜可能性若 在竞争中失败,将权值作如下调整jNjN(2)TjkTjWx使权向离开样品的方向移动,这样就减小了错误分类的机会在(1) 、 (2)式中,表示学习率在本模型中取 为 0.01,取隐竞争层的神经元数为 60,取输出层神经元数为 2,并规定输出(0,1)为良性,输出(1,0)为恶性用前 400 组数据作训练样本,经过 15000次迭代,两类样本的聚类情况如下图:用后 100 组数据对训练进行检测,诊断正确率达 98%对 69 组待定病例的诊断结果如下表

8、: 病例号 类别病例号 类别 病例号 类别 病例号 类别914862 B 917062 B 91979701B 924632 B91504 M 917080 B 919812 B 924934 B91505 B 917092 B 921092 B 924964 B915143 M 91762702M 921362 B 925236 B915186 B 91789 B 921385 B 925277 B9151276 B 917896 B 921386 B 925291 B91544001B 917897 B 921644 B 925292 B91544002B 91805 B 922296 B

9、 925311 B915452 B 91813701B 922297 B 925622 M915460 M 91813702B 922576 B 926125 M91550 B 918192 B 922577 B 926424 M915664 B 918465 B 922840 B 926682 M915691 M 91858 B 923169 B 926954 M915940 B 91903901B 923465 B 927241 M491594602B 91903902B 923748 B 92751 B916221 B 91930402M 923780 B916799 M 919537

10、B 924084 B916838 M 919555 M 924342 B为了节省费用,增加网络训练速度,考虑将所给的数据降维,用多元回归分析的逐步回归法对数据进行了回归分析,把 30 个特征做为自变量,因变量采用良性病例取值为0,恶性病例取值为 1逐步回归法避免了只将变量剔除就不再选入的缺点,它可以将变量反复选入、剔除,最终可得到一组最优权值,结果如下图所示: 从 30 个特征中筛选出了 6 个特征,它们分别是:细胞核直径均值、标准差和最坏值、紧密度的均值、面积的最坏值、周长的均值只用以上 6 个特征对网络进行训练,仍使用前 400 组数据作为训练,用后 100 组数据检验,诊断正确率达 95

11、%对 69 组待定病例的诊断结果如下表:病例号 类别病例号 类别 病例号 类别 病例号 类别914862 B 917062 B 91979701 B924632 B91504 B 917080 B 919812 B 924934 B91505 B 917092 B 921092 B 924964 B915143 M 91762702 M921362 B 925236 B915186 B 91789 B 921385 B 925277 B9151276 B 917896 B 921386 B 925291 B91544001 B917897 B 921644 B 925292 B91544002

12、 B91805 B 922296 B 925311 B915452 B 91813701 B922297 B 925622 M915460 M 91813702 B922576 B 926125 M91550 B 918192 B 922577 B 926424 M915664 B 918465 B 922840 B 926682 M5915691 B 91858 B 923169 B 926954 M915940 B 91903901 B923465 B 927241 M91594602 B91903902 B923748 B 92751 B916221 B 91930402 M923780

13、 B916799 M 919537 B 924084 B916838 M 919555 M 924342 B五. 神经模糊系统模型 从映射角度看,模糊系统和神经网络都具有(非线性)函数近似的能力它们有着以下的共同之处:(1)它们均可以从给定的系统输入/输出信号(数据)中,建立系统的(非线性)输入/输出关系(2) 从数据处理的形式上看,它们均采用并行处理的结构但是,模糊系统和神经网络有着明显的不同之处神经网络虽然对环境的变化具有较强的自适应学习能力,但是从系统建模的角度而言,它采用的是典型的黑箱型的学习模式因此当学习完成后,神经网络所获得的输入/输出关系无法用容易被人接受的方式表示出来相反,模糊

14、系统是建立在被人容易接受的“如果-则”表达方法之上,但如何自动生成和调整隶属度函数和模糊规则,则是一个很棘手的问题因此,将模糊理论和神经网络有机结合起来,取长补短,提高整个系统的学习能力和表达能力,是目前这一领域最受人注目的课题之一神经网络和模糊系统的等价性:Kolmogorov 定理 给定任意连续函数 ,这里 是单位闭区yxfRUfmn)(,: U间0,1, 可以精确地用一 3 层前向网络实现,此网络的中间层(隐层)有 2n+1 个处f理单元BP 定理 给定任意 和任意 函数 ,存在一 3 层 BP 网络,它02Lmnf1,0:可在任意 平方误差精度内逼近 .f模糊系统的存在定理 给定任意连

15、续函数 和任意 ,存在由(1)RUfn:0式定义的 使 )(xg神经网络和模糊系统各自本身就是一个非线性的输入/输出映射,因此模糊系统可以用一等家的神经网络来表示,同样,神经网络也可以用一等价的模糊系统来表示基于神经网络的模糊系统:模糊系统采用高木-管野(Takagi-Sugeno Model)(简称 TS 模型):如果 为 ,和 为 ,和 为 ,则1xjA2x,jnxjA(xfyj输入变量的联合隶属函数和结论部的函数 fj(x)都用神经网络来求得模糊规则的个数由减法聚类方法得到,聚类参数如下:6Range of influence: 0.3Squash factor: 1.1Accept f

16、actor: 0.6Reject ratio: 0.15神经网络采用前向的 BP 网络,神经元的传递函数为 Sigmoid 函数,输出层采用线性函数网络结构如下图所示:由于系统的结构比较复杂,用 30 维的数据进行训练十分缓慢,只用了前面已提取出的 6 个特征对系统进行了训练,得到了神经模糊系统用后 100 组数据进行检验,诊断正确率达 96%病例号 类别病例号 类别 病例号 类别 病例号 类别914862 B 917062 B 91979701 M924632 B91504 B 917080 B 919812 B 924934 B91505 B 917092 B 921092 B 92496

17、4 B915143 M 91762702 M921362 B 925236 B915186 B 91789 B 921385 B 925277 B9151276 B 917896 B 921386 B 925291 B91544001 B917897 B 921644 B 925292 B91544002 B91805 B 922296 B 925311 B915452 B 91813701 B922297 B 925622 M915460 M 91813702 B922576 B 926125 M91550 M 918192 B 922577 B 926424 M915664 B 91846

18、5 B 922840 B 926682 M915691 M 91858 B 923169 B 926954 M915940 B 91903901 B923465 B 927241 M91594602 M91903902 B923748 B 92751 B916221 B 91930402 M923780 B916799 M 919537 B 924084 B7916838 M 919555 M 924342 B六. 模型的进一步讨论神经网络和模糊系统的融合大致有两种形式:一种是用神经网络生成模糊系统的隶属函数和模糊规则来构造模糊系统,一种是使用模糊系统来初始化神经网络的初始权值来构造神经网络二

19、者都可用于模式识别,并都有良好的效果但二者的特点又各不相同,第一种形式具有更加人性化的输出,便于构造专家系统,第二种形式有更好的自适应性对于模型的进一步讨论可以考虑二者的进一步结合,可以让两种系统按并行或串行的方式结合到一起,前一种系统的输出作为后一种系统的输入,这样二者接替使用,最终由模糊系统输出结果,用于专家系统的分析参考文献1 赵振宇、徐用懋,模糊理论和神经网络的基础与应用,清华大学出版社2 袁曾任,人工神经元网络及其应用,清华大学出版社3 叶其孝,大学生数学建模竞赛辅导教材,湖南教育出版社4 施阳、李俊,MATLAB 语言工具箱-TOOLBOX 实用指南,西北工业大学出版社5 徐昕、李涛、伯晓晨,MATLAB 工具箱应用指南-控制工程篇,电子工业出版社

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报