1、图像分割技术回顾如前所述,图像分割是图像处理领域中的一个基本问题。由于问题的重要性和困难性,几十年来吸引了很多研究人员为之付出了巨大的努力,发表了相当多的研究结果和方法,而图像分割方法的综述或评论也屡有所见 。从大的方面来说,图像分割方法可大致分312为基于区域的方法、基于边缘的方法、区域与边缘相结合的方法,以及在此基础上的、采用多分辨率图像处理理论的多尺度分割方法 。基于区域的方法采用某种准则,直接将6,图像划分为多个区域,基于边缘的方法则通过检测包含不同区域的边缘,获得关于各区域的边界轮廓描述,达到图像分割的目的,而区域与边缘相结合的方法通过区域分割与边缘检测的相互作用,得到分割结果。1
2、基于区域的图像分割按照以上的划分方法,图像分割中常用的直方图门限法、区域生长法、基于图像的随机场模型法、松弛标记区域分割法等均属于基于区域的方法。直方图门限分割就是在一定的准则下,用一个或几个门限值将图像的灰度直方图(一维的或多维的)分成几个类,认为图像中灰度值在同一个灰度类内的象素属于同一个物体,可以采用的准则包括直方图的谷底 、最小类内方差(或最大类间方差) 、最大熵3 34(可使用各种形式的熵)、最小错误率 、矩不变 、最大繁忙度 (由共生矩4935 5051 52阵定义)等。过去,人们为图像灰度门限的自动选择付出了巨大的努力,提出了很多方法。对八十年代及以前发展起来的门限选择方法的一个
3、较好的综述可参看文献24。门限法的缺陷在于它仅仅考虑了图像的灰度信息,而忽略了图像中的空间信息,对于图像中不存在明显的灰度差异或各物体的灰度值范围有较大重叠的图像分割问题难以得到准确的结果。区域生长是一种古老的图像分割方法,最早的区域生长图像分割方法是由 Levine 等人提出的 。该方法一般有两种方式,一种是先给定图像中要分割的目标物体内的一个小块53或者说种子区域,再在种子区域基础上不断将其周围的像素点以一定的规则加入其中,达到最终将代表该物体的所有像素点结合成一个区域的目的;另一种是先将图像分割成很多的一致性较强,如区域内像素灰度值相同的小区域,再按一定的规则将小区域融合成大区域,达到分
4、割图像的目的,典型的区域生长法如 T. C. Pong 等人提出的基于小面(facet)模型的区域生长法 54,区域生长法固有的缺点是往往会造成过度分割,即将图像分割成过多的区域。基于图像的随机场模型法主要以 Markov 随机场作为图像模型,并假定该随机场符合Gibbs 分布。使用 MRF 模型进行图像分割的问题包括:邻域系统的定义;能量函数的选择及其参数的估计;极小化能量函数从而获得最大后验概率的策略。邻域系统一般是事先定义的,因而主要是后面两个问题。S. Geman 等人在文献 55中,首次将基于 Gibbs 分布的Markov 随机场模型用于图像处理,详细讨论了 MRF 模型的邻域系统
5、,能量函数,Gibbs采样方法等各种问题,提出用模拟退火算法来极小化能量函数的方法,并给出了模拟退火算法收敛性的证明,同时给出了 MRF 模型在图像恢复中的应用实例。在此基础上,人们提出了大量的基于 MRF 模型的图像分割算法 。596标记法(labeling)就是将图像欲分割成的几个区域各以一个不同的标号来表示,对图像中的每一个象素,用一定的方式赋之以这些标记中的某一个,标记相同的连通象素就组成该标记所代表的区域。标记法常采用松弛技术来给图像中的各个象素赋予标记,一般可分为离散松弛、概率松弛、模糊松弛等三种 。Smith 等人最先采用松弛标记技术进行图60像分割 ,以后人们又提出了大量的图像
6、松弛分割算法 。另外,松弛标记不仅可61 642,3用于图像分割,还可用于边缘检测、目标识别等。2 基于边缘的图像分割基于边缘的分割方法则与边缘检测理论紧密相关,此类方法大多是基于局部信息的,一般利用图像阶导数的极大值或二阶导数的过零点信息来提供判断边缘点的基本依据,进一步还可以采用各种曲线拟合技术获得划分不同区域边界的连续曲线。根据检测边缘所采用的方式的不同,边缘检测方法可大致分为以下几类:基于局部图像函数的方法、图像滤波法、基于反应扩散方程的方法、基于边界曲线拟合的方法及主动轮廊(active contour)法等。基于局部图像函数方法的基本思想是将灰度看成高度,用一个曲面来拟合一个小窗口
7、内的数据,然后根据该曲面来决定边缘点,如 V. S. Nalwa 等人提出的采用一维曲面拟合局部窗口中数据的方法 65,R. M. Haralick 提出的用二维三次多项式拟合小窗口内的图像数据的方法 66,L. Matalas 等人在 Haralick 方法的基础上,用松驰标记法对找出的边缘点进行进一步的判断,去伪存真 67。图像滤波法是基于如下理论的:即对滤波算子与图像的卷积结果求导,相当于用算子的同阶导数与图像做卷积。于是,只要事先给出算子的一阶或二阶导数,就可以将图像平滑滤波与对平滑后的图像求一阶或二阶导数在一步完成。因而,这种方法的核心问题是滤波器的设计问题。J. Canny 对这个
8、问题进行了比较深刻的研究 68,提出了最优滤波器的三条原则:好的检测,即以较大概率找出真的边缘点而以较小的概率把非边缘点作为边缘点;边缘点的准确定位;对每一个边缘点只有一个响应。他把这三条原则表达成数学形式,然后用变分法求出符合条件的最优滤波器。常用的滤波器主要是高斯(Gaussian)函数的一阶和二阶层数,Canny 认为高斯函数的一阶导数是他求得的最优滤波器的较好似近,一般采用 Laplacian 算子求高斯函数的二阶导数得到 LOG(Laplacian of Gaussian) 滤波算子,该算子由计算机视觉的创始人 Marr 首先提出 69,文献70 等文中对这种滤波器进行了较全面的研究
9、。近年来研究的滤波器还有可控滤波器(steerable) 70,B-样条滤波器71 等。图像滤波的方法是基于对平滑滤波后的图像求其一阶导数的极大值或二阶导数的过零点来决定边缘的,必然遇到的问题是,一阶的极大值或二阶导数的过零点对应的像素点是否真的就是边缘点?文献72中对用高斯函数的二阶导数滤波得到的二阶过零点做了比较系统的讨论,提出了判断真假边缘点的方法。文献68及近年的文献 73等文则提出了各种对图像一阶导数的极大值确定真伪边缘点的办法,基本上是采用对由图像的一阶层导数决定的边缘点强度用某些准则或方式来设置一个阈值的方法。基于反应扩散方程的方法是从传统意义上的 Gaussian 核函数多尺度
10、滤波来的, A. Hummel 指出滤波生成的图像集可以被看作热传导中的扩散方程 74,即用反应扩散方程的观点来看待多尺度滤波。这样得到的只是线性扩散方程,P. Perona 等人提出了非线性扩散的概念 75。后来很多研究人员继续讨论了反应扩散方程在图像处理中的应用,F. Catte等人给出了两种反应扩散方程模型并讨论了它们的性质 76,77,M. Nizberg 等人讨论了用非线性滤波进行边缘和角点(Corner)增强的方法 78,S. C. Zhu 等人将 MRF 模型与反应扩散方程联系起来,通过极小化 Gibbs 分布的能量数推导出反应扩散方程 79,并讨论了这种方法在纹理生成、去噪声和
11、边缘增强等方面的应用,P. Liang 等人将局部尺度的概念与反应扩散方程联系起来,在每一象素点进行不同尺度的滤波,利用反应扩散方程来决定在某个象素点所采用的滤波尺度 80。基于边界曲线拟合的方法用平面曲线来表示不同区域之间的图像边界线,试图根据图像梯度等信息找出能正确表示边界的曲线从而得到图像分割的目的,而且由于它直接给出的是边界曲线而不象一般的方法找出的是离散的、不相关的边缘点,因而对图像分割的后继处理如物体识别等高层处理有很大帮助。即使是用一般的方法找出的边缘点,用曲线来描述它们以便于高层处理也是经常被采用的一种有效的方式。L. H. Staib 等人在文献81中给出了一种用 Fouri
12、er 参数模型来描述曲线的方法,并根据 Bayes 定理,按极大后验概率的原则给出了一个目标函数,通过极大化该目标函数来决定 Fourier 系数。实际应用中,先根据对同类图像的分割经验,给出一条初始曲线,再在具体分割例子中根据像数据优化目标函数来改变初始曲线的参数,拟合图像数据,得到由图像数据决定的具体曲线。这种方法比较适合于医学图像的分割。除了用 Fourier 模型来描述曲线外,近年来还研究了一些其它的曲线描述方法,如 A. Goshtasby 详细介绍了用有理 Gaussian 曲线和曲面来设计和拟合二维及三维形状的方法 82。R. Legault 等人给出了一种曲线平滑的方法 83。
13、M. F. Wu 等人给出了一种双变量三维 Fourier 描述子来描述三维曲面 84。主动轮廓(又称 Snake 模型)是一种可变形模型(或称弹性模型),最初由 Kass 等人提出 。主动轮廓法边缘检测认为图像中各区域的轮廓线应为平滑曲线,各轮廓线的能量85由内部能量及外部能量(包括图像能量及控制能量)两部分组成,其中内部能量表征了轮廓线的光滑约束,图像能量由轮廓线上对应点的灰度、梯度和角点曲率半径(若该点为角点)等决定,而控制能量则代表了图像平面上固定点对轮廓线的吸引或排斥作用。采用变分法求解该能量函数的极小值就可得到与区域边界相对应的轮廓线。有关的文献可参见86至89。3 区域与边缘相结
14、合的图像分割区域与边缘相结合的方法从理论上说可以融合各种不同的区域分割与边缘检测技术,而且融合可以发生在不同的层次上。如将区域生长与边缘检测相结合的方法 ,利用940共生矩阵所表达的区域与边缘性质给出图像的初始分割,在此基础上结合区域和边界的局部一致等信息,用一个松驰标记算法来优化分割结果的方法 ,将 MRF 模型中的能量函95数与边界曲线的 Fourier 表示的参数估计结合起来,构成一个目标函数,通过优化该目标函数而得到图像分割结果的方法 ,以及其它方法 等。从所列参考文献可以看出,近96 1397些年来区域与边缘相结合的图像分割得到了极大的重视,提出了许多富有新意的方法和算法。4 多尺度
15、图像分割多尺度图像分割方法,又称多分辨率方法,就是从初始图像用规则或不规则的方式逐步降低分辨率,得到金字塔形的一个图像序列,再在此基础上进行图像分割。这种方法的基本着眼点是较大的物体能在较低的分辨率下存在,而噪声则不能。多分辨率方法一般也是与别的方法共同使用,早期对这种方法的讨论可参看文献114,这里我们介绍两种比较纯粹的基于多分辨率的方法 115-117。一般的多分辨率方法是用规则方式生成图像序列,即上一幅图像是由下一幅图像中通过取构成一个小方块的相邻四点的均值作为一点从而将图像的分辨率降低一半而得到的。A. Montanvert 等人介绍了用由不规则方格生成的多分辨率图像序列进行图像区域标
16、志及分割的方法 115,他们采用图(graph)来链接不同分辨率下的图像之间的对应点。K. L. Vincken 等人详细介绍了用多分辨率图像序列进行图像分割的一种方法 116,117,他们给出确定性超栈(hyperstack,即多分辨率图像序列)和随机性超栈,所谓确定性超栈就是每个子节点(较高分辨率下的像素点)仅与一个父节点(相邻较低分辨率下的像素点)链接,随机性超栈则是每个子节点以一定的概率与多个父节点链接,他们还介绍了链接方式,标志根节点的方法和由根节点向下映射以得到分割结果的策略。5 神经网络、数学形态学、模糊数学等理论在图像分割中的应用近年来,神经网络、数学形态学、模糊数学等理论也被
17、引入到图像分割中,产生了众多的新算法。在神经网络图像分割方面,Blanz和Gish 使用三层前馈网络进行图像分割,其输入18层的神经元个数取决于每一象素的输入特征数,而输出层的神经元个数则取决于类别数。Babaguchi等人 将经过BP 算法训练的多层网络用于选择分割门限,网络的输入为直方图,19而输出为期望的门限。该网络在训练时,需要一个很大的已知恰当分割门限的样本图像集,但对实际情况来说,难以得到很多训练样本图像。Ghosh等人 将图像看作一个Gibbs12,0随机场,并假定景像中存在加性高斯噪声,使用了一个巨量连接的神经网络来估计图像的最大后验概率,以提取噪声环境中的目标。Ghosh等人
18、还提出了利用Hopfield神经网络提取强噪声图像中目标的方法 ,利用多层神经网络及模糊度量实现噪声图像中自组织目123,标提取的技术 以及采用自组织特征映射神经网络实现图像二值分割的算法 。Shah124 125将边缘检测问题形式化为一个能量最小化模型,该方法能够去除弱边缘及小区域。126Cortes与 Hertz 提出了用于检测不同方位边缘可能边缘的神经网络系统,并用模拟退火7和均值场退火方法对系统的性能进行了模拟研究。Chen等人 将图像分割看作一个约束128满足问题,并提出了一类约束满足神经网络用于图像分割,该方法对CT图像及MRI图像分割比较成功。文献129提出了基于选择性多分辨率K
19、ohonen网络的自适应图像分割,文献130使用Hopfield网络进行并行图像分割,文中涉及了多类分割问题,在能量函数的定义中使用的是误差平方和度量,根据各象素的灰度值确定初始状态,并引入了模拟退火技术来避免陷入局部极小。文献131则提出了采用竞争Hopfield网络实现图像的自动聚类分割,主要应用于多类分割问题,网络的初始化仅仅采用了象素的灰度信息,且以误差平方和度量作为能量函数。数学形态在图像处理中的应用近年来日渐受到重视,文献132中给出一个种基于形态学算子的多尺度滤波算法,此外,文献133等文中都介绍了形态学算子在图像处理中的应用,更多的系统用形态学算子来对图像进行预处理或后处理 1
20、34。形态学理论在图像分割中的应用比较有代表性的是 LVincent 等人提出的水线(watershed)算法 133,该算法的基本思想是将图像象素点的灰度看作高度,图像中不同灰度值的区域就对应于山峰和山谷盆地,盆地的边缘就是所谓的水线,水线这个名称的来历是将图像逐渐沉入一个湖中,图像的最低点先进水,然后水逐渐漫过整个山谷盆地,当水位达到该盆地的边缘高度时就将溢出该盆地,这时在水溢出处建坝拦截,如此直到到整个图像沉入水中,所建的坝就成为分开各个山谷盆地的水线。在此基础上,人们又提出了许多基于水线的形态学图像分割算法。14235模糊数学由于其在处理不完整、非精确信息方面所具有的能力而受到图像处理界越来越多的研究者的重视,并已被运用于图像分割、边缘检测、目标识别等应用中 。在1463图像分割中,可采用不同的 S 型隶属函数或模糊分类矩阵定义模糊区域,并选择与最小模糊度量相对应的 S 型隶属函数或模糊分类矩阵来得到分割结果。这里,模糊度量可以为全局熵 、聚类准则函数 等。1524716053