1、摘 要在面向对象的影像分类方法中,首先需要将遥感影像分割成有意义的影像对象集合,进而在影像对象的基础上进行特征提取和分类。本文针对面向对象影像分类思想的关键环节展开讨论和研究,(1) 采用基于改进分水岭变换的多尺度分割算法对高分辨率遥感影像进行分割。构建了基于高斯尺度金字塔的多尺度视觉单词,并且通过实验证明其表达能力优于经典的词包表示。最后,在词包表示的基础上,利用概率潜在语义分析方法对同义词和多义词较强的鉴别能力对影像对象进行分析,找出其最可能属于的主题或类别,进而完成影像的分类。近些年来,随着航空航天平台与传感器技术的高速发展,获取的遥感影像的分辨率越来越高。高分辨率遥感影像在各行业部门的
2、应用也越来越广泛,除了传统的国土资源、地质调查和测绘测量等部门,还涉及到城市规划、交通旅游和环境生态等领域,极大地拓展了遥感影像的应用范围。因此,对高分辨率遥感影像的处理分析成为备受关注的领域之一。高分辨率遥感影像包括以下三种形式:高空间分辨率(获取影像的空间分辨率从以前的几十米提高到 1 至 5 米,甚至更高) ;高光谱分辨率(电磁波谱被不断细分,获取遥感数据的波段数从几十个到数百个) ;高时间分辨率(遥感卫星的回访周期不断缩短,在部分区域甚至可以连续观测) 。本文所要研究的高分辨率遥感影像均是指“高空间分辨率”影像。 相对于中低分辨率的遥感数据,高空间分辨率遥感影像具有更加丰富的空间结构、
3、几何纹理及拓扑关系等信息,对认知地物目标的属性特征更加方便,如光谱、形状、纹理、结构和层次等。另外,高分辨率遥感影像有效减弱了混合像元的影响,并且能够在较小的空间尺度下反映地物特征的细节变化,为实现更高精度的地物识别和分类提供了可能。 然而,传统的遥感影像分析方法主要基于“像元”进行,它处于图像工程中的“图像处理”阶段(见图 1-1) ,已然不能满足当今遥感数据发展的需求。基于“像元”的高分辨率遥感影像分类更多地依赖光谱特征,而忽视影像的纹理、形状、上下文和结构等重要的空间特征,因此,分类结果会产生很严重的“椒盐(salt and pepper)现象” ,从而影响到分类的精度。虽然国内外的很多
4、研究人员针对以上缺陷提出了很多新的方法,如支持向量机(Support Vector Machine,SVM) 、纹理聚类、分层聚类(Hierarchical Clustering) 、神经网络(Neural Network, NN)等,但仅依靠光谱特征的基于像元的方法很难取得更好的分类结果。基于“像元”的传统分类方法还有着另一个局限:无法很好的描述和应用地物目标的尺度特征,而多尺度特征正是遥感信息的基本属性之一。由于在不同的空间尺度上,同样的地表空间格局与过程会表现出明显的差异,因此,在单一尺度下对遥感影像进行分析和识别是不全面的。为了得到更好的分类结果,需要充分考虑多尺度特征。针对以上问题,
5、面向对象的处理方法应运而生,并且逐渐成为高空间分辨率遥感影像分析和识别的新途径。所谓“面向对象” ,即影像分析的最小单元不再是传统的单个像元,而是由特定像元组成的有意义的同质区域,也即“对象” ;因此,在对影像分析和识别的过程中,可以方便地提取影像对象大小、形状、纹理和空间关系等属性特征,而这些特征在基于像元的分析方法中很难获取的。现有研究表明,面向对象的分类对高分辨率遥感影像有着更好的分类效果,不仅有效地克服了“椒盐现象” ,而且更加符合人类的视觉习惯。 面向对象的分类思想首先要对影像进行初始分割,得到一系列彼此相邻的“影像对象” ;然后对各个对象的属性特征进行提取,进而基于这些特征实现对整
6、幅影像的识别和分类。因此,这就带来两方面的问题:首先是影像分割问题,由于高分辨率遥感影像自身的复杂性和多尺度特性,使得普通的分割方法并不能取得理想的效果;其次是特征提取问题,由于常用的特征依然是光谱、纹理等“低层视觉特征” ,与影像语义信息之间存在着巨大的“语义鸿沟” ,因而它们很难准确的描述遥感影像的内容,更不能利用这些特征来区分不同的对象类别。 本文将以高分辨率遥感影像分类为目标,在充分了解现有面向对象的分类方法的基础上,综合考虑高分辨率遥感影像自身的复杂性和多尺度特性,将基于分水岭变换的多尺度分割和多尺度词包表示引入面向对象的分类思想中,建立适合于高分辨率遥感影像的多尺度分类方法。由于本
7、文的研究目标是基于面向对象分类思想对高分辨率遥感影像进行分类,因此研究现状将从面向对象分类的几个关键环节展开论述,一是影像分割,二是尺度问题,三是遥感影像的特征提取与分类。(1) 影像分割 影像分割是指,基于同质性或异质性准则将一幅影像划分为若干有意义的子区域的过程。最终的分割效果需要同时满足以下三个条件:第一,分割后形成的图像区域中的所有像元点必须满足一定的同质准则,并且不存在不连通的点;第二,两个相邻的区域间的某项特定属性要有明显的差异性;第三,区域的边缘应该相对规整,并保证边缘的定位精度。影像分割效果的优劣将直接影响到后期的分类和识别,对于遥感影像的分析和理解至关重要。近些年来,国内外很
8、多研究人员在影像分割方面做了大量的探索研究。一般情况下,根据分割时选取特征的差异可将分割算法分成三类:基于阈值的分割算法、基于边缘的分割算法以及基于区域的分割算法。基于阈值的分割算法大都通过影像的灰度阈值实现对影像的分割,目前已有的方法主要包括直方图统计法,最大类间方差法、熵方法等,然而这些方法对阈值的选择有很强的依赖性,尤其是对于复杂的遥感影像,往往不能得到较好的效果;基于边缘的分割方法是利用影像中灰度变换较为剧烈的信息实现分割,边缘特征属于遥感影像的重要特征之一,可以通过一系列边缘检测算子提取,如常用的 Sobel 算子、Laplace 算子和 Candy 算子等;基于区域的分割算法主要包
9、括区域生长法、分水岭变换算法以及马尔科夫随机场算法等。 从 20 世纪 60 年代末开始,影像分割的相关算法研究已经在计算机视觉领域取得较大的进展,但对遥感影像的分割算法却相对较少,直至 20 世纪 80 年代,针对遥感影像特征所提出的分割算法开始不断涌现。Laprade 于 1988 年利用分裂合并的方法对航空影像进行分割,Ryherd 和 Woodcock 在 1996 年组合光谱和纹理特征进行遥感影像分割。遥感影像分割方法同样受到国内学者的关注,刘永学在 2004 年提出了一种结合边缘检测以及边缘生长的方法来进行遥感影像的分割,陈忠于 2006 年利用多尺度分割法与多分类器融合技术来进行
10、高分辨率遥感图像的分类,并达到了很高的精度,陈秋晓等于 2006 年利用基于局域同质性梯度实现对遥感影像的分割。虽然遥感影像的分割方法被不断地提出和改进,但 Neubert 等于 2006 年通过比较现有各种分割算法对高分辨率遥感影像的分割性能,认为当前的技术仍不能有效满足应用的要求。 近年来,分水岭算法作为一种经典的基于区域的分割方法,越来越受到国内外研究人员的关注。自 Vincent 和 Soille 于 1991 年将测地理论的集合运算推广到灰度图像,进而提出分水岭算法以来,该方法被广泛应用于图像分割处理。目前,分水岭算法已经被成功应用于遥感领域,并且在对多光谱遥感影像、高光谱遥感影像和
11、高分辨率遥感影像的分割中有着出色的表现。当然,分水岭算法有着自身的缺点,如对噪声高度敏感,容易产生过分割现象。为了克服分水岭的过分割问题,国内外的学者提出很多改进的方法,主要在影像的预处理和后处理上做研究。Gao H 等人于 2001 年借助先验知识,利用限定分割的区域数目的方法对分水岭算法的过分割现象进行改善;Karantzalos K 等人于 2006 年将各向异性扩散滤波和边缘检测的方法引入分水岭算法中,并且取得了不错的效果;Ocallaghan R J 等人对初始分割后的影像进行快速区域合并,有效改善了过分割问题。国内的学者也在分水岭的改进方法上做了很多工作,陈忠在 2006 年提出基
12、于分水岭变换的多尺度遥感影像分割算法,利用非线性滤波和快速区域合并算法优化分割结果;孙颖等于 2006 年利用标记的分水岭算法对高分辨率遥感影像进行分割,取得较好的效果。(2) 尺度问题 多尺度特征属于空间数据的基本属性之一,遥感中的尺度问题也是当今国内外的研究热点。国外学者开始尺度的问题的研究可以追溯至上世纪 80 年代初期,近年来,国内的专家学者也开展了此领域的研究,由李小文院士主持的 973 项目“地球表面时空多变要素的定量遥感理论及应用”中指出, “在像元尺度上,以研究尺度效应和尺度转换理论为核心,检验与反演目标参数有关的基本物理概念、定理、定律的适用性”被列为待解决的关键问题之一,由
13、此可见,尺度问题在遥感影像分析中的有着不可忽视的重要作用。 遥感中的尺度问题得到广泛的关注,主要体现在以下三个方面:尺度选择、尺度效应和尺度转换。其中,尺度选择是指针对特定应用选择最佳分析尺度,以保证研究目标的属性特征被最优描述;尺度效应是指研究空间尺度的变化对分类精度的影响;尺度转换指将某一尺度上的信息和知识拓展到其它尺度上,或称为跨尺度信息转换。Woodcock 和 Strahler 于 1987 年分析了影像中局部地物方差随分辨率降低的变化,提出平均局部方差选择最佳空间尺度。Chen 等在 2004 年指出空间尺度对分类误差的影响更加明显地体现在地物的空间分布上。Wang 等在 2001
14、 年设计了变异函数的块金方差(Nugget Variance)和基台方差(Sill Variance)的比值指标,将该比值稳定时对应的空间尺度作为最佳尺度。黄慧萍在 2003 年针对从单一尺度进行影像特征提取的不合理性,提出了多尺度遥感影像分析方法,并研究了面向对象影像分析中的最优尺度选择问题。明冬萍等于 2008 年提出了基于可变窗口与可变分辨率的改进局部方差方法用于选择最佳空间尺度。韩鹏等于 2010 年提出了一种基于信息熵的尺度选择的方法,该方法以信息熵为评价类别可分性的标准,最优尺度由最小平均熵确定。然而,我们研究的空间尺度又包含两层含义:一是影像的空间分辨率,二是对影像分析时所研究的
15、地表空间范围。上述的两层含义在基于像元的分类思想和面向对象的分类思想中得到了很好的体现。在基于像元的影像分类中, “尺度”即指影像的空间分辨率。随着遥感影像分辨率的不断提高,影像的分类精度并没有随之提高,这是由地物目标的“多尺度”特性决定的,任何地物目标在不同的尺度上都会有着不同的特征表现。因此,基于像元的分类方法存在着“最优尺度选择”和“多尺度特征提取”等问题。在面向对象的分类方法中, “尺度”除了拥有在基于像元分类方法中的概念外,还被拓展为“面积尺度”的概念。影像对象的“面积”随分割尺度的变化而变化,并且表现出在该尺度下的特征信息,这样就可以根据研究目标的特点得到最优的分割结果,进而得到更
16、高的分类精度,这就是“高分辨率遥感影像的多尺度分类”思想。 (3) 遥感影像的特征提取与分类 随着遥感影像空间分辨率的不断提高,面向对象的分类方法得到越来越广泛的应用。面向对象的分类方法首先要对遥感影像进行初始分割,得到一个个属性各异的同质区域,这些同质区域也被称为“对象” ;进而从这些影像对象中提取多种特征,如光谱、形状、纹理、结构和空间关系等,最后引入分类算法以完成最终的影像分类。面向对象的遥感影像分类方法是通过描述遥感影像中对象的信息来替代像元层的特征,从较高层次对遥感影像进行分类,以减少传统的基于像元层次分类方法的语义信息损失,使分类结果具有更丰富的语义信息。图 1-2 简单描述了基于
17、面向对象思想的分类流程:面向对象的分类方法的本质就是将图像中的对象作为处理的基本单元,利用分类器来分析对象的特征,进而判别它们对应的类别。Blaschke 等人于 2001 年首先提出了基于对象的遥感影像分类方法,认为基于多尺度分割形成的同质区域(即影像对象)不仅很好的利用光谱特征,还引入其它不同的特征,同时该方法能进一步融入领域知识和专家经验,使得分割后的对象比像元具有更丰富的语义信息,从而提高遥感影像分析的智能化水平。Giada 等人在 2003 年通过自动提取遥感图像中的同质区域来完成基于对象的分类。eCognition 软件通过整合多尺度的分割和基于对象的分类,成为首个投入商业应用的基
18、于对象的遥感分析软件(现改名为 Definiens Professional) 。Mathieu 等人于 2007 年在对象层面分析了新西兰地区的城市与农村的地类。 然而,上述学者所做的工作都是直接从影像对象中提取低层的视觉特征,进而利用分类器实现分类。但是,遥感影像分类的本质是给各个区域添加高层的语义标签,而低层的视觉特征很难准确地描述遥感影像的高层语义内容,因此要获得更好的分类效果,只依赖这些低层视觉特征是不全面的。 近几年,一些研究学者将文本分析和场景理解中的词包模型(Bag-of-Word, BOW)引入遥感领域,期望通过词包模型来提取遥感影像中局部特征的统计信息(或语义信息) ,并根
19、据这些新的特征来分析遥感图像中的主题,从而达到分类的目的。词包模型原本是文本分析中最为成功的模型之一,在该模型中,文档被表述成少量单词的无序集合,这些无序集合就被称为“词包” ,文档的大致内容则可以由词包中单词的分布情况表达。现在该模型已经被应用于影像分析中,并且取得了不错的效果。 对影像进行“词包模型”的构建过程类似于在文本分析中的构建过程,整幅影像被初始分割成一个个对象,然后统计各个影像对象的低层视觉特征(光谱、纹理等)并进行聚类分析,形成表征该对象的特征向量组,这些特征向量组被称为视觉单词(visual word);最后统计这些视觉单词在各个影像对象中的分布直方图作为该影像的特征,用于后
20、期的分类。 遥感影像的分类过程的实质就像是文本分析中为各个文档找出其对应的文本主题的过程,其对应关系可归纳为表 1-1 所示。以色列的学者 Weizman 和 Goldberger 首先将词包模型的思想引入遥感领域,用来提取与低层视觉信息无关的图像表达(feature-free image representation)。Feng 等人将遗传算法引入词包模型,改进原有视觉单词构造中存在的问题。而 Yang 等人则进一步考虑了词包模型中各个视觉单词的空间关系,增加其所包含的语义信息。Linou 等人基于词包模型中提取的单词概念,引入主题模型 Latent Dirichlet Allocation
21、 (LDA)进一步分析遥感影像视觉单词间的关系,通过最大似然分类器计算图像中每个图像块对应的语义概念,从而完成图像的语义标定。Yi 等人利用相同的思想,通过 PLSA 模型来分析视觉单词间的关系,完成影像的分类任务。随着词包模型在遥感影像的解译和理解中的广泛应用,国内也有很多研究人员开始关注词包模型在遥感影像分析中的应用,如遥感影像分类和遥感特定目标的检测等。常见影像分割方法 多年来,影像分割一直是图像处理与模式识别领域的经典难题,一直受到国内外学者的高度关注。由于现有的分割算法种类繁多,这些算法一般被分为以下三种经典类型:基于阈值的分割,基于边缘的分割和基于区域的分割。基于阈值的分割方法 基
22、于阈值的分割方法又被称为“门限分割” ,是一种简单并有效的分割方法。对一幅影像进行阈值分割时,通过选取一个或多个阈值作为分割门限,将影像的所有像元进行遍历,像元的灰度值与阈值进行比较,最终将只存在三种情况:大于阈值、小于阈值和等于阈值,进而以此为依据完成整幅影像的分割。基于以上描述,可以看出基于阈值的分割方法的关键在于阈值的选取,其核心工作即按照某种准则选出合适的阈值,因为只有最优的阈值才能实现对影像的最有效分割。通常,阈值的选取包括全局阈值、局部阈值和动态阈值三类。其中,全局阈值的选取只与影像像元本身的性质有关;局部阈值的选取与影像像元本身的性质和局部区域特征有关;动态阈值的选取与像元坐标、
23、像元性质和局部特征有关。 基于阈值的分割方法对于不太复杂并且灰度分布比较集中的影像有着较好的效果,而对于比较复杂的影像,尤其是遥感影像仅仅依赖此方法是远远不够的。基于边缘检测的分割方法 边缘特征是影像最基本的特征之一,是不同区域间灰度不连续的像元点的集合,它代表着一个区域的结束,同时也是另一个区域的起始,是影像局部特征不连续或突变的结果。基于边缘检测的分割方法就是通过检测这些不连续的像元点,并把这些像元点按照约定的规则连接成轮廓,利用这些轮廓线构成分割区域,进而得到分割结果。在影像中灰度值有屋顶形变或阶跃突变的像元集合组成了边缘,如图 2-1 所示:边缘总存在于影像中相邻的不同区域间,并且可以
24、通过求导数来检测,常用的一阶微分算子有 Roberts 算子、Prewitt 算子和 Sobel 算子,二阶微分算子有 Laplace 算子和 Kirsh 算子等。在实际应用中,常用小区域模板来表示各种微分算子,并且通过模板与影像卷积来实现微分运算。基于边缘检测的分割方法对噪声敏感度高,适合用于噪声较小且不太复杂的影像分割。基于区域的分割方法 基于区域的分割方法的出发点是影像中空间距离较近的像元具有较大的相似性,空间距离较远的像元具有较大的差异性。这种描述恰好符合地理学第一定律(Toblers First Law of Geography) : Everything is related to
25、 everything else, but near things are more related than distant things。目前比较常用的基于区域的分割方法有区域生长和区域分裂合并等方法,或者是两种方法的综合。 区域生长的基本思想是把影像中特征相似的像元按照一定的规则合并而成一个区域。具体方法如下:首先,按照某种规则选取种子点,然后遍历和种子点相邻的像元,将与种子点特征相似的像元合并为同一区域,接着以合并的像元作为新的种子点,依此类推,最终得到在该生长准则下最大的连通集合,如图 2-2 所示。在对区域生长算法进行设计时,为了得到更优的分割效果,需要解决以下三个问题:(1) 选
26、择一个或者一组能够正确代表所需区域的种子像元;(2)生长准则的确定;(3) 停止生长的条件。在生长准则的确定中,除了需要考虑像元间的相似性外,还要考虑像元间的邻近性和连通性,否则可能最终分割出毫无意义的区域;另外,区域生长是一种串行算法,当影像较大时,分割效率低下。区域分裂合并的方法是和区域生长相反的方法,此方法按照一定的准则对整幅影像进行分裂,形成不重叠的区域,同时将分裂后的相似区域进行合并;经过反复的分裂和合并,直至满足分割要求为止。图 2-3 展示了区域分裂合并算法的一种形式:任意区域 R 被分裂为 4 个互不重叠的区域,并满足 P ( )= FALSE,依次进行,直至在该分裂准则下不能
27、继续分裂;然后将任何满足 的区域进行合并,直至在该合并准则下不能继续合并,则分割过程结束。其它分割方法 近年来,影像分割领域不断引入新的理论和新的工具,因此诞生了一些比较新颖的方法。如基于数学形态学的影像分割、基于小波分析的影像分割、基于神经网络的影像分割、基于遗传算法的影像分割和基于分水岭变换的影像分割等等。 1) 基于数学形态学的影像分割 基于数学形态学的分割首先将待处理影像用各种形状大小的结构元素进行扫描,以此识别出影像中梯度变化较大的边缘信息。这种方法处理速度快,但对结构元素的选择依赖性很高:若选取的结构元素过小,则对噪声的干扰响应较大;选取的结构元素过大,则有可能滤掉有意义的边缘信息
28、。因此,结构元素选取的是否得当将直接影响到最终效果的好坏。 2) 基于小波分析的影像分割 小波变换是一种经典的多尺度分析工具,具有良好的时频局部变化特性和多分辨率分析能力。对影像进行小波变换以后,可以得到不同的频带子图以及相对应的小波系数,影像的总体和局部特征就可以通过这些小波系数来表征。 小波分析常用来检测影像的高频分量,也即影像边缘信息。它也常被作为多尺度分析的工具和其它技术结合使用。3) 基于遗传算法的影像分割 遗传算法是一种将生物自然选择和遗传机制与统计学的相关知识相结合的一种随机搜索优化方法。该算法的执行操作直接在结构对象(集合、矩阵、序列和图等)上进行操作,而不是直接作用在变量上。
29、遗传算法由于其自身的并行机制,在对分割速度的提高上很有帮助,并且可以有效利用全局信息。为进一步提高分割质量,该算法通常与其它分割技术结合,如果能获得大量的先验知识,则可以实现对影像的最佳分割效果。 4) 基于神经网络的影像分割 神经网络是通过抽象和模拟人脑或神经网络的一些基本特性指导影像的分析,其基本思想是通过对多层感知机的训练得到决策函数,进而利用这些决策函数值指导影像的分类,以达到分割的目的。神经网络可以充分利用影像像元间的空间信息,能够较好的抵抗噪声的干扰,对于复杂影像的分割具有一定的优势。然而,此方法需要积累大量的先验知识和训练样本,才能训练出有效的神经网络;而且在网络节点和层数设计以
30、及训练效率也需要进一步的探索和研究。 5) 基于分水岭变换的分割 分水岭分割本质上是属于基于区域的方法,该方法的基本思想是将影像类比为地学上的拓扑地貌,影像中每一个像元的灰度值类比为海拔高度,然后每一个局部极小值及其影响区域被称作集水盆地,而集水盆的边界即被称为分水岭,将各个分水岭作为影像分割的边界,实现对影像的分割。 综上所述,虽然影像分割领域的方法种类繁多,但这些方法都存在着自身的不足和缺陷。如阈值分割方法只考虑图像灰度值,不能很好的反映图像的结构信息,并且容易受到噪声干扰;边缘检测的方法可以得到边界线段,但需要后续的操作使轮廓保持连续,因而在边界不明显的地方较难确定区域;区域方法的性能对
31、初始种子的选择有较大的依赖性,其参数确定或者选择比较困难。即使是上文提到的新颖的分割方法,也同样存在着各自的局限性,这是由高分辨率遥感影像自身的复杂性决定的。 分水岭算法作为一种经典的基于区域的分割方法,由于其边缘定位准确、全局分割和并行处理等优点被应用于很多领域。虽然分水岭算法存在着对噪声敏感、过分割等缺点,但可以通过预处理或后处理进行改善。目前,该方法在对多光谱遥感影像、高光谱遥感影像和高分辨率遥感影像的分割中都有着出色的表现。因此,本文将基于分水岭算法对高分辨率遥感影像进行分割,并对其加以改进。基于改进分水岭变换的多尺度分割方法 分水岭算法有着很多优点,比如说能够实现全局分割,封闭的边界
32、和高的定位精度等,使得它适合用于高分辨率遥感影像的分割。然而,传统的分水岭分割也存在着缺陷:(1)分水岭的输入通常为影像梯度,而梯度受噪声的影响较大,并且当纹理细节特征明显时,会产生很多局部最小值,使得分割结果产生严重的过分割;(2)对影像中对比度较低的部分响应较弱,易造成轮廓信息的丢失。 虽然很多学者针对高分辨率遥感影像改进了分水岭算法,但仍有一些问题没有解决,这是由于遥感影像本身具有多光谱和多尺度特性,数据复杂性和冗余度较高。本文针对以上未解决的问题,提出了一种改进的分水岭分割方法,用于高分辨率遥感影像的多尺度分割。 本文提出的算法描述如下:首先,对高分辨率遥感影像进行各向异性扩散滤波的预
33、处理,目的是既可以滤除细小的噪声又能较好的保留边缘信息;然后对影像进行多尺度形态学梯度提取,然后利用扩展最小变换修正多尺度梯度,进而进行基于标记的分水岭变换;最后利用影像对象的光谱和形状异质性指标进行多尺度区域合并。算法流程如图 2-9 所示:本文基于面向对象的影像分析思想,介绍了一种高分辨率遥感影像多尺度分类的方法,该方法充分考虑了高分辨率遥感影像自身的复杂性以及多光谱、多尺度特性,首先对遥感影像进行基于改进分水岭变换的多尺度分割,获取影像对象,然后对影像对象进行多尺度词包表达,最后引入 PLSA 模型完成影像的分类任务。实验表明,本文方法对不同传感器遥感影像均能取得较好的分类效果。通过论文
34、的工作,可得到以下结论: (1) 影像分割作为面向对象影像分析思想的核心技术之一,其效果的好坏将直接影响后期的分类和识别。本文详细阐述了基于改进分水岭变换的多尺度分割方法,该方法充分考虑了遥感影像的多光谱和多尺度特性,对高分辨率遥感影像分割有着较好的效果; (2) “尺度”特征作为遥感影像的固有属性,需要参与到遥感影像分析的过程中,才能进一步提高分析处理的效果。本文中强调了“尺度”的双重概念:一是指影像的空间分辨率,二是对影像分析时所研究的地表空间范围,前者对应于文中的多尺度形态学梯度和多尺度词包模型,后者对应于多尺度区域合并,也即多尺度分割; (3) 相比于传统的基于低层视觉特征的表达,词包
35、模型通过直方图统计的方法获得目标的统计特性,有着更好的影像表达能力,并且隐含了一定的语义信息;本文引入词包模型对遥感影像的特征进行描述,利用 PLSA 方法分析影像对象的所属类别,可以在非监督的情况下,取得较好的分类效果,在一定程度上提高了影像分类的自动化水平; (4) 实验表明,对于高分辨率遥感影像,面向对象的影像分类方法明显优于基于像元的影像分类方法。结论综上所述,高分辨率遥感影像的分类研究已经逐步由基于像元的思想为主转为面向对象的思想为主。国内外的研究人员针对面向对象的分类思想中的几个关键环节(遥感影像分割、多尺度区域合并、特征提取及分类等)进行了大量的研究,并且取得了丰硕的成果,但依然
36、存在一些问题: (1) 现有的分割方法大都是从经典的图像处理与模式识别领域直接引入,没有充分考虑到遥感影像自身的复杂性,如多光谱和多尺度特性,因此,通常不能得到理想的效果; (2) 由于遥感影像中的地物目标都有着固有的尺度特性,因此,在单一尺度下进行分割往往不能兼顾高分辨率遥感影像上的多种地物类型。这里的“尺度”有两层含义,一是影像的空间分辨率,二是对影像分析时所研究的地表空间范围,从多尺度的角度进行影像分析,对于提高遥感影像的分割质量有着重要意义; (3) 在现有遥感影像分类方法中,特征提取的方式依然是基于低层的视觉特征,这与要获得的高层语义信息之间存在着较大的“语义鸿沟” ,也即提取的特征很难和地物的类别建立一一对应的关系,并且遥感影像中“同物异谱”和“同谱异物”的现象又加大了这一“鸿沟”问题。