1、粗集分类思想在 GIS 点群综合中的应用第 33 卷第 9 期2008 年 9 月武汉大学?信息科学版GeomatiesandInformationScienceofWuhanUniversityVo1.33NO.9Sept.2008文章编号:16718860(2008)09 089604粗集分类思想在 GIS 点群综合中的应用李雯静林志勇龙毅.(1 武汉科技大学资源与环境工程学院,武汉市和平大道 947 号,430081)(2 武汉大学遥感信息工程学院,武汉市珞喻路 129 号,430079)(3 南京师范大学地理科学学院,南京市宁海路 122 号,210097)文献标志码:A摘要:在现有的
2、多种点目标综合方法的基础上,提出了利用基于粗集理论的分类思想对 GIS 中的点群目标进行综合的方法.分析了粗集分类思想与 GIS 综合之间的关系,从理论基础到方法应用两方面阐述了两者的共同点及运用粗集方法进行 GIS 综合的可行性.具体介绍了运用粗集方法进行点目标综合的方法和步骤,并进行了实验分析.关键词:点目标;GIS 综合;粗集;分类思想中图法分类号:P208选取问题是 GIS 点群目标综合中的一个重要技术难点,关于定量化的数量指标研究已经有了很多成果,但定性分析,如选取哪些点,删除哪些点的定位问题仍是目前选取研究中一个比较薄弱的环节.对于点群目标的选取,已有许多地图学和 GIS方面的学者
3、进行了研究.用粗集方法表达 GIS 数据是利用粗集分类思想进行 GIS 综合的基础.目前对空间信息的粗集表达研究,可以以地图数据本身形式为主导,如基于多粒度的 GIS 数据表达_6.本文对 GIS 点目标综合问题进行研究,希望将点目标的空间信息和属性信息结合起来一起考虑,采用的方法是将点目标的各种信息用粗集关系表的形式表现出来,对于空问数据的表达,采取了空间特征属性化的方法.1 粗集分类思想与 GIS 综合的关系GIS 目标综合不是简单的选取,而是需要保持空间实体最本质的特征,抓住最重要的信息,舍去次要的信息.这一过程实际上也是按信息的重要程度进行分类的过程.这种综合是宏观的,其结果是对空间实
4、体描述所涉及的类别和级别减少,这种收稿日期:20080702.项目来源:国家自然科学基金资助项目(40701158;40671154).减少中常常还伴随着新类别的出现.GIS 信息综合的目标是要找出最重要,最具代表性的信息并且在综合过程中保留下来.在海量的 GIS 数据面前,计算机自动实现是人们希望看到的解决方法,而粗集作为数据挖掘的新工具可以用来解决这个问题.基于粗集分类思想的属性约简就是通过计算所有属性的重要程度,提取在描述GIS 目标时最重要的属性,也就是对实体目标分类情况改变最大属性项.粗集方法中,重要性程度高的属性项,实际上就是在分类上最能体现实体目标间区别的属性.GIS 条件下,最
5、重要的属性实际上就是最能反映 GIs目标特性的属性,即从该属性出发,能对 GIS 目标作出区分,并且这种区分最能反映该目标的特征.2 基于粗集理论的 GIS 点群目标综合方法?基于粗集理论的 GIS 点群目标综合主要分为 3 个部分.首先对 GIS 点群目标进行结构化处理,目的是将 GIS 点目标的空间特征属性化描述,便于粗集计算方法的实现;然后将描述 GIS点目标的各种属性(包括空间的和非空间的)及属第 33 卷第 9 期李雯静等:粗集分类思想在 GIS 点群综合中的应用 897性值加人到粗集方法的属性决策表中,利用粗集的属性约简方法计算出对综合影响最重要的那些属性,并将结果数值化,其实是利
6、用粗集的约简方法找到对综合影响程度最大的属性,间接找到点群中具有重要意义的点,这些点的集合是点群综合结果的一个重要组成部分;最后根据点群目标各属性约简的结果及选取的数量化指标,选取综合后仍需要保留的点,作为点群综合的结果.2.1 点群目标的空间特征属性化描述对 GIS 点群目标选取综合来说,除了要考虑各点目标自身的某些属性以外,充分考虑总体结构特征及局部个体的相对重要性可以使综合的结果更趋于合理.点群综合应考虑的空间特征一般表现在 3 个方面:点群的轮廓形状,点群的相对密度和几何中心以及点群的纹理结构特征.对于不同的方面,可以采用结构化方法进行描述.点群的结构化方法目前使用比较多的包括凸壳及凸
7、壳层嵌套,Delaunay 三角网或 Voronoi图.为了描述点的位置信息和空间关系信息,本文主要考虑利用凸壳和 Voronoi 图方法对点群的空间特征进行属性化描述.1)空间特征属性化的凸壳方法(见图 1).凸壳层概念的引人使得除了可以描述点群最外围的轮廓外,还可以描述全部点目标的结构.借助凸壳层形成的嵌套,还可以反映点群集合逐层分布的结构特征.2)空间特征属性化的 Voronoi 图方法(见图2).点目标由于本身没有形状面积,所以用Voronoi 图来描述每个点所控制的面积,该面积也代表了点群结构分布的一个特征量,Voronoi图的邻近密度还可以用来描述点群分布的密度关系.对于单个点目标
8、来说,它所控制的面积越大,其邻近密度越小,说明它的影响区域越广,生存空间越强,生存能力越强,即被保留下来的可能性越大;反之,其被删除的可能性越大.3)空间特征属性化的其他方法(见图 3).当点群所处的区域不只有点状目标,还有其他空间实体时,应该将点与其他空间目标的位置关系记录下来,生成点的特殊位置信息.点与其他实体的位置关系一般可以通过相邻实体之间的缓冲区分析得到.冲冲 I)(冲隧冲冲图 1 点群的凸壳嵌套描述图 2 点群空间特征的 Voronoi 图描述图 3 点群的特殊位置空间特征描述Fig.1ConvexHullofPointsFig.2VoronoiDescriptionofFig.3
9、SpecialPositionDescriptionPointsSpatialFeatureofPointsSpatialFeature将图 1,图 2,图 3 中点群的空间结构特征属信息变成点目标的特征量,便于将空间信息和属性化描述后,其结果可以综合成一张关于点目标性信息结合,通过粗集决策分析方法可以得到一的空间信息属性表,见表 1.个对于点群中各个点目标的综合评价信息.通过对点群的结构化分析,可以将空间位置表 1 点群空间特征属性表Tab.1SpatialFeatureAttributeofPoints898 武汉大学? 信息科学版 2008 年 9 月2.2 基于粗集理论的点群综合处理在
10、本文的示例中,粗集方法应用于点目标选取处理主要进行以下几个步骤:对点群集合生成凸壳层嵌套,记录每个点所在凸壳的层次;对点群集合生成 Voronoi 图,计算每个点所控制的 Voronoi 区域的面积;利用点群的 Voronoi图及面积计算点的一阶邻近密度;根据各种点群结构化方法,对点群的空间特征作属性化描述;对点与专题应用相关的空间信息进行提取并作描述;结合点的各种专题信息,属性信息和各种统计信息,对点群属性指数归一化,建立点群属性决策表,进行点的重要性分级分析,见表 2.表 2 点目标的属性决策表Tab.2DecisionMakingofPoints表 2 中包含了点所在的位置信息,Voro
11、noi 图所控制的面积,语义信息等空间结构化信息及专题属性信息,并且决策属性也可以同时包括空间的和属性的信息.表 2 中没有指定决策属性项(不同于经典粗集),因为在 GIS 中应用专题类型众多,可以根据专题需要指定某个包含决策意义的条件属性作为决策属性.另外,点所处的特殊位置信息一般是指点与其他空间实体之间的相邻信息,如一个点处于河岸边,道路交叉口,距离铁路多远的位置等,这些信息对于专题研究是非常有意义的.通过对 GIS 目标图形信息的结构化处理,可以将空间目标的结构信息作为属性项添加到属性决策表中,实现空间信息和属性信息的综合处理.除了表中所列的条件属性项外,还可以根据 GIS 应用的不同专
12、题与要求选择其他的属性信息,以满足不同应用的需要.同时,在对属性决策表进行分析化简时,也可以有选择地设定哪些为条件属性,哪些为决策属性项,以满足不同专题应用的需要.3 实验与结论以图 1,图 2,图 3 中的点群为实验对象,表 1描述了点群的各种属性信息,由于原始数据包含大量连续值,不符合粗集数据处理的要求,需要将其进行预处理才能运用粗集方法计算.表 3 是对表 1 离散化处理的结果.对表 3 中的数据作无决策信息的粗集属性约简及属性重要性计算,其结果表明,表 1 的 4 个属性项中,对于这个点群目标集合的分类而言,点的Voronoi 一阶邻近密度是不重要的,而 Voronoi图面积,凸壳层次
13、信息和缓冲区信息是必不可少的属性核.其属性重要性计算结果为,.(一阶邻近密度)一 0,(c(Voronoi 图面积)一 0.318,cc,.(凸壳层次信息)=0.318,(缓冲区信息)一 0.364.表 3 点群空间特征属性表Tab.3SpatialFeatureAttributeofPoints占V0r0n0i 缓冲一阶占 Voronoi 缓冲一阶Ig积lN利用各个属性的重要性值和各点的属性值,可以对所有的点重新排序,结果见表 4.根据粗集方法计算的结果,原来点群中包含 22 个目标,表 4 点目标的重要性排序Tab.4SequenceofPointsImportance点目标重要性值重要性
14、排序点目标重要性值重要性排序点目标重要性值重要性排序154.9046124.51O28113.9063133.600853.51982102.96821718192O2122酝健丁;.健丁.第 33 卷第 9 期李雯静等:粗集分类思想在 GIS 点群综合中的应用 899当比例尺分别缩小为原来的 1/2 和 1/4 时,根据开方根公式计算出应该分别保留 16 个点和 11 个点,因此去掉重要性排名最后的 6 个点和 11 个点,则点群集合综合前后的情况如图 4 所示.厂_1.:._J图 4 比例尺缩小后点群综合前后比较Fig.4ResultofGeneralizationofPoints图 4
15、中对点群的综合选取是综合考虑点的分布位置,点的影响区域,点与穿越点群的线之间的关系及点的分布密度等因素的影响,对每个点目标以分类为基本思路综合的结果.从选取的点目标可以看出,选取过程中保留了那些表达点群的轮廓范围和具有较大影响区域的点,去掉的是那些分布密集且位于点群内部的点.另外,还考虑了点距离线的远近关系,距离远的优先去掉.由于粗集方法对空间目标的语义信息等非空间属性的处理能力是显而易见的,因此在本文的实验数据中没有重点讨论,而是认为实验数据点群具有相同的语义信息,其语义值不影响属性约简的结果.基于粗集的分类思想对点群的综合选取能够满足点群综合的一般要求,其结果不仅在保持点群的轮廓形状,相对
16、密度与几何中心及纹理结构特征方面达到了点群综合的目的,同时综合考虑了描述点目标的各种属性信息的影响情况,并且对每个点目标的重要程度排序,更方便了各种比例尺变化情况下的综合选取操作.参考文献1毋河海.自动综合的结构化实现J.武汉测绘科技大学,1996(3):277 295E23 艾廷华,刘耀林.保持空间分布特征的群点简化方法 EJ.测绘,2002,31(2):175 181E3武芳,邓红艳 .基于遗传算法的线要素自动综合简化模型J.测绘,2003,32(4):3493554王桥,毋河海 .地图信息的分形描述与自动综合研究 EM.武汉:武汉测绘科技大学出版社,1998E5刘颖,翟京生 .随机点群目
17、标空间图形的表达与识别 EJ.测绘科学,2005,30(4):39 4262 李雯静 .基于粗糙集理论的 GIS 信息综合模型与方法研究 ED.武汉 :武汉大学 ,2006第一作者简介:李雯静,博士,讲师.现主要从事粗集,分形理论在 GIS 与地图综合中的应用研究.E-mail:wtusm_ApplicationofRoughSetIdeatoPointsObjeetGISGeneralizati0nLIWenjingLINZhiyongLONGYi.(1CollegeofResourcesandEnvironmentalEngineering,WuhanUniversityofScience
18、andTechnology,947HepingRoad,Wuhan430081,China)(2SchoolofRemoteSensingandInformationEngineering,WuhanUniversity,129LuoyuRoad.Wuhan430079,China)(3CollegeofGeographicalScience,NanjingNormalUniversity,122NinghaiRoad.Nanjing210097,China)Abstract:Onthebasisoftheexistingmethodsofpointobjectgeneralization,a
19、ndinviewoftheinadequacyofexistingmethods,aroughsetideatoresolvetheproblemofpointobjectgeneralizationisputforward.Afteranalyzingthe.relationshipbetweentheclassificationthinkingofroughsetandGISgeneralization,thefeasibilityofusingroughsetmethodtogeneralizepointobjectinGISisexplained.Themethodsandstepsofgeneralizingpointobjectwithroughsetmethodareintroduced;andtheexperimentisanalyzed.Keywords:pointobject;GISgeneralization;roughset;classificationAboutthefirstauthor:LIWeniing,Ph.D,lecturer,majorsinapplicationofroughsetandfractalgeometryinGISanddigitalcartographyE-mail:wtusm1wj126.ccgn