1、第5章 空间数据组织与管理,补充内容1.:地理实体分类及数据编码,空间数据的组织 地理数据的编码,一、空间数据的组织,分层,区域分块,面向对象组织,矩形分块,经纬度分块,目前,象域市规划,地下管网、土地管理、公安警用这样一些GIS应用系统,由于其比例尺较大,所以多数都是以图幅为单位进行管理,即按图幅将大区域空间数据进行分割,现在世界各国的一般方法是采用经纬线分幅或采用规则矩形分幅,如示图1所示。 数据库中图幅的组织方法 图幅间被分割目标的组织方法 跨图幅地图漫游,(一)空间数据的分块组织,图幅之间邻近关系示意图 (a) 经纬线分幅 (b) 矩形分幅,数据库中图幅的组织方法,1. 为空间的组织形
2、式进行定义:坐标单位、经度和纬度跨度(用经纬线分幅时),比例尺、图幅的宽和高(用矩形分幅时),地图投影类型、椭球体参数等。 2. 逐一数字化输入并编辑各图幅,然后将这些图幅输入库中、输入时须指定图幅的文件名、图幅在库中的位置等。,图幅间被分割目标的组织方法,整个空间目标统一组织和管理方式 只建立和组织被分割目标方式,整个空间目标统一组织和管理方式,这种组织方式是建一个全库索引表,将整个空间的所有目标及其分属的图幅号均放入索引表中。,只建立和组织被分割目标方式,这种方式是只将被分割的目标放在索引表中,显然,此索引表要比上述的全库索引表要小得多。 在建库和图幅入库时,索引表是空的。当进行图幅拼接时
3、,每拼接一个目标,就将该目标的信息(包括该目标分别在两个图幅中的编号)插入索引表中的适当位置 。 在检索目标时,可根据所要检索的图幅号来查询索引表,从中找出符合要求的完整的目标对象。对索引表中没有的目标,可直接查询该图幅中的目标信息即可。,当要对由多幅不同比例尺地图组合而成的地图进行处理时 ,由于计算机实际物理内存总是有限的,如将全部地图调入内存后再处理,机器的运行效率将会极低,缩放漫游的速度也将会变得很慢。为此,系统在设计由多幅不同比例尺的数字地图的缩放漫游时,使用了一种以一幅地图为基本单位对象,并建立这些基本对象间拓扑邻接关系,从而实现多比例尺数字地图的快速显示与漫游。根据所建立的图幅对象
4、拓扑邻接关系将上一层或下一层内中相应的地图调入内存显示出来。而在同一层内的图幅内进行漫游时,当到达该图幅的边界时,同样根据邻接关系将相邻的地图显示出来。,跨图幅地图漫游,(二)空间数据的分层组织,空间数据可按某种属性特征形成一个数据层,通常称为图层(Coverage)。 1、空间数据分层方法: 1)专题分层 每个图层对应一个专题,包含某一种或某一类数据。如地貌层、水系层、道路层、居民地层等。 2)时间序列分层 即把不同时间或不同时期的数据作为一个数据层。 3)地面垂直高度分层 把离地面不同高度的数据作为一个数据层。 如:地下、地表、地上。,(二)空间数据的分层组织,2、空间数据分层的目的: 便
5、于空间数据的管理、查询、显示、分析等。 1)空间数据分为若干数据层后,对所有空间数据的管理就简化为对各数据层的管理,而一个数据层的数据结构往往比较单一,数据量也相对较小,管理起来就相对简单; 2)对分层的空间数据进行查询时,不需要对所有空间数据进行查询,只需要对某一层空间数据进行查询即可,因而可加快查询速度; 3)分层后的空间数据,由于便于任意选择需要显示的图层,因而增加了图形显示的灵活性; 4)对不同数据层进行叠加,可进行各种目的的空间分析。,二、地理数据的编码,分类、编码,点、线、面 特征码、坐标,信息世界,地理信息种类繁多、内容丰富、只有将它们按一定的规律进行分类和编码,使其有序地存储、
6、检索,以满足各种应用分析需求。因此,基础地理数据的分类和编码是空间数据库建立的重要基础。,(一)地理数据的编码,在属性数据中,有一部分是与几何数据的表示密切有关的。例如,道路的等级、类型等,决定着道路符号的形状、色彩、尺寸等。在GIS中,通常把这部分属性数据用编码的形式表示,并与几何数据一起管理起来。编码:是指确定地理数据的代码的方法和过程。代码:是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。编码的直接产物就是代码,而分类分级则是编码的基础。,(二)地理数据的分类编码原则,系统性和科学性:满足所涉及学科的科学分类方法,能反映出同一类型中不同的级别特
7、点。 一致性:对代码所定义的同一专业名词、术语必须是唯一的。 兼容性(标准化通用性):有国家或行业标准的要按标准进行,没有标准的必须考虑在有可能的条件下实现标准化。 实用性(简捷性):在满足国家标准的前提下、每一种编码应该是以最小的数据量载负最大的信息量。 可扩展性:编码的设置应留有扩展的余地,避免新对象的出现而使原编码系统失效、造成编码错乱现象。,(三)地理数据的编码,1.代码的类型是指代码符号的表示形式,有数字型、字母型、数字和字母混合型三类 数字型代码,是用一个或若干个阿拉伯数字表示对象的代码。 特点:结构简单、使用方便、易于排序,但对对象的特征描述不直观 字母型代码,是用一个或若干个字
8、母表示对象的代码。 特点:比同样位数的数字型代码容量大,还可提供便于识别的信息,易于记忆,但比同样位数的数字型代码占用更多的计算机空间。 数字、字母混合型代码,是由数字、字母、专用符组成的代码。特点:代码兼有数字型和字母型的优点,结构严密,直观性好,但组成形式复杂,处理麻烦。,2.GIS中代码的种类:可以分为两种,一种是分类码,另一种是标识码。 分类码:是根据地理信息分类体系设计出的各专业信息的分类代码,用以标识不同类别的数据,根据它可以从数据中查询出所需类别的全部数据。 标识码(亦称识别码),是在分类码的基础上,对每类数据设计出其全部或主要实体的识别代码,用以对某一类数据中的某个实体(如一个
9、居民地、一条河流等)进行个体查询检索,从而弥补分类码不能进行个体分离的缺陷。标识码是联系实体的几何信息和属性信息的关键字。,(三)地理数据的编码,3、编码方法举例 行政区划代码(GB226091)(层次编码法):是一种识别码用6位数字代码按层次分别表示:例如,南京市的代码为320101连云港市的代码为320701东海县320722 灌云县320723赣榆县320721 灌南县320822,(三)地理数据的编码,(三)地理数据的编码,补充内容2:空间数据库的设计和建立,空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。,现实世界 地理实体,需求分析,一、需求分析,需求分析
10、是整个空间数据库设计与建立的基础,主要进行以下工作: 1、调查用户需求:了解用户特点和要求,取得设计者与用户对需求的一致看法。 2、需求数据的收集和分析:包括信息需求(信息内容、特征、需要存储的数据)、信息加工处理要求(如响应时间)、完整性与安全性要求等。 3、编制用户需求说明书:包括需求分析的目标、任务、具体需求说明、系统功能与性能、运行环境等,是需求分析的最终成果。,在需求分析阶段完成:数据源的选择和对各种数据集的评价(一般、空间、属性评价)。,二、结构设计,指空间数据结构设计,结果是得到一个合理的空间数据模型,是空间数据库设计的关键。空间数据库设计的实质是将地理空间实体以一定的组织形式在
11、数据库系统中加以表达的过程,也就是地理信息系统中空间实体的模型化问题。,现实世界 地理实体,需求分析,结构设计,二、结构设计,1、概念模型,是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。,表示概念模型最有力的工具是ER模型,即实体联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点,在地理数据库设计中得到了广泛应用。,二、结构设计,1、概念模型,二、结构设计,2、逻辑模型,逻辑模型的设计是将概念模型结构转换
12、转换为具体DBMS可处理的地理数据库的逻辑结构(或外模式),包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。 从ER模型向关系模型转换的主要过程为: 确定各实体的主关键字; 确定并写出实体内部属性之间的数据关系表达式(函数依赖关系),即某一数据项决定另外的数据项; 把经过消冗处理(规范化处理)的数据关系表达式中的实体作为相应的主关键字; 根据、形成新的关系。 完成转换后,进行分析、评价和优化。,二、结构设计,3、物理设计,是指有效地将空间数据库的逻辑结构在物理存储器上实现,确定数据在介质上的物理存储结构,其结果是导出地理数据库的存储模式(内模式)。,主要内容包括确定记录存储格
13、式,选择文件存储结构,决定存取路径,分配存储空间。 物理设计的好坏将对地理数据库的性能影响很大,一个好的物理存储结构必须满足两个条件: 一是地理数据占有较小的存储空间; 二是对数据库的操作具有尽可能高的处理速度。 在完成物理设计后,要进行性能分析和测试。,三、数据字典设计,数据字典用于描述数据库的整体结构、数据内容和定义等。一个好的数据字典可以说是一个数据的标准规范,它可使数据库的开发者依此来实施数据库的建立、维护和更新。,数据字典的内容包括:数据库的总体组织结构、 数据库总体设计的框架、各数据层详细内容的定义及结构、 数据命名的定义元数据(有关数据的数据,是对一个数据集的内容、质量条件及操作
14、过程等的描述)等内容。,四、空间数据库的建立,1、建立空间数据库结构利用DBMS提供的数据描述语言描述逻辑设计和物理设计的结果,得到概念模式和外模式,编写功能软件,经编译、运行后形成目标模式,建立起实际的空间数据库结构。,四、空间数据库的建立,2、数据装入一般由编写的数据装入程序或DBMS提供的应用程序来完成。在装入数据之前要做许多准备工作,如对数据进行整理、分类、编码及格式转换(如专题数据库装入数据时,采用多关系异构数据库的模式转换、查询转换和数据转换)等。装入的数据要确保其准确性和一致性。 3、调试运行装入数据后,要对地理数据库的实际应用程序进行运行,执行各功能模块的操作,对地理数据库系统
15、的功能和性能进行全面测试。,3.4 空间数据库的建立与维护,五、空间数据库的维护,1、空间数据库的重组织指在不改变空间数据库原来的逻辑结构和物理结构的前提下,改变数据的存储位置,将数据予以重新组织和存放。 2、空间数据库的重构造指局部改变空间数据库的逻辑结构和物理结构。数据库重构通过改写其概念模式(逻辑模式)的内模式(存储模式)进行。,3.4 空间数据库的建立与维护,五、空间数据库的维护,3、空间数据库的完整性、安全性控制完整性是指数据的正确性、有效性和一致性,主要由后映象日志来完成,它是一个备份程序,当发生系统或介质故障时,利用它对数据库进行恢复。安全性指对数据的保护,主要通过权限授予、审计跟踪,以及数据的卸出和装入来实现。,实例:,森林经营管理信息系统,实例:,数字地质图空间数据库,相关的地质图空间数据库概念模型,复习题:,1.地理数据是怎样进行分块和分层的? 2.什么是地理数据编码?为什么要进行地理数据的编码?怎样进行地理数据编码? 3.了解创建空间数据库的过程。,