收藏 分享(赏)

GIS的数据获取与处理.doc

上传人:tkhy51908 文档编号:7196365 上传时间:2019-05-09 格式:DOC 页数:15 大小:1.62MB
下载 相关 举报
GIS的数据获取与处理.doc_第1页
第1页 / 共15页
GIS的数据获取与处理.doc_第2页
第2页 / 共15页
GIS的数据获取与处理.doc_第3页
第3页 / 共15页
GIS的数据获取与处理.doc_第4页
第4页 / 共15页
GIS的数据获取与处理.doc_第5页
第5页 / 共15页
点击查看更多>>
资源描述

1、第四章 GIS 的数据获取地理数据的基本特征地理数据的三个基本特征是空间,时间和专题属性。时间和专题属性特征为非空间特征。1、空间特征:空间特征是地理信息系统或空间信息系统所独有的。空间特征是指空间地物的位置,形状,大小的几何特征,以及与相邻地物的空间关系。2、专题特征:专题特征指空间现象和空间目标的属性特征,它是指除了时间和空间特征以外的空间现象的其它特征。3、时间特征:空间数据总是在某一特定的时间或时间段内采集得到或计算得到的。一、空间数据集及数据源的种类1、数据源。是指建立 GIS 的地理数据库所需的各种数据的来源,主要包括地图、遥感图像、文本资料、统计资料、实测数据、多媒体数据、已有系

2、统的数据等。可归纳为原始采集数据、再生数据和交换数据三种来源。(1)、地图数据地图是 GIS 的主要数据源,因为地图包含着丰富的内容,不仅含有实体的类别和属性,而且含有实体间的空间关系。地图数据主要通过对地图的跟踪数字化和扫描数字化获取。地图数据不仅可以作宏观的分析(用小比例尺地图数据),而且可以作微观的分析(用大比例尺地图数据)。在使用地图数据时,应考虑到地图投影所引起的变形,在需要时进行投影变换,或转换成地理坐标。地图数据通常用点、线、面及注记来表示地理实体及实体间的关系,如:点居民点、采样点、高程点、控制点等。线河流、道路、构造线等。面湖泊、海洋、植被等。注记地名注记、高程注记等。地图数

3、据主要用于生成 DLG、DRG 数据或 DEM 数据。(2)、遥感数据(影象数据)遥感数据是 GIS 的重要数据源。遥感数据含有丰富的资源与环境信息,在 GIS支持下,可以与地质、地球物理、地球化学、地球生物、军事应用等方面的信息进行信息复合和综合分析。遥感数据是一种大面积的 、动态的、近实时的数据源,遥感技术是 GIS 数据更新的重要手段。遥感数据(影象数据) 用于提取线划数据和生成数字正射影象数据、DEM 数据。(3) 、文本资料文本资料是指各行业、各部门的有关法律文档、行业规范、技术标准、条文条例等,如边界条约等。这些也属于 GIS 的数据。(4) 、统计资料国家和军队的许多部门和机构都

4、拥有不同领域(如人口、基础设施建设、兵要地志等)的大量统计资料,这些都是 GIS 的数据源,尤其是 GIS 属性数据的重要来源。(5)、实测数据野外试验、实地测量等获取的数据可以通过转换直接进入 GIS 的地理数据库,以便于进行实时的分析和进一步的应用。GPS(全球定位系统 )所获取的数据也是 GIS的重要数据源。(6)、多媒体数据多媒体数据(包括声音、录像等)通常可通过通讯口传入 GIS 的地理数据库中,目前其主要功能是辅助 GIS 的分析和查询。(7)、已有系统的数据GIS 还可以从其它已建成的信息系统和数据库中获取相应的数据。由于规范化、标准化的推广,不同系统间的数据共享和可交换性越来越

5、强。这样就拓展了数据的可用性,增加了数据的潜在价值。2、 数据集 。一个结构化的相关数据的集合体,包括数据本身和数据间的联系。数据集独立于应用程序而存在,是数据库的核心和管理对象。GIS 的主要数据集。数字线划数据(DLG ) 、数字扫描数据( DRG) 、影像数据(DOM) 、数字高程数据(DEM)和属性数据(包括社会经济数据) 、专业数据。二、空间数据采集的任务空间数据采集的任务是将现有的地图、外业观测成果、航空像片、遥感图像、文本资料等转换成 GIS 可以处理与接收的数字形式,通常要经过验证、修改、编辑等处理。不同数据输入需要用到不同的设备。例如,对于文本数据通常用交互的方式通过键盘录入

6、,也可用扫描仪扫描后用字符识别软件自动录入;对于矢量地图数据,可用平板数字化仪,采用手扶跟踪的方法输入,也可用扫描仪扫描成图像后,用栅格数据矢量化的方法自动追踪输入;等等。GIS 软件的这一部分还应具有数据转换装载的功能,即能把其它 GIS 或专题数据库中的数据通过转换装载到当前的 GIS 系统中。这一部分 GIS 软件的数据处理工作主要是几何纠正、图形和文本数据的编辑、图幅的拼接、拓扑关系的生成等,即完成 GIS 的空间数据在装入 GIS 的地理数据库前的各种工作。三、空间数据主要采集技术在 GIS 的几何数据采集中,如果几何数据已存在于其它的 GIS 或专题数据库中,那么只要经过转换装载即

7、可;对于由测量仪器获取的几何数据,只要把测量仪器的数据传输进入数据库即可,测量仪器如何获取数据的方法和过程通常是与 GIS 无关的。对于栅格数据的获取,GIS 主要涉及使用扫描仪等设备对图件的扫描数字化,这部分的功能 也较简单。因为通过扫描获取的数据是标准格式的图像文件,大多可直接进入 GIS 的地理数据库。从遥感影像上直接提取专题信息,需要使用几何纠正、光谱纠正、影像增强、图像变换、结构信息提取、影像分类等技术,主要属于遥感图像处理的内容。因此,以下主要介绍 GIS 中矢量数据的采集。GIS 中矢量数据的采集主要包括地图跟踪数字化与地图扫描数字化。1、地图跟踪数字化跟踪数字化是目前应用最广泛

8、的一种地图数字化方式,是通过记录数字化板上点的平面坐标来获取矢量数据的。其基本过程是:将需数字化的图件(地图、航片等)固定在数字化板上,然后设定数字化范围、输入有关参数、设置特征码清单、选择数字化方式(点方式和流方式等),就可以按地图要素的类别分别实施图形数字化了。由于跟踪数字化本身几乎不需要 GIS 的其它计算功能,所以跟踪数字化软件往往可以与整个 GIS 系统脱离开,因而可单独使用。地图跟踪数字化时数据的可靠性主要取决于操作员的技术熟练程度,操作员的情绪会严重影响数据的质量。操作员的经验和技能主要表现在能选择最佳点位来数字化地图上的点、线、面要素,判断十字丝与目标重合的程度等能力。为了保持

9、一致的精度,每天的数字化工作时间最好不要超过 6 小时。GIS 中的地图跟踪数字化软件为了获取矢量数据应具有下列基本功能:1、图幅信息录入和管理功能即对所需数字化的地图的比例尺、图幅号、成图时间、坐标系统、投影等信息进行录入和管理。这是所采集的矢量数据的数据质量的基本依据。2、特征码清单设置特征码清单是指安放在数字化仪台面或屏幕上的由图例符号构成的格网状清单,每种类型的符号占居清单中的一格。在数字化时只要点中特征码清单区的符号所在的网格,就可知道所数字化要素的编码,以方便属性码的输入。地图跟踪数字化软件应能使用户方便地按自己的意愿设置和定义特征码清单。3、数字化键值设置即设置数字化标识器上各按

10、键的功能,以符合用户的习惯。4、数字化参数定义主要是指系统应能选定不同类型的数字化仪,并确定数字化仪与主机的通讯接口。5、数字化方式的选择主要是指选择点方式还是流方式等进行数字化。6、控制点输入功能应能提示用户输入控制点坐标,以便于进行随后的几何纠正。 2、地图扫描数字化扫描数字化是目前较为先进的地图数字化方式,也是今后的发展方向,但要实现完全自动化还要做大量艰巨的努力,目前所能提供的扫描数字化软件是半自动化的,还需做相当的人机交互工作。地图扫描数字化的基本思想是:首先通过扫描将地图转换为栅格数据,然后采用栅格数据矢量化的技术追踪出线和面,采用模式识别技术识别出点和注记,并根据地图内容和地图符

11、号的关系,自动给矢量数据赋属性值。根据目前的技术水平,首先要对所扫描的彩色地图进行分版处理,通常分为黑版要素、水系版要素、植被要素和地貌要素,也可以直接对分版图进行扫描,然后由软件进行二值化,去噪音等处理,经常需要进行一些编辑,以保证自动跟踪和识别的进行;在软件自动进行跟踪和识别时,仍需要进行部分的人机交互,如处理断线、确定属性值等,有时甚至要人工在屏幕上进行数字化。与地图跟踪数字化相比,地图扫描数字化具有速度快、精度高、自动化程度高等优点,正在成为 GIS 中最主要的地图数字化方式。地图扫描数字化的自动化程度高,但必须具有一些对扫描后的地图数据的预处理能力,同时,由于其最后结果同地图跟踪数字

12、化的结果是相同的,因而还必须具有地图跟踪数字化所具有的一些功能。因此,其基本功能可描述为:1、地图扫描输入功能即能使用各种扫描仪把地图扫描数字化为栅格数据。2、图像格式转换和图像编辑功能能接受不同格式的栅格数据,并具有基本的图像编辑功能。3、彩色地图图像数据的分版功能能够将所扫描的彩色地图图像分成不同要素版的图像数据,以便于跟踪和识别。4、线状要素的矢量化功能能够对线状要素进行细化、断线修复、跟踪,也即具有自动提取线状要素中心线的功能。由于目前的自动化程度还不够高,经常需要进行人机交互,诸如在多条线的交叉点找到粘连及断开处,原实体连续担图形中断处(桥下河,桥中路) ,需人机交互指明继续追踪的方

13、向。5、点状符号和注记的自动识别功能应该能对点状符号和注记字进行自动识别,但完全自动化目前仍有困难,因此,有时需要人工在屏幕上进行数字化。6、属性编码的自动赋值应能对已数字化的要素自动根据其符号特征赋以相应的编码(包括等高线的高程)。这方面目前还需要较多的人机交互。7、图幅信息录入与管理功能同地图跟踪数字化一样,地图扫描数字化也需要录入图幅信息,以便于管理和质量控制。8、要素编码设置功能为了能进行属性编码的自动赋值,以及人机交互地进行属性编码赋值,都必须针对不同的要求进行地图要素的编码设置。9、控制点输入功能为了进行数字化后的数据纠正,必须具有控制点输入功能。3、属性数据的采集属性数据在 GI

14、S 中是空间数据的组成部分。例如,道路可以数字化为一组连续的象素或矢量表示的线实体,并可用一定的颜色、符号把 GIS 的空间数据表示出来,这样,道路的类型就可用相应的符号来表示。而道路的属性数据则是指用户还希望知道的道路宽度、表面类型、建筑方法、建筑日期、入口覆盖、水管、电线、特殊交通规则、每小时的车流量等。这些数据都与道路这一空间实体相关。这些属性数据可以通过给予一个公共标识符与空间实体联系起来。属性数据的录入主要采用键盘输入的方法,有时也可以辅助于字符识别软件。当属性数据的数据量较小时,可以在输入几何数据的同时,用键盘输入;但当数据量较大时,一般与几何数据分别输入,并检查无误后转入到数据库

15、中。为了把空间实体的几何数据与属性数据联系起来,必须在几何数据与属性数据之间有一公共标识符,标识符可以在输入几何数据或属性数据时手工输入,也可以由系统自动生成(如用顺序号代表标识符)。只有当几何数据与属性数据有一共同的数据项时,才能将几何数据与属性数据自动地连接起来;当几何数据或属性数据没有公共标识码时,只有通过人机交互的方法,如选取一个空间实体,再指定其对应的属性数据表来确定两者之间的关系,同时自动生成公共标识码。当空间实体的几何数据与属性数据连接起来之后,就可进行各种 GIS 的操作与运算了。当然,不论是在几何数据与属性数据连接之前或之后,GIS 都应提供灵活而方便的手段以对属性数据进行增

16、加、删除、修改等操作。4、数据格式转换因 GIS 软件的原因,不同的 GIS 软件对空间数据定义和存储结构的差别, GIS 数据库中的数据格式之间存在不兼容的问题。即不同的 GIS 软件所支持的数据存储格式不能直接相互利用。需经过格式转换才能相互被对方使用。数据格式转换的内容数据格式转换的内容包括三个方面的内容:空间定位信息,即几何信息,主要是实体的坐标。空间关系信息,几何实体之间的拓扑或几何关系数据。属性信息,几何实体的属性说明数据。数据格式转换的方式A、通过外部数据交换文件进行。大部分 GIS 工具软件都定义了外部交换文件格式,如:ARCINFO E00;MapInfo MID;AutoC

17、AD DXF;MGE ASCII Loader 等。系统文件格式的转换需经过三次转换才能完成。B、通过标准空间数据文件转换。实现二次转换。C、通过标准的 API 函数进行转换。实现一次转换。5、空间数据质量、评价、精度及控制1 、什么是 GIS 的数据质量GIS 的数据质量是指数据适用于不同应用的能力。指 GIS 中空间数据(几何数据和属性数据) 在表达空间位置、专题属性和时间特征时所能达到的准确性、一致性、完整性以及三者统一性的程度。2 、GIS 数据质量研究的目的GIS 数据质量研究的目的 是建立一套空间数据的分析和处理的体系,包括误差源的确定、误差的鉴别和度量方法、误差传播的模型、控制和

18、削弱误差的方法等,使未来的 GIS 在提供产品的同时,附带提供产品的质量指标,即建立 GIS 产品的合格证制度。3 、研究 GIS 数据质量的意义研究 GIS 数据质量对于评定 GIS 的算法、减少 GIS 设计与开发的盲目性都具有重要意义。如果不考虑 GIS 的数据质量,那么当用户发现 GIS 的结论与实际的地理状况相差较大时,GIS 会失去信誉。4 、GIS 的数据质量的基本特点1)准确度 :即测量值与真值之间的接近程度,可用误差来衡量。2)精度: 即对空间数据描述的详细程度,数据的紧密程度。精度低的数据,不一定准确度低。3)不确定度:指空间数据不能精确测得,当真值不可测或无法知道时,就无

19、法确定误差,因而用不确定性取代误差。1统计上,用标准差反映可能的误差,因此可以用标准差反映测量值的不确定性。2大比例尺地图上获得的数据的不确定性比小比例尺的小3高空间分辨率遥感图像上得到数据的不确定性比低分辨率数据的小。4)相容性:指两个不同来源的数据在同一个应用中使用的难易程度。1两个相邻地区的土地利用进行拼接,若两图边缘处不仅边界衔接良好,而且类型也一致,则称两图相容性好,反之,数据不相容。这种不相容可以通过统一分类和统一标准来减轻。2不同比例尺的地图数据不相容。3如果两种不同方法制作的林业图中的一个图的分类体系可以转化成另一个图的分类体系,那么前一个图与后一个图是相容的。5)一致性:指对

20、同一现象或同类现象的表达的一致程度。同一条河流,在地形图上和土壤利用图上 形状就不同。6)完整性:是指具有同一准确度和精度的数据,在特定空间范围内是否完整的程度。一般来说,空间范围越大,数据完整性的可能性就要差。7)可得性:指获取或使用数据得容易程度。8)现势性:指数据反映客观现象目前状况的程度。5 、空间数据误差1) 定义:测量值与真值之间的接近程度用误差来表示,当真值不可测或无法知道时,误差就不能确定,因而用不确定性取代误差。数据误差的大小即数据的不确定程度是一个积累的量。误差分为系统误差和随即误差统误差易纠正,随机误差只能逐一纠正,或采取不同处理手段来避免随机误差的产生。2)主要误差的来

21、源(p63) 数据搜集阶段:野外测量误差:仪器误差,记录误差辐射和几何纠正误差遥感数据误差:信息提取误差原始数据误差地图数据误差: 坐标转换误差制图综合误差印刷误差 数据输入阶段:数字化误差:仪器误差,操作误差不同系统格式转换误差:栅格矢量,三角网等值线数据存储阶段:数值精度不够:数据存储有效位不能满足要求格网或图像太大空间精度不够:地图最小制图单元太小 数据处理阶段分类间隔不合理插值误差多层数据叠加引起的误差传播多源数据综合分析误差比例尺太小引起的误差 数据输出阶段:输出设备不精确引起的误差输出的媒介不稳定造成的误差数据使用阶段:对数据包含的信息的误解 对数据信息使用不当3)数据的误差类型(

22、p6364)几何误差,属性误差,时间误差 ,逻辑误差 逻辑误差: 河流和道路不能穿过房屋森林和湖泊不能重合等对数据进行质量控制和质量保证或质量评价,一般先从数据逻辑性入手,检查逻辑误差,有助于发现不完整的数据和其他三类误差。 属性误差的例子:多边形边界两旁的属性类型应该不同。 时间误差的例子:早发生林火的植被长势比晚发生林火的区域应该差。 几何误差: 点误差线误差A、点误差:关于某点 A 的误差,即为测量位置(x,y)与其真实位置(x 0,y 0)的差异。点误差可以通过计算坐标差和距离的方法得到。xxx 0 yyy 0 或 D(x 2y 2)1B、线误差:如道路,河流,市政或行政边界线等在真实

23、世界中容易找到的,这一类的线性特征的误差主要产生于测量和对数据的后续处理。如按数学投影定义的经纬线,按高程绘制的等高线,或气候区划线于土壤类型界线。 这一类线性特征的线误差及在确定线的界限时的误差,被称为解译误差。解译误差与属性误差直接相关,若没有属性误差,则可以认为那些类型界线是准确的,因而解译误差为零。另一个角度:线误差为:(p67)直线骨头型误差分布带模式折线车链型曲线串肠型直线混和的线直线的误差分布一般以线的起点和终点处最大而中点误差最小。而折线表达的曲线误差,一般在线段中点处大,而在折线线段端点处小曲率大的曲线段容易引起大的误差。 属性误差属性数据可以分为命名,次序,间隔和比值四种测度中的一种。间隔和比值测度的属性误差可以用点误差的分析方法,进行分析用准确度评价方法,来评价定性数据的属性误差利用遥感分类中常用的准确度评价方法来评价定性数据的属性误差命名数据:土地覆盖图,土地利用图,土壤图次序数据:坡度,土壤侵蚀度,属性数据的不确定性的一个例子如土地利用类型某个土地利用类型中其他土地利用类型到底含有多大的比例,而这种比例在空间上的分布是变化的,因此,在根据这类土地利用类型图进行统计得到的面积一般会有偏差。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报