1、空间数据不确定性研究进展,提 纲,1. 问题的提出与意义 2. 地球空间数据的不确定性问题 3. 遥感数据中的不确定性问题 4. 模糊数学建模方法,1.问题的提出与意义,1)基本概念:客观世界的现象或过程中,存在以下两种基本情况:* 确定性:有规律性或无规律性,可预测性强,解释的唯一性,只有一种可能;有的测得准.* 不确定性:规律性不明显,时有时无,可预测性差,多种解释,多种可能,有的测不准.,2)近年来的讨论1996年,在UCGISCI(地理信息科学大学研究中心)中,在地理信息科学的优先研究领域的文件中:把“地理数据和基于地理信息系统分析中的不确定性”问题作为重中之重。1998年,NCGIA
2、(地理信息和分析国家中心)提出了“21世纪三大前沿研究问题”:空间数据精度和不确定性空间认知GIS建模与表达M.Goodchild(1987):“没有以准确数据为基础的GIS分析的结论是不正确的,至少是不健全的。”,3)国际会议,数据质量会议(The International Symposium on Spatial Data Quality)共进 行了三次第一届:1999年在香港第二届:2003年在香港第三届:2004年在奥地利维也纳第四届:2005年8月在北京大学召开,自然资源与环境科学中的空间精度评估国际会议(The International Symposium on Spatial
3、 Accuracy Assessment in Natural Resources and Environment Science)已开过八届:第一届 1994年美国Virginia的Williamsburg第二届 1996年美国的Colorado第三届 1998年加拿大的Quebec City第四届 2000年荷兰的Amsterdam第五届 2002年澳大利亚Melbourne第六届 2004年美国第八届 2008年上海交通大学 第九届 2010年7月20-23日在英国莱斯特大学,M.Goodchild(1998)等认为空间数据质量标准(Spatial Data Quality Standa
4、rd)的评估要素包括以下七个方面: (1)数据的产生过程(Lineage) (2)位置精度(Positional Accuracy) (3)属性精度(Attribute Accuracy) (4)完整性(Completeness) (5)逻辑的一致性(Logical Consistency) (6)语义精度(Semantic Accuracy):指图形、关系或属性序列的语义正确性 (7)现时性(Currentness):指数据的观测日期和更新日期,4)问题的核心,2. 空间数据的确定性与不确定性,地球科学中的确定性和不确定性并存且不对称是客观存在的,是符合对立统一法则的。与地球科学有关的现象和
5、过程中的数据也具有相应的确定性,同时不确定性或不对称性也是客观存在的。1)地球自转、公转、季节变化,自然带的分布规律是存在的。但大气过程、水文过程、尤其是地震、火山喷发的随机性、混沌现象也是客观存在的,确定性与不确定性并存的,也是不对称的。2)测得准与测不准是并存的。如气象、海洋、水文观测数据是准确的,以外的地方用插值法或计算所得的数据存在误差,具有不确定性。,3)理论上是测得准的,但实际上是测不准的。如太复杂的、动态的科学数据是测不准的。如全国耕地面积数据,全国农作物的产量、甚至全国人口数,不论是逐个调查,或统计抽样,都具有概率、统计特征。4)定义或概念的不确定性,导致一系列数据的不确定性。
6、如城市的定义(城乡结合带、农民工)不确定性,导致城市化率(目前我国为40%左右)等数据的不确定性,又如耕地的定义也是模糊的,导致了总产量、平均产量的不确定性。5)不同的对象有不同的确定性与不确定性问题,或不同的精度问题,不同的问题有不同的精度要求,不能千篇一律要求。,不确定性的一些概念:,不确定性是与“复杂性科学”(complexity science)密切相关,是指处于混沌(chaos )边缘或模糊边缘的现象。混沌边缘是指介于有序与无序之间的、或有序与序并存的现象。模糊边缘则是指介于清楚与模糊之间的、或清楚与模糊并存的现象。即无序、模糊、差错、异常或噪声等现象。 社会经济范畴的事件、过程,其
7、不确定性特征更突出、预测时准确率往往很低。如股市行情、交通事故等。,一般不确定性理论要点:,(1)不确定性是客观世界固有的特征或现象。 (2)共性与个性并存是普遍现象,但个性即差异性是主要的。 (3)运用不同的时、空分辨率去观测(察)客观世界所得的结果通常是不同的,因 此,对复杂的大事物(过程)不能仅用 一种时空尺度去观察。 (4)其确定性的一面使之可将复杂问题简单化、科学化。,(5)(数字、物理)模拟产品与真实世界之间 不可能完全一致。 (6)观测误差总是存在,真值极难获得。 (7)不同观测对象、不同目的要求的量测数据的精度要求不同。Km,m,cm,mm,n, 年、 日、时、分、秒、毫秒等。
8、 (8)认识、研究事物的长期性、局限性、不完整性。 (9)非线性及系统工程属不确定性科学的领 域,如1+1=2; 1+12,1+12。,地学空间数据不确定性的度量:,(1)点位置的不确定性度量: 点位误差的标准椭园模型。 (2)线位置的不确定性度量: Epsilon 带模型;误差带(熵,E-带、H-带)模型。 (3)面位置的不确定性度量,可由线状导出。 (4)GIS属性数据的不确定性度量:多边形(区域)边界属性(湖水边界、土地边界)的不确定性描述;区域内部属性(树种、庄稼)不确定性的描述。,(5)位置和属性综合的不确定性度量: S-带模型;场模型。 空间数据不确定性的分析方法: (1)基于误差
9、传播定律的不确定性分析。 (2)Monte Carlo模拟法。 (3)灵敏度(输入数据对输出结果的影响)分析。,3.遥感数据中的不确定性问题,1)问题的基本概念 普遍存在“同物异谱”与“异谱同物”现象 同一影像特征的多解性 几何变异与光谱变异的的随机性 量测与处理过程造成的随机性误差,2)问题产生的原因,数据固有的不确定性 数据获取过程中引起的不确定性 数据处理过程中引起的不确定性 数据转换过程中引起的不确定性 数据传输过程中引起的不确定性 数据提取与分类过程中引起的不确定性 数据应用不当引起的不确定性,3) 遥感数据不确定性控制的数学理论,一般数学方法: (1)概率论 (2)证据数学理论(又
10、称Dempster-shafer 理论) (3)模糊数学 (4)空间统计学 (5)现代工程控制论(不确定性传递函数),钱学森院士的贡献。 鲁棒(Robust)方法,模糊数学建模方法,天气冷热,雨的大小,风的强弱,人的胖瘦,年龄大小,个子高低,集合的概念 为了对事物进行识别,必须对事物按不同的要求进行分类。许多事物可以依据一定的标准进行分类。用于这种分类的数学工具就是集合论。 解决精确性的集合问题可以用经典集合论。 世界上大多数事物具有模糊性。为了描述具有模糊性的事物,引入模糊集合的概念。,一、模糊集合及其表述,经典集合:具有某种特性的所有元素的总和。模糊集合: 在不同程度上具有某种特性的所有元
11、素的总和。,经典集合 集合是数学中最基本的概念之一。 讨论某一概念的外延时总离不开一定的范围。这个讨论的范围,称为“论域”,论域中的每个对象称为“元素”。,表示集合的几种方法 (1)列举法:列写出集合中的全体元素。适用于元素有限的集合。 (2)定义法:以集合中元素的共性来描述集合的一种方法。适用于有许多元素而不能一一列举的集合。,3、模糊集合常用术语及其表述, 模糊集合和隶属函数 精确集合(非此即彼): A=X|X6 精确集合的隶属函数(特征函数):,模糊集合: 如果X是对象x的集合,则X的模糊集合 A:,称为模糊集A的隶属函数。,隶属函数的性质:a) 定义为有序对;b) 隶属函数在0和1之间
12、;c) 其值的确定具有主观性和个人的偏好。,X称为论域或域。,构造模糊集就是要:确定合适的论域和指定适当的隶属函数。,1,13,精确集合,模糊集合,1,13,6,论域的二种形式: 1)离散形式:举例:X=上海 北京 天津 西安为城市的集合。模糊集合 C = “对城市的爱好”可以表示为:C = (上海,0.8),(北京,0.9), (天津,0.7),(西安,0.6) 又:X = 0 1 2 3 4 5 6为一个家庭可拥有自行车数目的集合 模糊集合 C = “合适的可拥有的自行车数目” C= (0,0.1),(1,0.3),(2,0.7),(3,1.0),(4,0.7),(5,0.3),(6,0.
13、1)(序偶表示法),2) 连续形式:,令X = R+ 为人类年龄的集合, 模糊集合 B = “年龄在50岁左右”,则B可表示为:,图示:,模糊集合的公式表示(Zadeh表示法),注意:,并非求和和积分符号。,上述三个例子分别可写为,C = 0.8 /上海+0.9 /北京 +0.7 /天津 +0.6 /西安,C = 0.1/0+0.3/1+0.7/2+1.0/4+0.3/5+0.1/6,/ 不是除法运算,二、模糊集合的运算和隶属函数的参数化,包含或子集:,并(析取),交(合取),补(负),隶属函数参数化,1. 三角形隶属函数,参数a,b,c确定了三角形MF三个顶点的x坐标。,参数a,b,c,d确定了梯形四个角的x坐标。当b=c时,梯形就退化为三角形。,2. 梯形隶属函数,3. 高斯形隶属函数,高斯MF完全由c和决定,c代表MF的中心;决定了MF的宽度。,4. 一般钟形隶属函数,参数完全由b通常为正;如果b0,钟形将倒置。 钟形MF实际上是概率中柯西分布的推广,因此又称为柯西MF。,trig(x;20,60,80),trap(x;10,20,60,90),g(x;50,20),bell(x:20,4,50),隶属函数的参数化举例:,以钟形函数为例,,a,b,c,的几何意义如图所示。,改变a,b,c,即可改变隶属函数的形状。,谢谢大家!,