1、人工智能与知识工程,教学计划,人工智能及其发展 知识表示 确定性推理 不确定推理,第四章 不确定推理,基本概念 主观Bayes方法 可信度方法 模糊推理 定性推理,1、基本概念,不确定性推理 不确定性推理是建立在非经典逻辑基础上的一种推理,它是对不确定性知识的运用与处理 不确定性推理是从不确定性初始证据出发,运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的新结论(判断)的思维过程 不确定性推理中的基本问题 不确定性的表示与度量 表示 知识不确定性表示 表示方法知识被成功应用的概率知识的可信度, 知识的隶属度,不确定性程度的确定一般由领域专家确定,它与知识一起存入知识库
2、,不随推理的进程改变称知识的静态强度 确立不确定性表示方法的主要依据:根据领域问题的特点,将不确定性必较准确地表示出来,满足问题求解的要求便于推理过程中对不确定性的计算 证据不确定性表示 初始证据:推理开始时的事实等 中间证据:前面推理中的结论作为进一步推理的证据 表示方法事实的可信度事实的隶属度,初始证据不确定程度的确定一般由用户给出。它随证据的不同有不同的值,称为证据的动态强度 中间证据不确定程度的确定由推理过程中的不确定性传递计算获得,它随推理过程所用的初始事实而改变,成为证据的动态强度 对表示法的基本要求与知识的不确定性表示一致,以便于推理中不确定性的计算与处理 度量 不确定性的度量与
3、不确定性表示方法密切相关,可以用概率、可信度等进行度量 影响确定度量方法的主要因素 能充分表达相应知识及证据不确定性的程度 度量范围的指定便于领域专家和用户对不确定性的估计,便于不确定性的计算,并保证计算结果不超出规定的度量范围 度量的确定应当既直观又要有相应的理论依据(如概率论等) 不确定性匹配 匹配算法 计算证据与知识前件的相似程度 算法:随不同的推理方法而不同 匹配阈值 确定选择使用知识的依据 当匹配计算的相似程度不小于阈值时,称为匹配成功,相应的知识可被使用 当匹配计算的相似程度小于阈值时,称为匹配不成功,相应的知识不能被使用,组合证据不确定性计算 组合证据 当知识的前件仅一个条件时,
4、称单一证据,其不确定程度由用户给出(初始证据)或由不确定性传递计算获得(中间证据) 当知识的前件有多个条件时,称组合证据。用于匹配计算时,应首先计算出组合证据的不确定程度 不确定性计算方法 设T(x)表示证据x为真的程度 最大最小方法 T(E1 and E2)=minT(E1),T(E2) T(E1 or E2)=maxT(E1),T(E2) 概率方法 T(E1 and E2)=T(E1)T(E2) T(E1 or E2)=T(E1)+T(E2)-T(E1)T(E2),有界方法 T(E1 and E2)=max0,T(E1)+T(E2)-1 T(E1 or E2)=min1,T(E1)+T(E
5、2) 结论不确定性计算 不确定性传递计算 将证据及知识的不确定性传递给结论,计算出结论不确定程度的算法 随推理方法的不同而不同 注:当推理中结论作为中间证据时,传递计算获得的的结论的不确定程度将被视为中间证据的不确定程度 结论不确定性合成 推理中当用不同的知识进行推理而获得相同的结论,但结论的不确定程度不同,这时需要对该结论的不确定程度进行合成,求得结论总的不确定程度 合成计算方法随推理方法的不同而不同,注:不确定性推理的基本问题除上述问题(不确定性表示与度量、不确定性匹配、组合证据不确定性计算、结论不确定性计算)外,还应包括推理方向、推理方法、控制策略。,不确定性推理的分类 模型方法 概念
6、在推理一级上扩展确定性推理,引入不确定性度量和计算,推理获得的结论与控制策略无关 数值方法 推理中,对不确定性进行定量的表示与计算 基于概率论的方法 概率方法 可信度方法 证据理论 主观Bayes方法 模糊推理,非数值方法 推理中,对不确定性表示与计算不用定量的方式 定性推理 发生概率计算 控制方法 概念 在控制策略一级引入并处理不确定性,通过识别领域中引起不确定性的特征,采用相应的控制策略来限制或减少不确定性对系统产生的影响 相关性制导回溯 机缘控制 启发式搜索 ,2、主观Bayes方法,证据不确定性表示 主观Bayes方法中证据的不确定性用概率表示 初始证据 对初始证据E的不确定性度量是根
7、据观测S给出在S为真时出现E的概率P(E/S)。 P(E/S)的计算 将S出现时,出现E的可信度C(E/S)分为10个等级,并规定C(E/S)=-5,表示S出现时,E一定不出现,即:P(E/S)=0C(E/S)=0,表示S的出现与E的出现无关,即:P(E/S)=P(E)C(E/S)=5,表示S出现时,E一定出现,即:P(E/S)=1 对其它的C(E/S)按下述公式计算:P(E/S)=(C(E/S)+P(E)*(5-C(E/S)/5 0C(E/S) 5P(E/S)=(P(E)*(5+C(E/S)/5 -5C(E/S) 0 P(E)的值由用户在不考虑观测现象时根据E出现的概率给出 C(E/S)由用
8、户根据观测现象给出,组合证据 组合证据的不确定性计算采用最大最小方法 中间证据 中间证据的不确定性程度由传递计算获得 知识不确定性表示 一般形式 IF E THEN (LS,LN) H (P(H)) 不确定性参数 前提E可以是单条件,也可以是多条件的复合(组合证据) 结论是H,P(H)是H的先验概率。它是在没有任何专门证据的情况下H为真的概率,其值由领域专家给出 LS称为充分性度量,表示E对H的支持程度,即E为真越支持H为真则LS的值越大,LS的取值范围是0,+)。LS的值由领域专家给出 LN称为必要性度量,表示E对H的支持程度,即 E为真越支持H为真则LN的值越大,LN的取值范围是0,+)。
9、LS的值由领域专家给出,不确定性传递计算 问题 已知:P(E),P(H),P(E/S),LS,LN 计算:P(H/S) 基本概率公式 Bayes公式:后验概率计算公式(杜达公式)P(H/S)=P(H/E)*P(E/S)+P(H/E)*P(E/S) 思路 计算出3个特殊点,利用分段线性插值计算其它值 特殊点:(P(E/S),P(H/S)) (0,P(H/S)),(P(E),P(H/S)),(1,P(H/S)),当P(E/S)=1时: 表示S的出现使E一定为真。显然有:P(E/S)=0和P(H/S)=P(H/E) 又由Bayes公式可得:记:则有:LS的含义: 当LS1时,P(H/E)P(H),即
10、:E的存在增强H为真的概率 当LS=1时,P(H/E)=P(H),即:E与H无关 当LS1时,P(H/E)P(H),即:E的存在使H为真的概率下降 当LS=0时,P(H/E)=0,即:E的存在使H为假 上述对LS的定性描述可作为领域专家确定LS的依据,当P(E/S)=0时: 表示S的出现使E为假,即:P( E/S)=1和P(H/E)=P(H/E) 又由Bayes公式可得:记:得:LN的含义: 当LN1时,P(H/E)P(H),即:E的存在增强H为真的概率 当LN=1时,P(H/E)=P(H),即:E与H无关 当LN1时,P(H/E)P(H),即:E的存在使H为真的概率下降 当LN=0时,P(H
11、/E)=0,即:E的存在使H为假 上述对LN的定性描述可作为领域专家确定LN的依据,当P(E/S)=P(E)时: 表示S的出现与E无关,即:P(E/S)=P(E),P(E)=P(E/S)和P(H/S)=P(H) 当P(E/S)为其它值时: 通过下述插值函数(称EH公式或UED公式)求H(H/S)的值:特别,当证据为初始证据时,用下述CP公式计算:EH和CP公式中的P(H/E)和P(H/E)按下述公式计算:,结论不确定性合成 几率函数 设P(x)是概率函数,几率函数(x)定义为:显然有: 结论不确定性合成计算 假设有n条知识支持相同的结论H,且每条知识的前提Ei(i=1,2,n)都有相应的观测S
12、i与之对应 先就每条知识分别求出(Hi/Si) 按下述公式计算再按下述公式进行合成计算,例: 书p.169 说明:求解这类问题时,先画出推理网络将有助于正确地解答问题。 评价 优点 理论基础坚实 LS,LN的给出减少了数据统计的工作量 较实用 不足 P(H)的给出较困难 由于Bayes公式对事件独立性的要求使该推理方法受到了限制,3、可信度方法,可信度概念 可信度指根据经验对一个事物或现象为真的相信程度 基础是概率论 CF模型 知识的表示 形式: IF E THEN H (CF(H,E) 其中: E,H既可以是简单公式,也可以是由AND、OR连接的组合公式 CF(H,E)称为知识的可信度或可信
13、度因子、规则强度,它随知识一起存入知识库,属静态强度,取值范围-1,1 可信度CF(H,E)的定义 定义:CF(H,E)=MB(H,E)-MD(H,E) MB称为信任增长度,即E的出现使结论H为真的信任增长度,MD称为不信任增长度,即E的出现对H为真的不信任增长度分析因:有:MB与MD互斥,结论 当CF(H,E)0,则P(H/E)P(H),即E的出现,增加了对H的可信度 当CF(H,E)=0,则P(H/E)=P(H),即E的出现与H的可信度无关 当CF(H,E)0,则P(H/E)P(H),即E的出现降低了对H的可信度 CF(H,E)值的给出 CF(H,E)的值由专家按上述结论中的原则给出 证据
14、的表示 初始证据 初始证据E的可信度度量用CF(E)表示 CF(E)的值由用户给出,原则是: 若对当前的观测S,E肯定为真,则CF(E)=1 若对当前的观测S,E肯定为假,则CF(E)=-1 若对当前的观测S,E与S无关,则CF(E)=0 若对当前的观测S,E为真的可能性较大,则CF(E)(0,1) 若对当前的观测S, E为假的可能性较大,则CF(E)(-1,0),组合证据 组合证据不确定性程度由最大最小方法计算获得 中间证据 中间证据E的不确定性程度(可信度)CF(E)由传递计算获得不确定性传递计算 公式 CF(H)=CF(H,E)*max0,CF(E) 分析 当CF(E)0,CF(H)=0
15、,即:不考虑E以某种程度为假时对H的可信度的影响 当CF(E)=1,CF(H)=CF(H,E),即:CF(H,E)是假设前提存在且为真时H的可信度 CF(H,E)的含义:前提E存在且为真时H的可信度,结论不确定性合成 两条知识的合成 知识 R1:IF E1 THEN H (CF(H,E1)) R2:IF E2 THEN H (CF(H,E2)) 分别计算每条知识的结论的可信度:CF1(H),CF2(H) 合成的可信度(综合可信度)多条知识的合成 分别计算出每条知识的结论的可信度 两两组合计算合成的可信度 例 书p.175,CF模型的变种 带阈值限度的不确定性推理 知识表示 形式IF E THE
16、N H (CF(H,E),) 说明 0CF(H,E)1,CF(H,E)值越大表示知识的可信度越高 0 1,它确定了知识匹配的原则:当CF(E) 时,知识可以被选用(匹配成功)当CF(E) 时,知识不能被选用(匹配失败) 证据表示 初始证据的可信度由用户给出,范围在0,1,其值越大表示对证据的可信度越高 中间证据的可信度由传递计算给出 组合证据可信度计算采用最大最小方法,不确定性传递计算 公式1 CF(H)=CF(H,E)*CF(E) 公式2 CF(H)=minCF(H,E),CF(E) 结论不确定性合成 假设有n条知识的结论需要合成 分别求出每条知识的结论的可信度CFi(H) 按下列方法之一计
17、算合成后的可信度(综合可信度) 方法1:极大值法 CF1,2,n(H)=maxCF1(H),CF2(H),CFn(H) 方法2:加权求和法,方法3:有限和法方法4:递推计算法C1=CF (H,E1)*CF(E1)Ci=Ci-1+(1-Ci-1)*CF(H,Ei)*CF(Ei) i=2,3,nCF1,2,n(H)=Cn 评价 优点 简单、直观 计算较方便 不足 可信度因子的指定主观性强,4、模糊推理,模糊数学基础 模糊性与随机性 随机性:样本空间本身是明确的或确定的,事件的含义是明确的和确定的,但事件是否发生预先不能确定,然而可以确定事件发生的可能性概率 模糊性:样本空间本身是明确的或确定的,事
18、件或概念本身不明确和不确定模糊,因而一个对象是否符合一个模糊的概念不能明确地判定 集合与特征函数 论域:讨论问题的范围 集合:具有某种特征或属性的事物的全体 集合的表示 可以列举集合中的全部元素 可以描述集合中元素具有的特征 R+=x|x0,可以描述论域中元素与集合中元素的区别称CA(u)为集合A的特征函数 ?是集合A中的元素与不是集合A中的元素的区别是什么 集合与其特征函数是一一对应的,因此可以用特征函数来表示它对应的集合 模糊集与隶属函数 概念 定义:设U是论域,函数A:U0,1,称A为U上的隶属函数,由A所构成的集合A称为U上的模糊集,A(u)称为u对A的隶属度 ?模糊集是U的子集还是0
19、,1的子集 模糊集的表示方法 设论域U=u1,u2,un,U上的模糊集A可以表示为: A=A(u1), A(u2), A(un) A=A(u1)/u1 +A(u2)/ u2 + A(un)/ un A=A(u1)/u1 ,A(u2)/ u2 , A(un)/ un A=(A(u1),u1 ),(A(u2), u2 ),( A(un), un),设论域U是连续的,如年龄论域U=0,100,统一表示形式?如何判定两个模糊集合相等 论域U上模糊集的全体记为F(U),即F(U)=A| A:U0,1,模糊集运算 设A,BF(U),uU 如果: B(u) A(u),称A包含B,记为:BA 如果: B(u)
20、 A(u),称A严格包含B,记为:BA AB的隶属函数为记为:AB(u)=A(u)B(u) AB的隶属函数为记为: AB(u)=A(u)B(u) A的隶属函数为: A (u)=1- A(u) 水平截集 定义:设A F(U), 0,1,称A=u|uU,A(u) 为A的水平截集, 称为阈值或置信水平,水平截集的性质 设A,BF(U), 0,1,有(AB) = A B (AB) = A B 设AF(U),1,2 0,1,且10为A的支集当Ker(A)时,称A为正则模糊集,模糊度 模糊度是对模糊集模糊程度的一种度量 定义:设AF(U),函数d:F(U)0,1,且满足: d (A) 0,1 当A为普通集
21、合时,d (A)=0 uU,A的隶属度函数A(u)0.5,则d (A)=1 uU,A,BF(U),满足B(u)A(u)0.5 或 B(u)A(u)0.5则有 d (B) d (A) d (A)=d (A)称d为定义在F(U)上的模糊度,d (A)称为A的模糊度 结论 模糊集的模糊度是0,1上的一个数 普通集合的模糊度为0,表示普通集合刻画的概念不模糊 越靠近0.5时越模糊,特别当A(u)=0.5时最模糊 模糊集与其补集有相同的模糊度,几种常用的模糊度 设U=u1,u2 ,un和海明(Haming)模糊度殴几里德(Euclid)模糊度明可夫斯基(Minkowski)模糊度香农模糊度,模糊数 概念
22、 定义:如果实数域上的模糊集A的隶属函数A在R上连续且具有如下性质 A是凸模糊集,即A的任意水平截集A是R上的闭区间 A是正规模糊集,即:uR,使 A(u)=1则称A为一个模糊数 结论 模糊数是一种特殊的模糊集 模糊数的隶属函数是单峰的,其最大值为1 运算 定义:设是实数域R上的二元运算,A和B是R上的模糊数。A和B的运算定义为:,特别:例:书p.40 一般来说,模糊数A和B运算的结果AB也是模糊数,模糊关系与关系的复合 模糊关系 定义:设Ai是Ui(i=1,2,n)上的模糊集,对应的隶属函数为Ai(ui), ui Ui ,称为A1,A2,An 的笛卡尔积,它是U1 U2 Un上的一个模糊集
23、定义:在U1 U2 Un上的一个n元模糊关系R是指以U1 U2 Un为论域的一个模糊集,记为:二元关系 论域U,V上的二元关系R记为:,当U=u1,u2,um,V=v1,v2,vn时,关系R可表示为模糊矩阵:复合关系 定义:设R1,R2分别是UV与VW上的模糊关系,R1与R2的复合(合成)是从U到W的模糊关系(UW上的模糊关系),记为:R1R2,其隶属函数为例:书p.43,模糊变换 定义:设A是论域U上的模糊集,R是UV上的模糊关系,B=AR称为模糊变换。B将U上的模糊集变换为V上的模糊集 例:书p.43 实数域上常用的隶属函数 书p.45 建立隶属函数的方法 书p.47,模糊命题 概念:含有
24、模糊概念、模糊数据或带有确信程度的命题称为模糊命题 表示: 形式 x is A x is A (CF) 说明 x论域上的变量 A模糊概念或模糊数 CF对该命题确信程度的度量,可以是确定的数值也可以是一个模糊数或者模糊语言值,模糊知识表示 模糊产生式的形式 IF E THEN H (CF,) 其中: E用模糊命题表示的模糊条件。可以是单个命题,也可以是由多个命题构成的复合条件 H用模糊命题表示的模糊结论 CF知识的可信度因子。可以是确定数值,也可以是模糊数或模糊语言值 限制知识使用的阈值 例: IF a面带笑容 THEN a考的不错 (0.7,0.6),模糊匹配与冲突消解 模糊匹配 两个模糊集所
25、表示的模糊概念的相似程度称为匹配度 设A、B是论域U=u1, u2, un上的两个模糊概念(命题), 匹配度计算 贴近度 贴近度指两个模糊概念相互贴近的程度 计算:贴近度定义为:(A,B)=(AB+(1-AB)/ 2其中:A BAB 例:书p.201 贴近度可以直接作为匹配度使用,语义距离 海明距离欧几里德距离明可夫斯基距离切比雪夫距离语义距离越大表示相似程度越低,因此可用1-d(A,B)作为匹配度,相似度 最大最小方法算术平均最小方法几何平均最小方法,相关系数法指数法相似度可以直接作为匹配度 复合条件的匹配度 分别求出各单条件的匹配度 使用最大最小方法或其它方法求出总匹配度,冲突消解(书p.
26、204) 按匹配度大小排序从大到小排 按匹配度的加权平均排序从大到小排 按广义顺序关系排序 ,模糊推理模式(书p.207) 模糊假言推理 模糊拒取式推理 模糊三段论 模糊推理方法(书p.208) 简单模糊推理 知识:IF x is A THEN y is B 根据A、B构造模糊关系:R 模糊假言推理模式 证据:x is A 结论:y is BB=A o R 模糊拒取式推理模式 证据: y is B 结论: x is AA=R o B,模糊三段论(书p.222) 多维模糊推理(书p.224) 多重模糊推理(书p.228) 带可信度因子的模糊推理(书p.232),5、定性推理,什么是定性推理 定性
27、推理的基本方法 定性推理的应用 定性空间推理,什么是定性推理,定性推理是人工智能学科的一种崭新推理方法,它源于对物理现象的研究,早期工作常常是针对物理过程的,如结合动力学、热力学中的问题来讨论。 1984年,“Artificial Intelligence”杂志出版了定性推理专辑(一),刊载了de KleerForbus和Kuipers等人的奠基性文章,标志着定性推理研究的全面展开1991年该刊又出版了定性推理专辑(二),标志着定性推理研究进入一个新阶段,定性推理使用定性信息,对系统结构行为和功能进行描述,并研究它们之间的关系和因果性,推出定性解释,以模仿人类定性常识推理的一种跨领域推理方法,
28、结构描述,定性推理的基本要素,量空间、本体基元、建模原则、因果性,量空间 从定性推理研究的论域出发,可以区分两类不同的定性推理: 一类论域中的变量是连续变化的, 另一类论域中的变量是离散变化的。 比如,诊断和验证讨论的都是数字化问题,属于离散型的定性推理研究 对于第一类定性推理研究,必须把连续的论域定性量化为一个离散的符号集,使得选择在同一个开域内的值表现出定性一致的行为性质,而边界值则反映出发生重要转化的位置 一个连续空间的离散化表示称为量空间(Quantity Space)。最简单的量空间是S+, 0, -,分别表示正数、零和负数。,本体基元 定性推理模型必须有效地表示结构知识和行为知识。
29、结构描述是以本体基元(Ontological Primitives)为基础的。 基元是实际物理系统结构中具有独立功能的最小单元 不同基元的选择确定不同的结构描述,不同的结构描述确定不同的定性模型。 本体基元的选择一般应满足两个条件: 一是表示有意义常识的最小单元; 二是能够描述所有的物理过程。,建模原则从实际系统建立定性模型的原则: 可合成性 系统结构就由部件、部件行为和部件间的联系组成。每个部件都表现出一定的行为,部件行为之间存在相互作用,整体行为能通过一定的方法从部件行为及它们之间的相互作用推导出来。 局部传播性 定性推理要求“影响”只能通过特殊的物理连接局部传播,也就是部件的行为和状态变化只与直接相邻或直接相关的部件有关。对这种局部传播规则的解释即是所谓的因果性。 功能性 定性推理设计出来的系统必须具备一定的功能,它反映了系统行为与人类目标之间的关系。功能是不同于行为的更高层次,由系统的部件功能构成系统的整体功能,对系统功能的推理有利于对系统行为的理解以及系统设计中的优化。 因果性,