1、人工智能与知识工程,第四章 不确定推理,基本概念 主观Bayes方法 可信度方法 模糊推理 定性推理,1、基本概念,不确定性推理 不确定性推理是建立在非经典逻辑基础上的一种推理,它是对不确定性知识的运用与处理 不确定性推理是从不确定性初始证据出发,运用不确定性的知识,最终推出具有一定程度的不确定性但却是合理或者近乎合理的新结论(判断)的思维过程 不确定性推理中的基本问题 不确定性的表示与度量 表示 知识不确定性表示 表示方法知识被成功应用的概率知识的可信度, 知识的隶属度,不确定性程度的确定一般由领域专家确定,它与知识一起存入知识库,不随推理的进程改变称知识的静态强度 确立不确定性表示方法的主
2、要依据:根据领域问题的特点,将不确定性必较准确地表示出来,满足问题求解的要求便于推理过程中对不确定性的计算 证据不确定性表示 初始证据:推理开始时的事实等 中间证据:前面推理中的结论作为进一步推理的证据 表示方法事实的可信度事实的隶属度,初始证据不确定程度的确定一般由用户给出。它随证据的不同有不同的值,称为证据的动态强度 中间证据不确定程度的确定由推理过程中的不确定性传递计算获得,它随推理过程所用的初始事实而改变,成为证据的动态强度 对表示法的基本要求与知识的不确定性表示一致,以便于推理中不确定性的计算与处理 度量 不确定性的度量与不确定性表示方法密切相关,可以用概率、可信度等进行度量 影响确
3、定度量方法的主要因素 能充分表达相应知识及证据不确定性的程度 度量范围的指定便于领域专家和用户对不确定性的估计,便于不确定性的计算,并保证计算结果不超出规定的度量范围 度量的确定应当既直观又要有相应的理论依据(如概率论等) 不确定性匹配 匹配算法 计算证据与知识前件的相似程度 算法:随不同的推理方法而不同 匹配阈值 确定选择使用知识的依据 当匹配计算的相似程度不小于阈值时,称为匹配成功,相应的知识可被使用 当匹配计算的相似程度小于阈值时,称为匹配不成功,相应的知识不能被使用,组合证据不确定性计算 组合证据 当知识的前件仅一个条件时,称单一证据,其不确定程度由用户给出(初始证据)或由不确定性传递
4、计算获得(中间证据) 当知识的前件有多个条件时,称组合证据。用于匹配计算时,应首先计算出组合证据的不确定程度 不确定性计算方法 设T(x)表示证据x为真的程度 最大最小方法 T(E1 and E2)=minT(E1),T(E2) T(E1 or E2)=maxT(E1),T(E2) 概率方法 T(E1 and E2)=T(E1)T(E2) T(E1 or E2)=T(E1)+T(E2)-T(E1)T(E2),有界方法 T(E1 and E2)=max0,T(E1)+T(E2)-1 T(E1 or E2)=min1,T(E1)+T(E2) 结论不确定性计算 不确定性传递计算 将证据及知识的不确定
5、性传递给结论,计算出结论不确定程度的算法 随推理方法的不同而不同 注:当推理中结论作为中间证据时,传递计算获得的的结论的不确定程度将被视为中间证据的不确定程度 结论不确定性合成 推理中当用不同的知识进行推理而获得相同的结论,但结论的不确定程度不同,这时需要对该结论的不确定程度进行合成,求得结论总的不确定程度 合成计算方法随推理方法的不同而不同,注:不确定性推理的基本问题除上述问题(不确定性表示与度量、不确定性匹配、组合证据不确定性计算、结论不确定性计算)外,还应包括推理方向、推理方法、控制策略。,不确定性推理的分类 模型方法 概念 在推理一级上扩展确定性推理,引入不确定性度量和计算,推理获得的
6、结论与控制策略无关 数值方法 推理中,对不确定性进行定量的表示与计算 基于概率论的方法 概率方法 可信度方法 证据理论 主观Bayes方法 模糊推理,非数值方法 推理中,对不确定性表示与计算不用定量的方式 定性推理 发生概率计算 控制方法 概念 在控制策略一级引入并处理不确定性,通过识别领域中引起不确定性的特征,采用相应的控制策略来限制或减少不确定性对系统产生的影响 相关性制导回溯 机缘控制 启发式搜索 ,2、主观Bayes方法,证据不确定性表示 主观Bayes方法中证据的不确定性用概率表示 初始证据 对初始证据E的不确定性度量是根据观测S给出在S为真时出现E的概率P(E/S)。 P(E/S)
7、的计算 将S出现时,出现E的可信度C(E/S)分为10个等级,并规定C(E/S)=-5,表示S出现时,E一定不出现,即:P(E/S)=0C(E/S)=0,表示S的出现与E的出现无关,即:P(E/S)=P(E)C(E/S)=5,表示S出现时,E一定出现,即:P(E/S)=1 对其它的C(E/S)按下述公式计算:P(E/S)=(C(E/S)+P(E)*(5-C(E/S)/5 0C(E/S) 5P(E/S)=(P(E)*(5+C(E/S)/5 -5C(E/S) 0 P(E)的值由用户在不考虑观测现象时根据E出现的概率给出 C(E/S)由用户根据观测现象给出,组合证据 组合证据的不确定性计算采用最大最
8、小方法 中间证据 中间证据的不确定性程度由传递计算获得 知识不确定性表示 一般形式 IF E THEN (LS,LN) H (P(H)) 不确定性参数 前提E可以是单条件,也可以是多条件的复合(组合证据) 结论是H,P(H)是H的先验概率。它是在没有任何专门证据的情况下H为真的概率,其值由领域专家给出 LS称为充分性度量,表示E对H的支持程度,即E为真越支持H为真则LS的值越大,LS的取值范围是0,+)。LS的值由领域专家给出 LN称为必要性度量,表示E对H的支持程度,即 E为真越支持H为真则LN的值越大,LN的取值范围是0,+)。LS的值由领域专家给出,不确定性传递计算 问题 已知:P(E)
9、,P(H),P(E/S),LS,LN 计算:P(H/S) 基本概率公式 Bayes公式:后验概率计算公式(杜达公式)P(H/S)=P(H/E)*P(E/S)+P(H/E)*P(E/S) 思路 计算出3个特殊点,利用分段线性插值计算其它值 特殊点:(P(E/S),P(H/S)) (0,P(H/S)),(P(E),P(H/S)),(1,P(H/S)),当P(E/S)=1时: 表示S的出现使E一定为真。显然有:P(E/S)=0和P(H/S)=P(H/E) 又由Bayes公式可得:记:则有:LS的含义: 当LS1时,P(H/E)P(H),即:E的存在增强H为真的概率 当LS=1时,P(H/E)=P(H
10、),即:E与H无关 当LS1时,P(H/E)P(H),即:E的存在使H为真的概率下降 当LS=0时,P(H/E)=0,即:E的存在使H为假 上述对LS的定性描述可作为领域专家确定LS的依据,当P(E/S)=0时: 表示S的出现使E为假,即:P( E/S)=1和P(H/E)=P(H/E) 又由Bayes公式可得:记:得:LN的含义: 当LN1时,P(H/E)P(H),即:E的存在增强H为真的概率 当LN=1时,P(H/E)=P(H),即:E与H无关 当LN1时,P(H/E)P(H),即:E的存在使H为真的概率下降 当LN=0时,P(H/E)=0,即:E的存在使H为假 上述对LN的定性描述可作为领
11、域专家确定LN的依据,当P(E/S)=P(E)时: 表示S的出现与E无关,即:P(E/S)=P(E),P(E)=P(E/S)和P(H/S)=P(H) 当P(E/S)为其它值时: 通过下述插值函数(称EH公式或UED公式)求H(H/S)的值:特别,当证据为初始证据时,用下述CP公式计算:EH和CP公式中的P(H/E)和P(H/E)按下述公式计算:,结论不确定性合成 几率函数 设P(x)是概率函数,几率函数(x)定义为:显然有: 结论不确定性合成计算 假设有n条知识支持相同的结论H,且每条知识的前提Ei(i=1,2,n)都有相应的观测Si与之对应 先就每条知识分别求出(Hi/Si) 按下述公式计算
12、再按下述公式进行合成计算,例: 书p.169 说明:求解这类问题时,先画出推理网络将有助于正确地解答问题。 评价 优点 理论基础坚实 LS,LN的给出减少了数据统计的工作量 较实用 不足 P(H)的给出较困难 由于Bayes公式对事件独立性的要求使该推理方法受到了限制,3、可信度方法,可信度概念 可信度指根据经验对一个事物或现象为真的相信程度 基础是概率论 CF模型 知识的表示 形式: IF E THEN H (CF(H,E) 其中: E,H既可以是简单公式,也可以是由AND、OR连接的组合公式 CF(H,E)称为知识的可信度或可信度因子、规则强度,它随知识一起存入知识库,属静态强度,取值范围
13、-1,1 可信度CF(H,E)的定义 定义:CF(H,E)=MB(H,E)-MD(H,E) MB称为信任增长度,即E的出现使结论H为真的信任增长度,MD称为不信任增长度,即E的出现对H为真的不信任增长度分析因:有:MB与MD互斥,结论 当CF(H,E)0,则P(H/E)P(H),即E的出现,增加了对H的可信度 当CF(H,E)=0,则P(H/E)=P(H),即E的出现与H的可信度无关 当CF(H,E)0,则P(H/E)P(H),即E的出现降低了对H的可信度 CF(H,E)值的给出 CF(H,E)的值由专家按上述结论中的原则给出 证据的表示 初始证据 初始证据E的可信度度量用CF(E)表示 CF
14、(E)的值由用户给出,原则是: 若对当前的观测S,E肯定为真,则CF(E)=1 若对当前的观测S,E肯定为假,则CF(E)=-1 若对当前的观测S,E与S无关,则CF(E)=0 若对当前的观测S,E为真的可能性较大,则CF(E)(0,1) 若对当前的观测S, E为假的可能性较大,则CF(E)(-1,0),组合证据 组合证据不确定性程度由最大最小方法计算获得 中间证据 中间证据E的不确定性程度(可信度)CF(E)由传递计算获得不确定性传递计算 公式 CF(H)=CF(H,E)*max0,CF(E) 分析 当CF(E)0,CF(H)=0,即:不考虑E以某种程度为假时对H的可信度的影响 当CF(E)
15、=1,CF(H)=CF(H,E),即:CF(H,E)是假设前提存在且为真时H的可信度 CF(H,E)的含义:前提E存在且为真时H的可信度,结论不确定性合成 两条知识的合成 知识 R1:IF E1 THEN H (CF(H,E1)) R2:IF E2 THEN H (CF(H,E2)) 分别计算每条知识的结论的可信度:CF1(H),CF2(H) 合成的可信度(综合可信度)多条知识的合成 分别计算出每条知识的结论的可信度 两两组合计算合成的可信度 例 书p.175,CF模型的变种 带阈值限度的不确定性推理 知识表示 形式IF E THEN H (CF(H,E),) 说明 0CF(H,E)1,CF(
16、H,E)值越大表示知识的可信度越高 0 1,它确定了知识匹配的原则:当CF(E) 时,知识可以被选用(匹配成功)当CF(E) 时,知识不能被选用(匹配失败) 证据表示 初始证据的可信度由用户给出,范围在0,1,其值越大表示对证据的可信度越高 中间证据的可信度由传递计算给出 组合证据可信度计算采用最大最小方法,不确定性传递计算 公式1 CF(H)=CF(H,E)*CF(E) 公式2 CF(H)=minCF(H,E),CF(E) 结论不确定性合成 假设有n条知识的结论需要合成 分别求出每条知识的结论的可信度CFi(H) 按下列方法之一计算合成后的可信度(综合可信度) 方法1:极大值法 CF1,2,
17、n(H)=maxCF1(H),CF2(H),CFn(H) 方法2:加权求和法,方法3:有限和法方法4:递推计算法C1=CF (H,E1)*CF(E1)Ci=Ci-1+(1-Ci-1)*CF(H,Ei)*CF(Ei) i=2,3,nCF1,2,n(H)=Cn 评价 优点 简单、直观 计算较方便 不足 可信度因子的指定主观性强,4、模糊推理,模糊数学基础 书2.4节,模糊命题 概念:含有模糊概念、模糊数据或带有确信程度的命题称为模糊命题 表示: 形式 x is A x is A (CF) 说明 x论域上的变量 A模糊概念或模糊数 CF对该命题确信程度的度量,可以是确定的数值也可以是一个模糊数或者模
18、糊语言值,模糊知识表示 模糊产生式的形式 IF E THEN H (CF,) 其中: E用模糊命题表示的模糊条件。可以是单个命题,也可以是由多个命题构成的复合条件 H用模糊命题表示的模糊结论 CF知识的可信度因子。可以是确定数值,也可以是模糊数或模糊语言值 限制知识使用的阈值 例: IF a面带笑容 THEN a考的不错 (0.7,0.6),模糊匹配与冲突消解 模糊匹配 两个模糊集所表示的模糊概念的相似程度称为匹配度 设A、B是论域U=u1, u2, un上的两个模糊概念(命题), 匹配度计算 贴近度 贴近度指两个模糊概念相互贴近的程度 计算:贴近度定义为:(A,B)=(AB+(1-AB)/
19、2其中:A BAB 例:书p.201 贴近度可以直接作为匹配度使用,语义距离 海明距离欧几里德距离明可夫斯基距离切比雪夫距离语义距离越大表示相似程度越低,因此可用1-d(A,B)作为匹配度,相似度 最大最小方法算术平均最小方法几何平均最小方法,相关系数法指数法相似度可以直接作为匹配度 复合条件的匹配度 分别求出各单条件的匹配度 使用最大最小方法或其它方法求出总匹配度,冲突消解(书p.204) 按匹配度大小排序从大到小排 按匹配度的加权平均排序从大到小排 按广义顺序关系排序 ,模糊推理模式(书p.207) 模糊假言推理 模糊拒取式推理 模糊三段论 模糊推理方法(书p.208) 简单模糊推理 知识:IF x is A THEN y is B 根据A、B构造模糊关系:R 模糊假言推理模式 证据:x is A 结论:y is BB=A o R 模糊拒取式推理模式 证据: y is B 结论: x is AA=R o B,模糊三段论(书p.222) 多维模糊推理(书p.224) 多重模糊推理(书p.228) 带可信度因子的模糊推理(书p.232),