1、第 1 页主 要 内 容第 1 讲:绪论:专家系统概论 第一部分 知识表示第 2 讲:产生式系统 第 3 讲:框架 第二部分 不确定性处理第 4 讲:确定性理论 第 5 讲:Prospector 中的主观贝叶斯方法 第 6 讲:经典证据理论 简化证据理论面向有序命题的简化证据理论贝叶斯网第 7-20 讲:粗糙集理论第 2 页第一讲 专家系统概论1. 知识工程的含义和发展2. 专家系统(ES,Expert System)的定义3. 知识的定义4. 知识的阈值5. 知识的类型6. 常用的知识表示形式7. 专家系统(基于知识的系统) 的体系结构8. 一个基于规则的专家系统的体系结构9. 专家系统(E
2、S)的主要特征10. 专家系统的类型11. 简单的专家系统示例动物识别专家系统 ANIMAL1.知识工程的含义和发展 知识工程(Knowledge Engineering,KE)是研究如何运用人工智能(Artificial Intelligence,AI)的方法和技术建造专家系统(Expert System , ES)的一门工程性学科。 与建造 ES 有关的理论、方法、技术都是 KE 研究的内容; KE 是 AI 的应用分支,因此 KE 也被称为“应用 AI”。(一 ) 萌芽期 此时 AI 的研究处于低谷期 , EFeigenbaum(费根鲍姆)认为仅仅研究一般性问题的求解方法不够, 智能程序
3、还应有领域专门知识; 1965 年,费根鲍姆和 R.Linday(林赛) 开发了 DENDRAL 系统,该系统可以通过分析图谱推断出物质结构,第一次把 AI 和领域专门知识有机结合起来 ; 同年,EFeigenbaum(费根鲍姆)首次提出了 Expert System 的概念;(二 ) 形成期 (19651977)第 3 页 19651977 年,建造了一大批 ES 系统,并开始研制 ES 的开发工具,积累了很多经验; 最著名的有:1976 年,MIT E. Shortliff 博士研制的 MYCIN 系统、半自动知识获取工具 Teiresias、开发工具 EMYCIN; 但在建造 ES 的方
4、法论上还存在很多问题,认为应把 ES 建造提高到工程的高度来认识; 1975 年, 美国 J.Mecarthy(麦卡锡, AI 的开创者)提出“认识论工程” ; 1977 年,英国 D.Michie(米奇,AI 的先驱)扩充了“认识论工程”的概念,直接使用了“知识工程”一词; 1977 年,Feigenbaum 在第 5 届国际人工智能联合会 IJCAI-5 上做了特邀报告“AI 的艺术:KE 的课题及实例研究” ,他被誉为知识工程的鼻祖。(三)发展期KE 的理论、方法不断的丰富,派生出许多新的研究领域.知识表示的研究;.推理方法的研究;.不确定性和模糊性处理的研究确定性因子理论贝叶斯方法证据
5、理论ClasicEvdenThorympfyonexFutioce贝叶斯网可能性理论(模糊集合论、粗糙集、可能性逻辑)云模型非数值方法工程方法控制方法.知识获取方法的研究第 4 页数据挖掘 结构化机器学习Web习习习. Ontology(本体论)的研究. 分布式人工智能(Distributed Artificial Intelligence ,DAI)的研究. 智能主体(Agent)的研究Intelligent Agent, Multi-agent system, Mobile agent, Web Intelligent agent, Intelligent Information Agen
6、t(I2A). 专家系统开发工具、环境、平台的研究. 神经网络,多神经网络集成2. 专家系统(ES,Expert System)的定义: 专家系统,是一个智能程序,它能对那些需要专家知识才能解决的应用难题,提供相关领域权威专家水平的解答(Michie , 1979 ; Feigenbaum , 1977 ; Hayes-Roth , 1983) 。 专家系统,可以说是一个运用知识进行推理的计算机程序。推理就是使用某种符号逻辑,从一些事实得到结论的过程。3. 知识的定义 知识是特定领域中的描述、关系和过程;描述:识别和区分知识库中的对象和对象类; -个体刻画 关系:知识库中对象之间依赖性、关联性
7、; -对象间联系的刻画过程:推理中,规定要执行的动作; -用符号描述操作对象:知识库中最小单位的知识片,可能是:假设、事实、证据、结果、知识元、断言等。 从广义上来说,专家系统中的知识(表层知识)包括两种:一种是事实;另一种是经验,即一种好的猜测和判断,也称之为启发第 5 页式知识。4. 知识的阈值 问题:ES 拥有知识的数量与其所具有的问题求解能力之间的关系。回答:系统拥有的领域专门知识越多,其问题求解能力就越强。 知识原理:一个系统显示出高水平的智能,其原因是:它具有丰富的专门知识,并且它能有效地利用这些专门知识。这里的“智能”系指在巨大的搜索空间中,能迅速找到合适解的能力。Ca P2P1
8、系统拥有的知识数量在 C 与 E 之间时,增加系统知识,系统性能改善不够明显,增加的知识有用但不常用,只能用于解决罕见问题。W C E Qu系统所能达到的问题求解能力系统所拥有的知识数量系统拥有的知识数量在W 与 C 之间时,每给系统增加一些知识,都会使系统性能明显改善。第 6 页 知识的阈值知识的阈值,确切来说,系指知识的数量阈值,该阈值用来度量一个专家系统在相应的领域中所能达到的问题求解能力。. 合式阈值(W)明确表达一个任务所需要的最小知识数量。. 能力阈值(C)系统拥有的知识数量使它足以解决相应的领域中的大部分问题(约 90%左右) ,这个知识数量称作能力阈值。全体专家阈值(E)全体专
9、家阈值系指一个领域中所有人类专家的专门知识的总和。如果一个专家系统所拥有的知识数量达到了全体专家阈值,那么它就几乎能解决相应领域中的所有罕见和困难的问题。5. 知识的类型 事实性知识 定义 事实性知识是指人类对客观事物属性的描述。一般这种知识中不包含任何变量,可以用一个命题陈述来表达。 例:“北京有一千万人口” , “太阳从东方升起” ; 若事实性知识是批量的、有规律的,可用表格、图册和数据库(DB )来表示; 一些事实性知识可用规则来表示。 过程性知识 定义 描述做某事的过程,使人或计算机可照此去做。 例:“电视机的维修方法” , “怎样制作松花蛋” , 标准子程序库可表示过程性知识。 实例
10、性知识 定义 只给出一些实例,关于某一事物的知识却隐藏在这些实第 7 页例之中; 例:给出某一超市在过去 5 年的销售情况数据,从中人们可以找到这样一条规律, “牛奶和面包摆放在同一货架上出售,可以大幅度的促进这两种商品的出售。 ” 说明 人们所关心的不是实例本身,而恰恰是隐藏于其后的规律 行为性知识 定义 不直接给出事实本身,只给出它在某些(或某一)方面的行为; 例:给出函数 f 的若干性质,但没有给出 f 的解析表达式 说明:行为知识经常被表示成某种数学模型;从某种意义上说,行为知识描述事物的内涵,而不描述事物的外延。【内涵、外延】内涵指概念所反映的客观事物的本质属性。外延指概念所反映的一
11、切事物。与“内涵”相对。如“商品”这一概念的外延是古今中外所存在的一切商品。 类比知识 定义 既不给出某事物的外延,也不给出其内涵,只给出它与其第 8 页它事物的某些相似之处; 例 谜语一则: “山叠叠而不高,路遥遥而不远,雷轰轰而不雨,雪飘飘而不寒。 ”以山拟其形,以路拟其圈,以雪拟其粉,以雷拟其声。 类比知识一般不能完整刻画事物,有时会犯瞎子摸象的毛病; 类比知识,或者说类比,可启发人们用一个领域的知识去解决另一个领域的问题。 元级知识(简称元知识) 定义 关于知识的知识; 最常用的元知识是关于如何使用知识的知识,即元控制知识。6常用的知识表示形式 产生式(Productions) ,也称
12、为产生式规则,也简称为规则 规则是最常用的知识表示形式; 例 专家系统 MYCIN 的一条规则 (Shortliffe ,85) ,规则中包含不确定性信息,规则强度 0.7IF a) 微生物的染色体是革兰氏阳性,并且b) 微生物的结构是球菌,并且c) 微生物的生长形态是链状的THEN 有一个强度为 0.7 的参考性证据说明该微生物的类别是链球菌 框架(Frames) 语义网络(Semantic Nets) 脚本(Scripts)第 9 页 逻辑与集合(Logic and Sets) 知识表示语言(Knowledge Representation Language)7. 专家系统(基于知识的系统
13、) 的体系结构(1) ES 的一般结构 (OES) (2) 元知识系统 (Meta Knowledge System) 对推理进行控制,以提高知识的使用效率(3) 分布式 ES(DES)多个物理上分布的专家系统通过网络进行协作求解。(4) 多推理机系统(Multi-Engines)DAI, MAS(5) 多知识表示结构(6) 多知识表示 + 多推理机(7) 多层系统 (知识表示: 浅层 + 深层 )(8) 体系结构动态组织 + +推理机Engine知识库KB数据基GDBMES(Meta Expert System) OES第 10 页可以根据需要动态调整系统结构第 11 页8. 一个基于规则的
14、专家系统的体系结构(1)黑板(Black Board, BB)用来记录系统推理过程中用到的控制信息、中间假设、中间结果的数据基。 规划区:纪录对当前问题总的处理规划、目标、问题背景和问题当前状态 ; 议程区:纪录了一些待执行的动作; 中间解区:纪录了目前系统产生的中间结果、中间假设。(2)推理机(Inference Engine) 调度器:从议程区中选择下一次要执行的动作; 执行器:根据 KB 中的规定,执行调度器选择的动作; 一致性协调器:对执行器新得到的假设做似然性修正。(3)知识获取工具ES 建造的瓶颈、目标是 全面 + 精确人机界面输 (录)入一致性检验完备性检验编辑知识获取知识化简用
15、户知识工程师推理机执行器调度器一致性协调器数据基(黑板)规划区议程区中间解区知识源解释器知识库事实规则第 12 页 非正式会谈:知识工程师与领域专家协作收集知识; 全自动工具机器学习、机器归纳、数据挖掘 辅助工具知识编辑录入、求精、一致性、完备性检测(4)解释器对推理的结论给出合理的解释。执行追踪法、预制文本法、策略解释法、自动程序员解释法。(5)人机接口设计要求:友好 用户适应类(最低级):用户适应系统 系统适应类(最高级):系统适应用户(个性化) 混合适应类(中间级):部分用户适应系统,部分系统适应用户9. 专家系统(ES)的主要特征这些特征是 ES 与传统程序的显著差别。 具有显示表达的
16、大量领域专门知识 知识库与推理机(Engine )分离导致了专家系统的很大的灵活性(flexible) ; 知识片(基本知识单位)具有模块性: 改变一个知识片一般不会影响其它知识片,如果影响到其它一些知识片(规则) ,则可自动查找需要修改其它规则; 一个知识片不会被其它知识片直接调用。 符号处理 基本假设:知识具有可表示性。 符号处理 符号表示:知识表示为符号体系(形式化体系) ; 符号处理:运用知识的推理过程就转化为符号推理过程。 智能 专家系统是在某领域表现出智能行为的系统。 智能水平取决于: 知识的多寡和质量; 推理机的优劣:推理的完备性、推理效率第 13 页 自适应性:学习求解一般问题
17、的能力。 自推理 对系统自身的行为给出解释,说明系统给出答案的由来。10. 专家系统的类型分类标准:按所求解问题的类型或特点分类。 解释类专家系统 定义:该类专家系统的任务是通过对已知数据信息的分析、解释,确定其内涵。 例子:自然语言理解,图像分析,化学结构分析,信号解释(通过对声纳收集的舰船发动机声音识别舰船)等。 特点:数据通常是不准确、有错误、有丢失,数据量大。要求系统能从不完备信息中得出解释,并对数据做出某些假设,推理过程可能会很复杂、很长,系统需要对自身的推理过程给出解释。 预报类专家系统 定义:通过对过去和现在已知情况的分析来推断将来可能发生的情况。 例子:天气预报、自然灾害预报、
18、人口、经济谷物收成等。 特点:数据随时间变化,数据不准确、不完全,系统应提供随时间变化的动态模型,可以从不完全、不准确的信息中得出预报,并要达到一定的反应速度。 诊断类专家系统 定义:从观察的情况中推断出机能失常的原因所在。 例子:医疗诊断、机械诊断 特点:了解被诊断对象各组成部分的特点,互相联系,能够区分一种现象掩盖另一种现象,能够提出需要测量的数据。 设计类专家系统任务是求出满足设计的约束的目标配置。现已有电路、建筑、预算等方面的设计系统。这类系统必须善于从多方面的约束中得到设计,也就是需要搜索较大的可能解空间,善于分解子问题、处理子问题之间的相互作用,能实验性地构造出可能设计,并很容易地
19、对所得的设计进行修改,同时也需要能够用以前已证明正确的设计来解释当前的设计。第 14 页 规划类专家系统这类系统的知识是设计出能达到一给定目标的一串动作。规划专家系统已广泛应用于机器人、交通运输、项目规划、通讯、实验、军事、程序设计等领域。系统所要规划的目标可能是静态的,也可能是动态的,因而需要系统能够对未来作出预测。由于所涉及到的问题可能得复杂,系统就需要能够抓住重点,妥善处理各子目标之间的作用和关系,处理不确定的数据信息,并通过一些试验性的动作得出可行的计划。 监视类专家系统其任务是把观察到的对象的行为与其应该具有的行为进行比较,以发现异常情况,给出警报。监视专家系统的应用领域有核电站、航
20、空、疾病和财政管理等。这类系统一般具有较快的反应速度,发出的警取有较高的准确性,系统随时间和条件的变化来动态地处理输入信息。 控制类专家系统这类系统的知识是自适应地管理一个对象的全部行为。空中交通控制、商业管理、战斗管理、任务控制等领域的专家系统都属于这一类。这类系统需要能够解释当前的情况,预测未来,诊断问题的起因,不断修正计划和控制计划的执行。 调试类专家系统其任务是对失灵的对象给出处理方法。这类系统应同时具有计划、设计、预报等专家系统的能力。 教学类专家系统其任务是根据学生的特点和其知识及弱点,以最适当的方式进行教学和辅导。这类系统需要有诊断、调试功能,并且有良好的人机接口。 修理类专家系
21、统其任务是对发生故障的对象进行处理,使其恢复正常。这类系统需要有诊断、调试、计划、执行等能力。11. 简单的专家系统示例动物识别专家系统 ANIMAL 知识库 ANIMAL 的知识库非常小,仅仅包含 15 条规则(一般说来,一个专家系统的知识库应包含几百条规则) ; 解空间很小,仅仅包含 7 个解,或 7 个最高假设(在一个特定的动物园里,共有虎、豹、长颈鹿、斑马、鸵鸟、企鹅和信天第 15 页翁等 7 种动物) ; 初始事实集合很小,仅仅包含 20 个事实,如图中的 F1 至 F20; 数据(即事实、证据、断言) ,知识(即浅层知识,规则)和推理都是精确的,即确定性的; 知识库R1: 如果 某
22、动物有毛发(F1 )则 该动物是哺乳动物R2: 如果 某动物有奶(F2 )则 该动物是哺乳动物R3: 如果 某动物有羽毛(F3 )则 该动物是鸟R4: 如果 某动物会飞(F4 ) ,且下蛋( F5)则 该动物是鸟R5: 如果 某动物吃肉(F6 )则 该动物是食肉动物R6: 如果 某动物有锋利的牙齿(F7) ,且有爪(F8 ) ,且眼睛盯着前方(F9)则 该动物是食肉动物(M2)R7: 如果 某动物是哺乳动物(M1) ,且有蹄(F10)则 该动物是有蹄类哺乳动物(M3)R8: 如果 某动物是哺乳动物(M1) ,,且反刍(F11)则 该动物是有蹄类哺乳动物(M3) ,且偶蹄类R9: 如果 某动物是
23、哺乳动物(M1 ) ,且是食肉动物(M2), 且黄褐色(F12) ,且有暗班(F13)则 该动物是豹(H1)R10:如果 某动物是哺乳动物(M1) ,且是食肉动物(M2 ) ,第 16 页且黄褐色(F12) ,且有黑色条纹(F14)则 该动物是虎(H2)R11:如果 某动物是有蹄类哺乳动物(M3) ,且有长脖子(F15) ,且有长腿(F16) ,且有暗斑(F13)则 该动物是长颈鹿(H3)R12:如果 某动物是有蹄类哺乳动物(M3) ,且有黑条纹(F14)则 该动物是斑马(H4)R13:如果 某动物是鸟(M4 ) ,且不会飞(F17) ,且有长脖子(F15) ,且有长腿(F16) ,且是黑白色
24、(F18)则 该动物是鸵鸟(H5)R14:如果 某动物是鸟(M4 ) ,且不会飞(F17) ,且会游泳(F19) , 且是黑白色(F18)则 该动物是企鹅(H6)R15:如果 某动物是鸟(M4 ) ,且善飞(F20)则 该动物是信天翁(H7) ANIMAL 的正向推理网络第 17 页豹H1虎H2长颈鹿H3斑马H4 鸵鸟H5企鹅H6信天翁H7黄褐色F12暗斑F13长腿F16黑条纹F14有蹄类M3长脖子F15不会飞F17鸟M4黑白色F18会游泳F19善飞F20哺乳动物M1食肉动物M2有蹄F10反刍动物F11有羽毛F3会飞F4下蛋F5有毛发F1有奶F2吃肉F6犀利牙齿F7有爪F8眼睛前视F9有奶,有
25、犀利的牙齿,有爪,眼睛盯着前方,黄褐色,身上有黑色条纹。第 18 页 正向推理网络中的节点初始事实节点兰色中间结论节点绿色最高假设节点黑色中间结论节点和最高假设节点又被分为“与节点” 、 “或节点” 、 “与或节点” ANIMAL 的数据基 GDB(一个单调增加的数据基!)启动之初,数据基为空,用户回答和输入的事实,ANIMAL 运行推导出来的中间结论和最高假设都实时地插入数据基,因此在推理结束之前,ANIMAL 的数据基中存储的事实不断增加。当数据基中的事实不能再增加时,ANIMAL 运行结束。 正向推理的例子初始 GDB = 黄褐色(F12) ,暗班(F13) ,吃肉(F6 ) ,有毛发(F1 )由 R1 推出 M1(哺乳动物) ;由 R5 推出 M2(食肉动物) ;由 R9 推出 H1(豹) ,此时 GDB = F1, F6, F12, F13, M1, M2, H1 。 逆向推理的例子验证所看到的动物是不是老虎?已经观察到如下事实:被观察动物:有奶,有犀利的牙齿,有爪,眼睛盯着前方,黄褐色,身上有黑色条纹。在图上验证。