1、基于案例推理技术的研究与应用基于案例推理(Case-based reasoning,简称 CBR)是近年来人工智能领域中兴起的一项重要的推理技术。与基于规则的推理模式不同是,它通过访问案例库中的同类案例(源案例)的求解从而获得当前问题(目标案例)的解决方法。基于案例推理首先是由美国耶鲁大学罗杰沙克(Roger Schank)在研究动态存储器技术中发现的,并在1982 年所著 Dynamic Memory一书中提出了动态记忆理论,这被认为是最早关于 CBR 的思想。经过二十多年的发展,目前 CBR 已成为人工智能与专家系统的一种非常具有生命力的推理技术,广泛应用于诸多领域,并受到越来越多的重视。
2、CBR 是一种基于经验知识进行推理的人工智能技术,它是用案例来表达知识并把问题求解和学习相融合的一种推理方法,它强调人在解决新问题时,常常回忆起过去积累下来的类似情况的处理,并通过适当修改过去类似情况处理的方法来解决新问题。例如,当我不理解“基于案例的推理”是什么的时候,首先我会打开百度搜索引擎,接着输入“基于案例的推理”又或“案例的推理”来进行搜索,最后找到它确切的解释,记录下来。这是因为在我先前的经验积累中,对于其它类似的问题,我也是用同样的方法来解决的。就是说当我们遇到某种情况时,我们习惯于回忆起以前情境中的方式、方法,策略以及解决方案等,来帮助我们找到当前问题的解决方案。从认识思维的角
3、度来看,它表现了人类进行记忆、规划、学习和问题求解的心理模型,体现了更高级的知识环境,是多种人工智能技术的综合。基于案例推理的基本原理当人们选择医生看病时,他们更愿意选择年长的 ,因为一个有经验的老医生有更多的临床经验,已经见过和治疗过许多与我们有类似疾病的病人。从本质上讲,我们考虑医生的经验时 ,更多的是根据他们曾处理过多少病例,而不是他们懂得的治疗知识。案例推理与医生看病有相似的原理, 符合专家迅速、准确地求解新问题的过程。一个典型的 CBR 问题求解过程基本步骤可以归纳为 R4:案例检索(Retrieve ) 、案例重用 (Reuse)、案例修改 (Revise) 和案例保留(Retai
4、n)。1) 案例表示与组织案例表示是案例推理的基础,案例知识一般是以结构化的方式表示的,是对应领域的结构化描述。为了进行案例的表示, 首先要选择足以描述案例特点的属性或称特征,并决定特征的类型和取值范围。特征的选择方法主要有结合专家领域知识的方法和由系统自动进行特征选择的方法, 主要技术有:归纳法,随机爬山法、并行搜索法和分步定向搜索法等3。案例的表示方法主要有结构表示型和特征- 值对表示型。 2) 案例检索与匹配案例检索根据待解决问题的问题描述在案例库中找到与该问题或情况最相似的案例。常用的案例检索方法有最近相邻法,归纳法, 知识导引法和模板检索法等。这些方法可单独或组合使用。案例的相似性匹
5、配方法有许多种,如决策树,粗糙集, 神经网络, 证据理论,聚类分析等。 3)案例重用 如何由检索出的匹配案例的解决方案得到新案例的解决方案,这个过程叫做案例的重用。在一些简单的系统中, 可以直接将检索到的匹配案例的解决方案复制到新案例,作为新案例的解决方案。这种方法适用于推理过程复杂,但解决方案很简单的问题。例如申请银行贷款。在多数情况下,由于案例库中不存在与新案例完全匹配的存贮案例,所以需要对存贮案例的解决方案进行调整以得到新案例的解决方案。案例修正的方法主要有推导式调整、参数调整等。推导式调整指重新利用产生匹配案例的解决方案的算法, 方法或规则来推导得出新案例的解决方案;参数调整指将存贮案
6、例与当前案例的指定参数进行比较,然后对解进行适当修改的结构调整方法。此外还可以采用重新实例化、案例替换、抽象与再具体化等方法。4)案例修正在案例重用得不到满意的解时,需要使用领域知识对不合格的解决方案进行修正,修正后符合应用领域的要求。进行案例修正的技术包括领域规则、遗传算法、约束满足、函数规划和基于案例的修正等方法。 5)案例库维护案例推理系统的重要特点之一是能够学习。对于新问题,在进行案例修正后, 如果案例修正的结果是正确的,则需要更新案例库。根据检出案例与新案例的相似程度,可能需要在库中新建一个案例 ;或当所检索到的案例与新案例非常接近时,没有必要将此新案例完全存入库中,只需要将调整后案
7、例的一小部分存入库中。随着案例库中积累案例的增加,案例库中包含了更多的知识,系统解决问题的能力也不断增强。CBR 的应用状况在垃圾邮件判定上使用 CBR 技术。由于垃圾邮件内容和结构的不断改变,要求判定规则随时更新,CBR 的增量式学习机制可以很好地满足这种要求。研究者使用 IG(information gain,信息获取算法)评估各个垃圾邮件特征值,从中选出代表的 700 个作为垃圾邮件标志特征。在案例推理时,使用 CRN(case retrieval net,案例提取网)作为案例提取算法。找到最接近的案例,根据其垃圾邮件的评判标志来进行垃圾邮件判断。文章还将 CBR 算法与纯 Bayes
8、文本分类算法进行比较。结果显示 CBR 在垃圾邮件判断条件的不断学习上有较强的优势。另外一个值得关注的 CBR 应用是 CASSIOPEE 故障诊断系统,它是由 AcknoSoft(Paris)在 KATE TOOLS 的基础上为 CFM-Internation 而设计。CFM-Internation 使用 CASSIOPEE 来维护波音 737 飞机上的CFM56-3 引擎动力系统,它的案例库包含 23000 多个案例:关于所有这些动力部件的历史信息。案例的结构简单,约含有 80 个属性。系统使用的一些方法诸如:可以归纳学习的决策树,根据环境询问额外的信息,服务手册部分内容的集成等,还有一个
9、包含 25000 张图片的图片注释部件目录。该系统的应用,减少了一半的故障诊断时间,从而显著减少机场晚点时间。此外,比较成功的应用也有像北京航空航天大学和南京航空航天大学建立的基于 CBR 的飞机故障诊断系统。由于 CBR 是一种方法而非一种技术,这种界定使 CBR 成为一个开放的系统,不断地吸收各种新的技术和方法,更有利于 CBR 本身的发展。从功能上说,CBR 将更多作为一个智能部件和其他方法构成的部件配合使用,以期发挥各自的长处。在具体领域中,一个较有前景的应用是和网络技术的结合。第四次“设计中的人工智能”国际会,与会代表把 CBR 和 WWW 的结合视为一个发展的新方向,另外 CBR 与其他推理方法的结合及 CBR 与其他知识的结合也是一个重要的发展方向。