1、基于概率悖论的人工智能思考肖腾 复旦大学简介实现计算机智能化一直是人类梦寐以求的愿望。至今,科学家们在人工智能领域已经做了许多的工作,诸如下国际象棋、数学定理证明、诗歌写作和疾病诊断等等。所有的研究都可以归为 4 个方面:类人行为、类人思考、理性地行为、理性地思考。类人行为的研究需要计算机具备大量的基础能力,而如今尚为能实现;类人思考则需要找到思维的本质过程,而其过程更是众说纷纭;理性地行为、理性地思考的研究则更容易实现,因为只需要符合逻辑公理、概率公理,给出相关的模型实现即可,即使不满足人类真正的思考模型,但是至少它有理可循。1961 年艾伦.纽厄尔(Allen Newell)和赫伯特.西蒙
2、(Herbert Simon)设计的“通用问题求解器“(GPS),是遵照亚里士多德在尼各马科伦理学中提出的算法实现的第一个可以像人一样思考的程序,它将关于思维的足够精确的理论通过计算机程序表达出来,该程序可以证明罗素和怀特海德著述的数学原理中的大多数定理。至今,花样百变的智能推理程序层出不穷,但是都需要一个完整的知识表示数据库。然而创造这样的数据库并不轻松,完整这个概念就已经相当难实现,而建立的知识数据库又要确保在程序自动推理的过程中不会产生悖论。悖论是指那些会导致逻辑矛盾的命题,如果承认这个命题成立,就可以推出他的否命题成立;反正。如果承认这个命题的否命题成立,又可以推出这个命题成立。显然,
3、计算机程序无法接受悖论在逻辑命题库中存在,本文从一个有趣的概率悖论问题出发,深入浅出地讨论人工智能研究在实现本体化、符号化、命题化的知识表示数据库时应该注意的问题。正文1、概率悖论贝特朗(Bertrand)悖论是概率论中的一个著名悖论,其内容是:“在圆内任作一弦,求其长超过圆内接正三角形边长的概率。 ”此问题有 3 种不同的答案。1)作一条铅直的直径,再作垂直于此直径的弦。弦长可以由它与直径的唯一交点确定。当弦交直径于 1/4 点与 3/4 点之间,其长才大于内接正三角形边长(如图 2) 。设交点落在直径上的某一点是等可能的,则所求概率为 1/22)固定弦一段到正三角形的一个顶点,弦长可以由弦
4、的另一个端点的位置唯一确定。当弦的另一端点落在圆弧上 AB 之间时,其长才合乎要求(如图 3) 。设弦的另一端落在圆周上某一点是等可能的,则所求概率为 1/33)弦可以由中点唯一确定。当弦的中点落在半径为大圆半径一半的同心圆内时,其长才合乎要求(如图 4) 。设中点位于圆内某一点是等可能的,则所求概率是 1/4二、错误产生的原因至今,出现大量文献证明其中一个解法是正确的,也有的文献提出存在无穷多种解法的说法。那么在众多的困惑中,主要误区在哪呢?很多人提出疑问是:“既然是同一个问题,答案就应该只有一个,不可能 3 个都正确。 ”其实关键在于:以不同的方式确定“弦的取法” ,所对应的随机实验是不同
5、的,因此与之相关的基本事件也是不同的。换句话说,不同的取法对应不同的随机变量。由此也就产生了完全不同的“概率计算问题” 。严格说来,原来的问题的提法是不完整的。仔细体会那些困惑的想法,可以发现,它们混淆了两个只在表面形式上相同,但实质却不同的问题,受古典概型认识的影响,他们将“随机地在单位圆盘上取一根弦”这样的要求,与“随机地在袋子里取一个球”这种现实的要求看成一样的。错误地认为要求明确,取法可唯一确定。于是认为可以像计算取球的概率一样计算出“取长度超过 的弦”的概率。为3此,算法希望确定这些弦在弦全体中绝对合理的比例。可一旦陷于这样一种认识,恰恰是得不到任何结果的。贝特朗问题引起的困惑,首先
6、源于认识论误区。不恰当地将人类思维构建的对象看成外在的具有物理存在性的对象,从而将该问题中涉及的对象绝对化。因此在人工智能研究中,创建知识表示数据库时,就应该严格定义好抽象对象的本体概念,并且严密表示对象之间的联系,尤其是那些由人类主观思维产生的抽象对象,从而避免知识表示数据库中悖论的产生。三、知识表示数据库知识是指信息接受者通过对信息的提炼和推理而获得的正确结论;是人对自然世界、人类社会以及思维方式与运动规律的认识与掌握,是人的大脑通过思维重新组合和系统化的信息集合。而知识的表示就是对知识的一种描述,或者说对知识的一组约定,一种计算机可以接受的用于描述知识的数据结构。某种意义上讲,表示可视为
7、数据结构及其处理机制的综合。因此在专家系统中知识表示是能够完成对专家的知识进行计算机处理的一系列技术手段。常见的有产生式规则、语义网、框架法等。一阶谓词逻辑即 FOL(First-order Predicate Logic)是一种比较常见的知识表示方法。在谓词逻辑中,命题是用谓词表示的。谓词的一般形式是:P(x 1,x2,.,xn),其中 P 是谓词名称,x 1,x2,.,xn是个体。因此,用谓词逻辑来表示某类知识时就可以利用上述形式,比如 Teacher(Hui Wei)就表示了“危辉是老师”这样一个事实型的知识。在 P(x1,x2,.,xn)中,如果 xi(i=1,2,.,n)都是单个的个
8、体常量,则它就可以称为一阶谓词。谓词逻辑适合表示:1、事物的状态、属性、概念等事实性知识。2、事物间确定的因果关系,即规则。对于事实可以用如下逻辑符号表示,即“¬”表示“非” 、 “”表示“与” 、“v”表示“或” ;对于规则可以用蕴含“”表示,例如如果 x,则 y 可以表示为“xy” 。用谓词表示知识时,还要遵循首先定义谓词,其次用连接符号连接相应谓词的步骤。语义网络法则是知识的一种图形表示,它由节点和边(也称有向弧)组成。节点表示事物、对象、概念、行为、性质、状态等,有向边表示节点间的某种联系或关系。语义网络是一种表达能力很强而且可以灵活运用的知识表示方法,在语义网络中,程序可以从感
9、兴趣的任何节点出发,沿着弧到达相关联的节点,类似于人类的联系记忆。但是,鉴于每个节点连接多条弧,从开始节点出发后,如果没有很好的组织和强有力的搜索规则指引,就会很容易陷入无穷支路而无解。框架法则给知识表示提供了一种结构,其中新的数据将用从过去的经验中获取的概念来解释。知识的这种组织化,使人们面临新的情况时能从旧的经验中进行预测,引起对有关事物的注意、回忆和推理。它的层次结构非常鲜明,对减少信息冗余有重要意义。RDF 语义模型则是综合语义网络法和框架法而产生,由资源(Resource),属性(Property)和声明(Statement)所构成的模型。通过命名属性和值,这个模型可以描述资源之间的
10、内在关系。其中资源指所有被 RDF 描述和规范的信息和文档,都具有属性。而属性用于描述该资源的概念,特征,特性或关系。声明由三个部分构成:主体(Subject,一个特定的资源),谓词(Predicate,一个命名的属性)和客体(Object,在该资源中该属性的取值)。4、本例中的知识表示解法 1:解法 2:解法 3:结构上看上面 3 种框架系统已比较接近我们的思维,但是这远远不够。我们还得教会如何测量线段的长度,甚至测量某个点集线段的长度。计算机也许还会纠结点集合中点的个数。5、结论与思考塞尔在批评已有的人工智能研究时曾指出,已有的智能机器“所做的形式符号处理没有任何意向性:它们是全然无意义的
11、;它们甚至不是符号处理,因为这些符号什么也不代表。用语言学的行话来说,它们只有句话,而没有语义。 ”意向性是指智能的本质特征。作为现代计算机所表现出的所谓智能,尽管在许多方面已远胜于人类智能,但它只能按形式规则进行形式转换,而不能像人类智能那样主动,有意识地关联于外部事态,即没有涉及到意义,或者没有语义性。所谓语义性,就是指心理状态与之发生关系的符合有意义、指称和真值条件。换言之,当心中出现某意像或符号或概念,智能就能把它和有关事态关联起来。因此,人工智能不会像人的智能一样发展。对于同一个问题,使用不同的智能,会有不同的答案,而计算机所能考虑的只会有一种。所以我们不能期待人工智能能取代我们的智能,我们能做的只是去选择优秀的“人工智能”去帮助我们处理实际问题。人工智能的最大魅力并不在于他是否具有如人一样的智能,而是在于它是否能成为我们最需要的那种工具。人类的每一次需要,都会推动一次重大科学进步。人类的需要不会停止,所以人工智能的发展也不会停止。 “人工智能”已经在改变着自己的意义,它一定会越走越好。参考资料贝特朗奇论与随机试验的界定问题,谢玲、张晓庆贝特朗悖论与概率论的公理化,冯变英、王平知识网格中基于 RDF 的知识表示技术和应用,李玲等人工智能的基础哲学问题探究,赵泽林关于人工智能的哲学思考,龚园人工智能的哲学反思,周雅凡