收藏 分享(赏)

机器理解.docx

上传人:hyngb9260 文档编号:7117923 上传时间:2019-05-06 格式:DOCX 页数:10 大小:28.40KB
下载 相关 举报
机器理解.docx_第1页
第1页 / 共10页
机器理解.docx_第2页
第2页 / 共10页
机器理解.docx_第3页
第3页 / 共10页
机器理解.docx_第4页
第4页 / 共10页
机器理解.docx_第5页
第5页 / 共10页
点击查看更多>>
资源描述

1、报 30 心理字于悦学 1982 年退。本实验模拟一次动物常识课的师生对话。由学生(人)提问,老师( 机器)回答。下面是问答的片断。人:麻雀、燕子和鸵鸟都是鸟吗?机:它们都是鸟。人:麻雀、燕子和鸵鸟都有翅膀吗? 机:它们都有翅膀。人:它们都会飞吗?机:麻雀和燕子都会飞,鸵鸟不会飞。人、既然鸵鸟有翅膀,为什么它不会飞?机:虽然鸵鸟有翅膀,可是它的翅膀是退化的,没有飞的功能,所以它不会飞。人:蝙蝠有翅膀,又会飞,它也是鸟,对吗?机 :不,蝙蝠不是鸟、人:它是什么呢?机:它是兽。人:什么是鸟呢?机:鸟有羽毛,有翅膀,有两条腿,会下蛋,是卵生动物。人:什么是兽呢?机:兽有毛,有四条腿,会生患儿,是胎生

2、动物。人:蝙蝠不是有翅膀吗,为什么它是兽呢?机:蝙蝠是有翅膀,也有四条腿,可是它的腿是特化的,前肢特化成翅膀的骨架,后肢短小,翼膜连接前后肢,构成蝙蝠的翅膀。它还有毛,会生怠儿,是胎生动物,所以它是兽。二、模型本实验采用语义网络模型。这种模型是 M.R.Quillian 于 1968 年首次提出来的。他认为无论是理解别人的话,或是回答别人的话,都不能离开记忆。人们的记忆中有概念以及概念与概念之间的关系。由于许多概念是相互联系的,在人们的记忆中似乎形成了一种网络,叫语义网络。人们依靠搜寻和选择记忆中适当的语义网络路线来理解和回答别人的话。十多年来,这种模型经过多人的修改和发展卿“,在人工智能中形

3、成了抓器理解自然语言的主要途径之一。卜我们的模型所用的概念包括鱼类、爬行动物类、鸟类和兽类(哺乳动物)中的一些动物,以及它们的主要特征和行为。图 1 是部分语义网络示意图。我们仅绘出了麻雀和鸵的各种关系,因而也只是鸟的语义网络的一部分。图中 X 和 Y 叫做“待填项”。X 可以代入任何会飞的鸟的名称,Y 可以代入除鸵鸟外任何不会飞的鸟的名称。三、词、句法和问话句型本文对于词和句型没有严格的依照文法教科书的规定来分类和命名。我们力图做到两点,卜即便于表示本实验的意图和符合汉语的语言习惯。图 1 语义网络示意图语句都是用基本陈述句的词序为基础的,即:(主词(一)词名称类别词(即动物的名称和类别):

4、鲤鱼、黄鱼、鳝鱼、乌龟、麻雀、燕子、鸵鸟、狗、马、鲸鱼、蝙蝠、鱼、爬行动物、鸟、兽、卵生动物、胎生动物、动物。器官词:鳞、鳍、鳃、须、肺、甲、羽毛、毛、翅膀、腿、蹄、爪。功能词:游水、爬、飞、跑、呼吸、产卵、下蛋、生怠儿。代词:它、它们。关系词:有、会、用、是。连接词滋和、既然、虽然、可是、因为、所以。副词:还、又、也。疑问词:吗、对吗、对不对、是吗、是不是、呢。数量词:大多数、多半、少数、两对、两条、四条。助词:的。注解词: 长的、短的、笨拙的、灵活的、健壮的、退化的、特化的。注解:对于注解词必要时可以进一步注解。如对于蝙蝠的腿的注解词“特化的”的注解是:前肢特化成翅膀的骨架、后肢短小,翼膜

5、连接前后肢构成蝙蝠的翅膀。卜一(二)句法本实验以词序分析进行句法分析;实验中的(关系词宾词1.主词:主词可以是单数、复数或待填主词。主词:=以上的例子中,(内的名称类别词和器官词都用作复数主词。待填主词:由“凡”构成的短语中,最后的名称类别词可以省略,成为待填主词。在我们的实验中多半可以用“动物”来填补。例如。凡有鳍的都会游水,凡会飞的都有翅膀。2.宾词:宾词也可以是单数、复数或待填宾词。宾词所用的词由关系词来决定。(1)在关系词 “有”后面是器宫词,器官词之前可加数量词和注解词。例如:鸵鸟有腿,鸵鸟有两条腿,鸵鸟有两条长的、健壮、灵活的腿。最后这句话的词序是:主词在关系词之前,宾词在关系词之

6、后。如“鸵鸟有翅膀”1.一般疑问句:1. 基本陈述句除“呢”以外的其他疑问词,如:鸵鸟有翅膀吗?2.(为什么 ,如:为什么鸵鸟不会飞?鸵鸟为什么不会飞? 鸵鸟不会飞为什么?2.复数关系词宾词户!同 、陈述句是对、虽然这一基本陈述句的词序加上疑问词就成为疑问句。在我们的问话句型中可以看出,有些疑问词只能放在一句话的末尾,如“吗”、“呢艳、“对吗”等;有些疑问词可以放在一句话的句首、句中或句尾,如“为什么”、“是不是”等。无论疑问词放在什么位置,主词、关系词、宾词的前后关系仍保持不变,问话的含义也不变。我们的机器对于十几种问话句型的理解没有发生困难。机器组织答话用陈述句。我们的机器可以依照问话的要

7、求,在主词、关系词、宾词之前,正确地加上形容词、数量词、副词、些短语或注解词句,但基本陈述句的词序不变,答话的主旨也不变。汉语的介词如“被”、“把”、动词“是”或助词“的”与动词“是”联用,可以改变基本陈述句的词序,句子的主旨也不变,仅语气有所改变。例如,“宝宝吃了苹果”这一基本陈述句的词序可以有如下改变:苹果被宝宝吃了; 宝宝把苹果吃了; 吃了苹果的是宝宝。以上这几句话虽然改变了原来的词序,可是根据新添加的介词,助词“的”和动词“是”,我们仍能清楚地指出谁是“施动者”,什么是“受动者”。这是由于,添加了新词,形成了新的词序。正是新的词序使我们能够正确理解一句话的含义。上述这类句型,我们虽然还

8、没有在机器上试,但估计机器对它们的理解也不会迪到什么困难。在汉语中,介词“被”可以把宾词调到句子的首位,介词“把”可以把宾词调动到句子的中间,我们根据介词的词义和词序就可以理解一句话的含义。可是,在日常谈话中,人们往往又把介词省略掉。例如,对于“我吃过早饭了”这句话,人们往往说成:早饭我吃过了;我早饭吃过了。如果添上介词,人们反而觉得不顺耳:早饭被我吃过了; 我把早饭吃过了。省略掉介词,把两个名词留在句首,对于这类句子,仅凭前面所说的那样词序分析就有困难了。可是,人对这类句子的理解并不感到困难。这是因为人们知道早饭不,会吃东西,而是被吃的东西,只有人,或者扩大到动物园的高等动物才会吃早饭。可是

9、机器怎样处理这一问题?词序分析遇到的这种困难,也是格分析的困难。要解决这种困难,恐怕只有一条共同的途径,就是把人理解这类句子的依据和方法,化为规则,让机器依照这些规则来判断谁是施动者,谁是受动者,而不是由人替机器做这样的判断。把人理解上述句子的依据和方法化为规则,就涉及名词和动词的分类问题。“我”是人,是高等动物,动物是有主动行动的,因此动词总是同动物的名词联在一起:自然能源也有动词直接联系,如阳光照耀、微风吹动等等;人造的有动力的机器也有动词直接联系,如 6104 班机在飞翔,汽车奔驰,计算机运转等。虽然上述各类名词都可以直接连接动词,但是“吃”这个动词只可以同动物或人直接联系,而“说”、“

10、读”、“画”、“写”、“思考”、“欣赏”这英动词只能同人直接联系。非动物、非能源、非机械的无生命物质,如果有动词直接连在后面,也只表明这些物质李家治等:机器理解汉语实验 1.个单数主词,并对每一单数主词填补适当的关系词、宾词和疑问词。例如:输入问句为:“麻雀、燕子和鸵鸟都是鸟吗?”分解为:麻雀是鸟吗?燕子是鸟吗?鸵鸟是鸟吗?再如,输入问句为: “凡有翅膀的都是鸟吗 ?”这句话的主词待填补,填补后的问句是:“凡有翅膀的动物都是鸟吗? ”机器首先要查明哪些是有翅膀的动物,然后再进行分解和填补,得出四句问话:麻雀是鸟吗? 燕子是鸟吗?鸵鸟是鸟吗?蝙蝠是鸟吗?机器依照分解和填补规则来理解输入问句、查问

11、知识库和寻找答话。2. 合并和删除规则。根据查问知识库的结果组织答话时,要把分散答话合并为一句,并删除重复的词是,合并后的答话是:.、主词 1、主词 2、和主词功复数关系词(宾词。最后一个主词之前加连接词“和”。例如通过分解填补、查问知识库得到的答案是:麻雀是鸟、燕子是鸟、鸵鸟是鸟。合并后气出答话:麻雀、燕子和鸵鸟都是鸟。3.代替规则。单数主词与代词“它”、复数主词与代词“它们”可以相互代替。在分析语句和查问知识库时,以单数或复数主词代替“它”或“它们”;在组织答话时相反。代替规则有三条:(1)在同一句话中,重复出现的主词以代词代替。(2)答话的主词如果与问话的主词相同,就用代词代替。(3)在

12、连续谈话的情况下,如果主词不变,除第一句话以外,以后每句话,无论是问话或是答话,都可用代词代替。4.转换规则。关系词“有”的句子和关系词“是”的句子有时是需要相互转换的,而且是可以转换的。转换规则是:.数量词、器官词。基本陈述句加上疑问词就成为疑问句。在句首、句中或句尾加上适当的疑问词,只要主词、宾词的前后顺序不变,问话的含义就不变。同样,在主词、关系词或宾词之前加上形容词、副词、或一些注解性的词、短语或句,可以组成比较复杂的陈述句。只要基本词序不变,陈述句的全旨也保持不变。我们的机器对于以这一基水词序为基础建造的十几种问话句型,并没有发生理解困难,并且能够以这一基本词序为基础,组织比较复杂的

13、陈述句来回答问话。我们注意到,汉语的一些词类,特别是介词,可以改变上述词序而一句话的含义不变,甚至因添加介词而被改变了的词序,在日常谈话中又往往把介词取消而一句话的含义仍保持不变。机器怎样处理这些情况,是我们今后需要研究的课题。正确理解问话和组织答话,不仅需要句法分析(在我们的实验中即词序分析),而且需要推理。我们的程序使机器具有少量推理能力,即归纳概括能力,依靠部分信息进行推理和依靠间接信息进行推理的能力。机器依靠这些能力,可以回答一些仅凭记忆系统中的知识不能回答的问话。但是,在一般常识性的谈话中,究竟需要一些什么推理能力,也是今后需要深入探索的问题。本实验在设计过程中,曾得到社会科学院语言

14、研究所范继淹同志的许多好的建议,并使我们得以参考“现代汉语八百词”(当时尚未出版)的部分底稿,对我们的实验设计很有帮助,特此鸣谢。J 心理学报 1982 年是受动者而非施动者。例如:窗子破了,玻璃碎了。窗子不会自动破,玻璃不会自动碎,一定是窗子被打破了,玻璃被打碎了。窗子和玻璃都是受动者。至于谁是施动者,就要看上下文。可能是大风、地震、玩皮孩子投的石子,或是擦窗子的粗心笨拙的主人。对名词和动词进行适当的分类,制定一些规则,说明在什么情况下哪类名词应该同哪类动词相联。再加上其他词类、词序的应用规则,可以使机器对困难的句子进行正确分析和组织答话。但是怎样对名词和动词进行分类,是一个重大课题,是我们

15、今后的艰巨任务。3.推理的应用。我们的模型使机器具有归纳概括能力,依靠部分信息进行推理和依靠间接信息进行推理的能力。这也是与国外的一些作者不同的。Qtlillia1,Lindsay 和 N。man 等人的模型可以由类特征来推论个体特征,即由共性求个性,这种做法是有缺点的,它不能推求出个体间的差别。此外,如 Conin”和 Quillian1969 年的模型,把”会飞”作为“鸟”的一种特征,显然是忽略了还有很多不会飞的鸟。这样会导致推理错误。目前,机器理解自然语言的研究,无论是语义网络理论或其他理论。都是在很狭窄的知识范围内进行实验,推理的应用是很有限的。而且不同作者有不同的目的,一些实验虽然涉

16、及到推理,但并不一定能解决推理的问题。对于理解自然语言需要一些什么推理,以及怎样实现这些推理,似乎还处于多途径的探索阶段。例如,R.C.Schallk 等人的 MARGIE 程序(”,对机器输入一句话,机器能够输出几句有关而且相当合理的话,例如,输入:约翰给了玛丽一些阿司匹灵,输出:(l)玛丽病了,(2)玛丽需要阿司匹灵,(3)约翰相信玛丽需要阿司匹灵,(4)玛丽想要好受一点。气他们的做法是对一些原始行动和受行动支配的物体做了一些注解,指出与这些行动和物体有关而且可能产生的含义。.如“给”的原始行动是把物体从甲转移到乙。如果甲、乙都是人,则含义是乙需要这种物体,或甲相信乙需要这种物体。这种物体

17、如果是好吃的东西,则乙可能很高兴;如果是药,则乙可能是病了,药会减轻他的痛苦。等等。再如,E.Charlliak 利用一些“小鬼”(demon)解决推理问题佃。例如,给机器一句话,以类似的中国话来说:“小胖摇晃了几下璞满,拿了两个五分硬币跑到对门商店去了。”然后问:小胖哪儿来的钱?他跑到对门商店去干什么?人回答这两个问题并不困难。因为人根据生活经验知道璞满是儿童们存钱(硬币)用的。摇晃几下会蹦出钱来。对门商店卖什么东西?看故事的全文就可知道,不过可以推知是个食品店。小胖跑到那里去可能是要买冰棍、糖葫芦、果丹皮或其他好吃的东西。Cllarn 讯 k 把这些知识分别交给一些 “小鬼”。这些小鬼各守岗位,一遇到同自己的知识有关的问话就跳出来答话。我们实验中的推理也是局限在狭窄的知识范围。可是我们着眼于使这些推理能应用于理解一般自然语言,即常识性的,不需要专业知识的谈话。可是,这种一般性的谈话究竟需要一些什么样的推理,还不清楚。我们只能把心理学和形式逻辑中所讲的归纳推理、百

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报