收藏 分享(赏)

AI8章.ppt

上传人:Facebook 文档编号:8895622 上传时间:2019-07-16 格式:PPT 页数:17 大小:95KB
下载 相关 举报
AI8章.ppt_第1页
第1页 / 共17页
AI8章.ppt_第2页
第2页 / 共17页
AI8章.ppt_第3页
第3页 / 共17页
AI8章.ppt_第4页
第4页 / 共17页
AI8章.ppt_第5页
第5页 / 共17页
点击查看更多>>
资源描述

1、1,第8章 自然语言理解,8.1 语言及其理解的基本概念 8.2 词法分析 8.3 语法分析 8.4 语义分析,自然语言是指人类日常交流所使用的语言。自然语言理解主要研究如何使计算机能够理解和生成自然语言。自然语言理解既是人工智能研究较早的一个领域,同时也是现代计算机的一个必备特征。,2,8.1 语言及其理解的基本概念,自然语言是音义结合的词汇和语法体系。词汇是语言的基本单位,它在语法的支配下可构成有意义和可理解的句子,句子再按一定的形式构成篇章等。其结构如图8.1所示:,语言,词汇,语法,词,熟语,词法,词素,构形法,构词法,词组构造法,造句法,词汇是语言的基本单位。熟语是指一些词的固定组合

2、,如汉语中的成语。词又由词素构成,词素是构成词的最小有意义的单位。如“学生”是由“学”和“生”这两个词素构成的。 语法是语言的组织规律。词法是用词素或熟语构成词的规则,可分为构形法和构词法。构形法是指单数复数等。造句法是用词和词组构造句子的规则。,语言,词汇,语法,词,熟语,词法,词素,句法,构形法,构词法,词组构造法,语言,词汇,语法,词,熟语,词法,词素,3,其主要任务是要找出词汇的各个词素,从中获得语言学信息,并确定单词的词义。以英语为例,其词法分析的基本算法如下:repeatlook for word in dictionaryif not foundthen modify the w

3、orduntil word is found or no further modification possible 其中,word是一个变量,其初始值就是当前词。例8.1 用上述算法分析catches。解:其分析过程如下:catches 词典中查不到catche 修改1:去掉scatch 修改2:去掉e可以看出,在修改2时就查到了catch。当然,这只是一个很简单的例子,完整的词法分析还应该包括复合词的切分等。,8.2 词法分析,4,8.3 句法分析,句法分析是对句子和短语的结构进行分析,其最大单位是一个句子。分析的目的是要找出词、短语等的相互关系,以及他们在句子中的作用等,并用一种层次结构

4、加以表达。这种层次结构可以是句子的成分关系、,也可以是语法功能关系。,8.3.1 句法规则的表示方法 8.3.2 自顶向下与自底向上分析,5,8.3.1 句法规则的表示方法 句子结构的表示,一个句子是由各种不同的句子成分组成的。这些成分可以是单词、词组或从句。句子成分还可以按其作用分为主语、谓语、宾语、宾语补语、定语、状语、表语等。这种关系可用一棵树来表示,如对句子:He wrote a book 可用图8.2所示的树形结构来表示一个句子又是由若干个词类构成的,如名词、动词、代词、形容词等。若从句子的词类来考虑,一个句子也可用一棵树来表示,这种树称为句子的分析树,如图8.3所示。,6,上下文无

5、关文法(Context-free Grammars)是乔姆斯基提出的一种对自然语言语法知识进行形式化描述的方法。在这种文法中,语法知识是用重写规则表示的。作为例子,下面给出了一个英语的很小的子集(图8.4)。语句 句子 终标符句子 名词短语 动词短语动词短语 动词 名词短语名词短语 冠词 名词名词短语 专用名词冠词 the名词 professor动词 wrote名词 book动词 trains专用名词 Jack终标符 . . 这就是一个英语子集的上下文无关文法在该文法中,“语句”是一个特殊的非终极符,称为起始符。,8.3.1 句法规则的表示方法 上下文无关文法(1/2),7,8.3.1 句法规

6、则的表示方法 上下文无关文法(2/2),例8.2 利用上述上下文无关文法,给出如下语句的分析树。The professor trains Jack.,语句,句子,终标符,动词短语,名词短语,The,professor,.,trains,冠词,名词,动词,专用名词,名词短语,Jack,解:如图8.5,8,8.3.1 句法规则的表示方法 变换文法(1/2),上下文无关文法反映的仅是一个句子本身的层次结构和生成过程,而自然语言是上下文有关的。为此,乔姆斯基又提出了变换文法(Transformational Grammar)。该文法认为,句子的结构有深层和表层两个层次。例如:She read me a

7、 story 和 She read a story to me 的表层结构不一样,但它们的深层结构则是一样的。再如,主动句和被动句也只是表层结构不同,其深层结构则是相同的。在变换文法中,句子深层结构和表层结构之间的变换是通过变换规则实现的,如图8.6给出了一条把主动句变换为被动句的变换规则。,句子,介词短语1,句子,名词短语1,动词短语,动词,名词短语2,名词短语2,动词被动语态,9,8.3.1 句法规则的表示方法 变换文法(2/2),助动词,介词,动词的过去分词,名词短语1,句子,介词短语,句子,名词短语1,动词短语,动词,名词短语2,名词短语2,动词被动语态,冠词,名词,专用名词,上下文无

8、 关文法,变换规则,冠词,名词,The,professor,Jack,trains,Jack,专用名词,is,trained,by,the,professor,professor,例8.3 利用变换文法,将前述主动句变为被动句。解:其变换过程是:先从非终极符“句子”开始产生一个主动句:The professor trains Jack 然后再应用图8.6所示的变换规则把它变为被动句(图8.6) :Jack is trained by the professor,动词,冠词,名词,The,professor,名词短语2,专用名词,trains,动词,冠词,名词,The,professor,Jac

9、k,名词短语2,专用名词,trains,动词,冠词,名词,The,professor,10,8.3.2 自顶向下与自底向上分析 自顶向下分析法,自顶向下分析,是指从起始符开始应用文法规则,一层一层地向下产生分析树的各个分支,直至生成与输入语句相匹配的完整的句子结构为止。例如,图8-4所示的上下文无关文法,采用自顶向下分析方法对语句:The professor trains Jack . 进行分析的过程是:首先从起始符“语句”开始,正向运用规则:语句 句子 终标符 把分析树的根节点“语句”替换为它的两个子节点“句子”和“终标符”。然后再对新生成的节点“句子”使用规则:句子 名词短语 动词短语 将

10、其替换为两个子节点“名词短语”与“动词短语”。对于“名词短语”,有两条规则可用,若按规则的排列顺序,则选用名词短语 冠词 名词 将“名词短语”被替换为“冠词”和“名词”,生成两个新节点。对“冠词”使用规则:冠词 The 对名词使用规则:名词 professor 以此进行,得到如图8.8所示的自顶向下的分析树(略)。,11,8.3.2 自顶向下与自底向上分析 自底向上分析法,自底向上分析,是以输入语句的单词为基础,首先按重写规则的箭头指向,反方向使用那些最具体的重写规则,把单词归并成较大的结构成分,如短语等,然后对这些成分继续逆向使用规则,直到分析树的根节点为止。仍以语句The professo

11、r trains Jack 为例,逆向使用图8.4中的那些具体规则后,可得到图8.9所示的 部分分析树。继续逆向使用规则,一步步归并,直到根节点“语句”为止,最后即可生成如图8.5所示的完整的分析树。自顶向下分析方法与自底向上分析方法虽然思路清晰,但分析效率不高。为了提高分析效率,可采用自顶向下与自底向上相结合的分析方法。,Jack,名词短语,专用名词,trains,动词,冠词,名词,The,professor,终标符,.,12,8.4 句义分析,语义分析就是要识别一句话所表达的实际意义。即弄清楚“干什么了”,“谁干的”,“这个行为的原因和结果是什么”以及“这个行为发生的时间、地点及其所用的工

12、具或方法”等。原因是语法分析,仅是在句法范围内根据词性信息来分析自然语言中句子的文法结构的。由于它没有考虑句子本身的含义,也就不能排除像The paper received the professor 这种在语法结构上正确,但实际意义上错误的句子。目前,用于语义分析的技术比较多,本节仅简单介绍语义文法和格文法。,8.4.1 语义文法8.4.2 格文法,13,8.4.1 语义文法,语义文法是在上下文无关文法的基础上,将“名词短语”、“动词短语”、“名词”等这些不含有语义信息的纯语法类别,用所讨论领域的专门信息,像“山”、“水”、“动物”、等这些具有很强语义约束的语义类别来代替。利用语义文法进行语

13、义分析,就可以排除像“论文收到教授”这类无意义的句子。例如,下面是一个关于舰船信息的语义文法的例子:S PRESENT the ATTRIBUTE of SHIPPRESENT what is | can you tell meATTRIBUTE length | classSHIP the SHIPNAME | CLASSNAME class shipSHIPNAME Huanghe | ChangjiangCLASSNAME carrier | submarine在上述重写规则中,用大写英文字母的单词表示非终极符,小写英文字母表示终极符,竖线表示“或”的意思。利用上述语义文法进行语义分析,

14、可以从语义上识别以下的输入:what is the length of the Huanghe?Can you tell me the class of the Changjiang?,14,8.4.2 格文法 格和格框架(1/3),格文法是以句子的中心动词为主导,并用格来表示其它成分与此中心动词之间的语义关系的一种描述方法。“格”这个词来源于传统语法,但它与传统语法中的格有着本质不同。在传统语法中,格仅表示一个词或短语再句子中的功能,如主格、宾格、等,反映的也只是词尾的变化规则,故称为表层格。在格文法中,格表示的是语义方面的关系,反映的是句子中所包含的思想、观念等,故称为深层格。“格”是一个

15、一般的概念,相对于中心动词的不同语义关系,格可以分为许多种。例如,在句子John gave the book to Sally 中,相对于中心动词gave,John是这个行为的发出者,称为动作格;the book是行为作用的对象,称为受动格;Sally是行为作用对象所到达的目标,称为目标格。,15,8.4.2 格文法 格和格框架(2/3),一套正确的深层格究竟应包括多少个格,以及这些格的明确含义是什么,目前尚无定论。 下面给出一个描述行为的句子,它所涉及的深层格主要有:Agent(施事), 动作主格,指行为的施动者;Object(受事),受动者格,指行为作用的对象;Co-Agent(共施事),

16、帮助者格,指行为施动者的合作者;Instrument(工具),工具格,指施事者或共施事者实现行为中所使用的对象;Time(时间), 时间格,指行为发生的时间;Source(来源),来源格,指行为作用对象移出的位置;Goal(目标), 目标格,指行为作用对象到达的位置;Trajectory(轨迹),轨迹格,指从来源到目标所经过的路径。,16,格框架是一种用来描述句子深层格的框架。在格文法中,每个句子都联系着一个格框架。其中,框架名可以是相应句子的中心动词,框架的槽可分别对应于相应句子的各个深层格,每个槽的槽值为该深层格在相应句子中所代表的语义成分。例如,前述句子分析结束时所得到的实际格框架为:GAVEAgent: JohnObject: the bookSource: JohnGoal: Sally,8.4.2 格文法 格和格框架(3/3),17,作 业 题,8.2 对下列每个语句给出文法分析树: (1) John wanted to go the movie with Sally.(2) John wanted to go to the movie with Robert Redford.(3) I heard the story listening to the radio.(4) I heard the kids listening to the radio.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报