收藏 分享(赏)

毕业论文论文中国象棋人机对弈.docx

上传人:dzzj200808 文档编号:2783874 上传时间:2018-09-27 格式:DOCX 页数:34 大小:1.04MB
下载 相关 举报
毕业论文论文中国象棋人机对弈.docx_第1页
第1页 / 共34页
毕业论文论文中国象棋人机对弈.docx_第2页
第2页 / 共34页
毕业论文论文中国象棋人机对弈.docx_第3页
第3页 / 共34页
毕业论文论文中国象棋人机对弈.docx_第4页
第4页 / 共34页
毕业论文论文中国象棋人机对弈.docx_第5页
第5页 / 共34页
点击查看更多>>
资源描述

1、四川大学本科毕业论文 中国象棋人机对弈本科生毕业论文(设计)题 目 中国象棋人机对弈 学 院 专 业 学生姓名 学 号 年级 指导教师 教务处制表四川大学本科毕业论文 中国象棋人机对弈中国象棋人机对弈摘要 文章主要是研究中国象棋的人机对弈,包括象棋的界面和引擎部分。界面主要是方便人与电脑进行交互的可视化界面。界面包括棋盘区、菜单项和功能按钮区。主要实现棋子的移动、悔棋、记录棋谱、难度选择等选项功能。引擎部分主要包括,棋子棋盘的表示即数据结构,走法的生成,局面优劣的评估即评估函数,搜索算法及其优化和改进。界面的设计是采用 MFC 的框架来实现界面部分,MFC 是微软公司提供的一个类库,以 C+类

2、的形式封装了 Windows 的API,并且包含一个应用程序框架,以减少应用程序开发人员的工作量,其中包含大量的 Windows 句柄封装类和很多 Windows 控件和组件的 封装类。象棋对弈其 实是一种博 弈。双人对弈,轮流走步;信息完备,双方得到的信息都是一 样的;零和,即对一方有 利的棋,对另一方肯 定是不利的 ,不存在对双 方均有利或 无利的棋。如果轮到自 己落子的时 候,一定会选择 使局面分数 最高的着法 ,如果轮到对 手落子,他一定会选 择使你得分 最低的局面 。这就是我们 经常听到的 极大极小值搜索,而对局面进 行估分的函 数就是评估 函数。主题词 博弈树;极大极小值搜索;al

3、pha-beta 剪枝;评估函数Chinese chess computer game四川大学本科毕业论文 中国象棋人机对弈Network EngineeringAbstract This paper mainly explores the Chinese chess computer game,it includes user interface and game engine.UI is a visual interface which helps human to communicate with computer.UI includes the board area,the menu

4、and commonly used buttons.Its functions include pieces move,undoing,saving game record,choosing level and so on.The game engine mainly includes the form of pieces and board,that is data structure,move generaion,evaluation function,search algorithm.The UI is implemented through MFC.MFC is a class lib

5、rary provided by Microsoft.It encapsulates a Windows API in the form of c+ class,and includes a application framework,and reduces the workload of programmers.Chinese chess is a zero-sum game.Two people play,take turns to move piece;Information is the same to the both sides.There is no favorable or b

6、ad situation for both parties.If it is your turn,you will choose the favorable situation,in the same way,the opponent will choose the bad situation for you.This thought is called minimax algorithm,the function for estimating is called evaluation function.Key Words Game Tree; Minimax Search; Alpha-Be

7、ta Pruning; Evaluation Function目录四川大学本科毕业论文 中国象棋人机对弈四川大学本科毕业论文 中国象棋人机对弈四川大学本科毕业论文 中国象棋人机对弈11.综述1.1选题的意义中国象棋在中国拥有悠久的历史,这个游戏需要两个人进行对弈。由于中国象棋用具简单、趣味性强,成为流行极为广泛、老少皆宜的棋艺活动。中国象棋是一种古老的文化,它集文化、科学、艺术、竞技于一体,有利于开发人的智慧,锻炼人的思维,培养人的毅力,增强人的竞争意识。随着电脑技术及互联网的发展,人们下棋没有了地域限制,人们甚至可以跟电脑对战,于是就产生了人是否能够战胜电脑的疑问。从很早开始,人们就开始进行

8、棋类博弈的游戏了,而在人工智能领域,机器博弈始终是一个重要的组成部 分。人们对人工 智能的窥探 是从棋类博 弈游戏开始 的,人们在博弈 游戏中,对战双方通 过对游戏规 则的掌握、丰富的经验 和知识,使游戏的局 面有利于自 己,这就是人类 的思维过程 ,于是棋类博 弈就成了人 工智能的实 验品。对机器博弈 的研究取得 的成果不仅 仅只用在棋 类游戏上,而且也已广 泛应用于军 事、政治、经济等多个 领域,给人类带来 了极大的社 会效益。1.2国内外研 究现状概述机器棋类博弈的研究最早是从国际象棋开始的,1950 年美国著名数学家香农积几十年的研究,找到了编制国际象棋程序的原则方法。他提出以数的函数

9、评价局面的优劣。函数的主题是通常一般实力的棋手都能考虑到的一些因素,诸如:棋子实力重 叠兵孤立兵、落后兵的弱点以及车的通路和其他子力的活动性等等。香农还提出用简化的估计方法剔除次要的变化。他是计算机国际象棋理论的奠基人。在数学家和计算机专家的共同努力下,20 世纪 50 年代末终于试制出世界上第 1 台公开与棋手对弈的电子计算机。1974 年,在瑞典的斯德哥尔摩举行了计算机国际象棋的第 1 届世界冠军赛,8 个国家的13 种弈棋程序按积分循环制进行比赛,结果苏联的“卡伊赛”程序获得冠军。最出名的是1997 年,卡内基梅隆大学的“深蓝”小组研究开发出“更深的蓝” ,挑战人类大师。最后在全世界目光

10、的关注下, “超级深蓝”击败了棋王卡斯帕罗夫。成为人工智能历史上里程碑式的事件,也标志着机器博弈的重大成功。和国际象棋相比,中国象棋机器博弈起步比较晚,八十年代才开始。1981 年张耀腾发表的人造智慧在电脑象棋上的应用 ,是第一篇研究中国象棋机器博弈的文章。他在他的毕业论文中以残局做实验,提出审局函数为静态子力值,棋子位置值,棋子灵活度四川大学本科毕业论文 中国象棋人机对弈2值,威胁与保护等四项之和。1982 年廖嘉成发表的利用计算机象棋的实验就进了一步,包括开局、中局、残局。台湾大学的许舜钦教授被称为中国计算机象棋之父。在他 1991 年的两篇论文中,总结并介绍了到当时为止几乎所有的搜索算法

11、,他在文中详细阐述了许多算法的不足之处并且解释了人们对这些算法的误解。这些研究成果为以后计算机象棋的发展做好了铺垫,至今仍在指导着人们进行计算机象棋的研究和实验工作。到了九十年代,中国象棋计算机博弈开始发展起来,人们研究出了各种博弈软件。比较有代表性的有台湾的吴身润的中国象棋 、光谱公司出品的将族 、晟业编制的象棋水浒战等等。1.3主要研究内容文章主要是研究中国象棋的人机对弈,包括象棋的界面和引擎部分。界面主要是方便人与电脑进行交互的可视化界面。界面包括棋盘区、菜单项和功能按钮区。主要实现棋子的移动、悔棋、记录棋谱、难度选择等选项功能。引擎部分主要包括,棋子棋盘的表示即数据结构,走法的生成,局

12、面优劣的评估即评估函数,搜索算法及其优化和改进。主界面分为三部分:菜单栏,棋盘区,常用按钮。菜单栏在最上面,有四个主菜单:游戏,难度,让子,棋谱。游戏菜单包括“我先走” 、 “电脑先走” 、 “音效” 、 “退出” 。不论选择我先走还是电脑先走,棋盘区的棋子都会回到初始位置。选择音效会有声音效果,取消音效为静音。难度菜单包括“傻瓜” 、 “菜鸟” 、 “新手” 、 “入门” 、 “业余” 、 “专业” 、“大师” ,总共设有七个难度,选择任何一个难度不会影响棋盘区的布局,只会改变当前电脑的策略。让子菜单包括“让单马” 、 “让双马” 、 “让九子” 、 “被让单马” 、 “被让双马” 、“被让

13、九子” ,选择任何一个选项也会让棋盘区的棋子回到让子的初始状态。棋谱菜单包括保存棋谱和读取棋谱,保存棋谱是保存从初始状态到当前局面的过程。读取棋谱,读取出保存的棋谱并使棋盘区的棋子回到初始状态,棋盘下方的常用按钮替代为“上一步”“下一步” ,可以通过这两个按钮演示棋局。棋盘区是显示棋盘的区域,占据了整个界面的正中。常用按钮区在棋盘区的下面,有三个按钮:悔棋、保存、复盘,悔棋是当人该下子的时候回到上一步,保存是保存当前棋盘的格局,复盘是恢复保存的棋盘格局,人可以接着回复的格局继续对弈。文章设计是采用 MFC的框架来实现界面部分,主要用到的MFC 类有 ,CWnd:窗口,它是大多数 “看得见的东

14、西”的父类(Windo ws 里几乎 所有看得见 的东西都是 一个窗口,大窗口里有 许多小窗口 ) 。CDC 设备 文本。无论是显示 器还是打印 机,都是画图给 用户看。这图就抽象 为 CDC。CDC 与其 他 GDI(图形设备接 口)一起,完成文字和 图形、图像的显四川大学本科毕业论文 中国象棋人机对弈3示 工作。CDial og 对话框 类,CPen 类 ,CBrus h 类等等。象棋对弈其 实是一种零 和博弈。双人对弈,轮流走步;信息完备,双方得到的 信息都是一 样的;零和,即对一方有 利的棋,对另一方肯 定是不利的 ,不存在对双 方均有利或 无利的棋。所以内核代 码的思路要 用到博弈算

15、 法。对每一个局 面所有可能 的着法进行考虑,每一步着法 会形成新的 局面,这样就形成 了一颗博弈 树。机器博弈就 是要从这颗博弈树中找 到最优的分 支,即要用到搜 索算法对整 棵树进行搜 索。而中国象棋 的博弈树是 一个庞大的 集合,如果一毫微 秒走一步,也要需要 10 的一百多 次方年才能 搜索出必赢的第一步,所以博弈树 是不可能穷 举的。人在思索下 棋的时候也 不可能对棋 局所有的可能计算完全 ,人往往是凭 自己的经验 、知识对棋面 的好坏进行 评估。通过这种思 路我们可以 给每个局面 打一个分数 来表示棋局 对自己的有 利程度。如果轮到自 己落子的时 候,一定会选择 使局面分数 最高的

16、着法 ,如果轮到对 手落子,他一定会选 择使你得分 最低的局面 。这就是我们 经常听到的 极大极小值 搜索,而对局面进 行估分的函 数就是评估 函数。极大极小值 搜索就是在 轮到自己落 子的时候选 择分数最大 的局面,轮到对手落 子的时候选 择得分最小 的局面,这样就使得 搜索可以进 行,而由于估分 的存在我们 就可以在搜 索进行到可 以接受的时 间范围内时 结束它。四川大学本科毕业论文 中国象棋人机对弈42.数据结构2.1棋盘的表示任何程序都是由数据结构和算法构成的。对中国象棋的计算机游戏编程,首先是要思考用什么样的数据结构来记录棋盘和棋子。下图是一个中国象棋的棋盘:图 2-1 中国象棋棋盘

17、可以明显地看出,中国象棋的棋盘是由 10*9 根横竖直线相交的交叉点构成的。那么我们很容易地想到了用一个 10*9 的数组 board109来表示棋盘,棋盘的定义如下:int board109=1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,1,0,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,四川大学本科毕业论文 中国象棋人机对弈51,0,1,0,1,0,1,0,1,0,1,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1;在这里

18、我们用 0 表示某个位置上没有棋子,用 1 来表示某个位置上有棋子,棋子的具体表示方法我们在下一小节将会讨论。我们还可以用一个一维数组来表示这个棋盘,棋盘从左到右再从上到下我们可以用一个一维数组 board90来表示棋盘,一维数组的定义为:int board90=1,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,1,0,1,0,1,0,1,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,0,1,0,1,0,1,0,1,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,1,1,

19、1,1,1,1,1,1;也就是说数组的第一个位置代表左上角的车,而数组的最后一个位置代表的事右下角的车。用一维数组来表示棋盘有什么好处呢,首先一维数组比二维数组少了一个维度,可以用一个下标就能表示一个点,这对于找寻一个点的位置是十分方便的,其次只需通过下标的求余和求整计算就可以轻易得到某个点的横纵坐标。还有一种更高效的办法,就是用一个256 长度的一维数组来表示棋盘,它主要是利用了与运算和右移运算来实现求横纵坐标的,我们这里不再进行阐述。2.2棋子的表示上一小节为了阐述方便,我们简单地把有棋子标记为 1,在实际的操作过程中,这样是远远不够的,因为我们知道不同的棋子作用是不同的,所以我们需要用新

20、的不同的数字来代表不同的棋子。我们可以按照棋盘上从左到右的顺序,用 1 来表示车、2 表示马等等,可以总结为下四川大学本科毕业论文 中国象棋人机对弈6边的对应图:车 马 象 士 将 炮 卒车 马 相 仕 帅 炮 兵1 2 3 4 5 6 7这样我们就得出了一个简单的对应关系,我们通过数字的不同就可以判断棋子的不同种类,但是这样不能区别红黑双方的棋子,于是我们做一个小小的改进: 车 马 相 仕 帅 炮 兵1 2 3 4 5 6 7车 马 象 士 将 炮 卒8 9 10 11 12 13 14那同一方的同类的棋子有没有差别呢?我们知道,如果马被封在了角落里它的作用可能还不及一个过河兵,如果马在卧槽

21、的位置上那么它的威胁是十分大的,关于棋子的效力我们将在评估函数一节中讨论,所以即使是同一方相同的棋子也需要用不同的数字来表示,于是就形成了下边的对应:车 马 相 仕 帅 仕 相 马 车 炮 炮 兵 兵 兵 兵 兵1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16车 马 象 士 帅 士 象 马 车 炮 炮 卒 卒 卒 卒 卒17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32我们依然用0 来表示棋盘上的位置上没有棋子。当电脑在下棋的时候,它会挨着搜索棋盘上有哪些棋子,然后来判断棋子的移动,这样到了中后期,棋盘上的棋子很少的时候这

22、样的做法效率是很低的。于是我们就想到通过某一个棋子可以直接知道它是否还在棋盘上,如果在棋盘上能知道它在棋盘上的位置。我们可以定义一个长度为 32 的一维数组来建立一个棋子到棋盘的映射,来记录棋子的信息。如果我们用的是一维数组来表示棋盘,那么这个映射数组的值当为-1 时我们可以知道棋子已经不再棋盘上了,我们可以用相应的整数来表示棋子在棋盘上的坐标。四川大学本科毕业论文 中国象棋人机对弈73.棋子的走法没有规矩不成方圆,任何棋类游戏都有它落子的规矩。对于简单的五子棋来说,下棋双方轮流下棋,只要是棋盘上有空位的地方都可以落子。相比于五子棋来说,象棋的规则就相对要复杂一些,像马走日、象走田、将不能出九

23、宫格、士划斜线,还要考虑撇马脚、堵象眼等各种情况。对于中国象棋电脑游戏,电脑对于人落子合理性的判断要相对简单一些,只需判断起始点的棋子的规则时候能够走到终点。由于中国象棋的电脑思索过程是基于搜索的,所以电脑必须判断出棋子所有合法的落点。根据棋子的走法,如车可以在横竖直线上走任意步,兵每次只能移动一步,这样我们可以得出棋子可能走到的点,我们还需要考虑棋子是否走出了棋盘,这种着法是不合理的。我们还需要考虑规则的合理性,车在走任意步的时候起始点和终点之间没有棋子的阻隔,兵永远不能后退,兵在过河后才能左右移动,马脚时候被撇住,象的中心是否被堵住。还要考虑当落子的终点上有对方的棋子话就形成了吃子。另外,

24、对于炮来说,炮的移动和吃子的规则是分开的,需要分开来考虑。如果每次搜索都要一个棋子一个棋子地去考虑它们所有的落子位置,这样搜索的效率会大大降低。通常我们会使用一种模板法的方法来简化棋子落子的选择,这种方法是利用空间去换取时间来提高效率。模板法是将在某个位置上的棋子的所有可能的落点记录下来,例如某个位置上的棋子是一个马,根据马的行子规则我们可以记录下马所有可能达到的位置,存储起来作为模板,当我们搜索棋子与棋盘的映射数组时,如果我们知道了马正好在这个位置上,我们就可以直接得出马可能的几个落子位置,再检查马脚是否被撇,就可以很快地知道棋子的落点。棋子走法的生成是在搜索的每层必须要用到的,能够简化走法

25、生成的步骤缩短走法生成的时间将会大大提高搜索算法的时间,从而提高电脑下棋的速度。四川大学本科毕业论文 中国象棋人机对弈84.评估函数对于中国象棋来说,当一方的将帅被吃掉的时候棋局也就结束了,被吃掉的一方输掉了比赛,当双方都无论如何无法吃掉对方的将帅的时候就为和局。电脑是通过搜索的办法来寻找下棋的策略的,如果电脑搜索到对方的将帅被吃的时候,那么返回的第一步就是电脑必赢的第一步,然而根据现在的硬件设备很多地方都证明了这需要上亿万年的时间,也就是说要需找出必赢的第一步棋几乎是不可能的,这样也使得人机对弈失去了意义。于是我们就考虑怎样才能让搜索的时间控制在可以接受的范围内,假设我们只搜索到第 N层,当

26、到了第 N层的时候我们就需要判断出哪一个局面对下棋的一方是最有利的。对于人来说局面是否有利是凭自己的经验感觉、掌握的知识等来判断的,但是电脑它不能像人一样真正地思考,它需要我们给它制定一些规则来判断局面的好坏,这个告诉电脑棋局形势好坏的函数就是评估函数。评估函数会以下棋的一方为主体给棋局进行打分,让电脑一目了然地知道哪个棋局对它有利,从而返回最佳的落子策略。那怎么来判断一个局面的好坏呢,首先想到的就是棋子本身的价值。通常我们会觉得车的价值比一个兵的价值大,这样我们就可以用一个分数来表示它们作用的大小。有一个词叫弃车保帅,如果将帅都被吃掉了,那么游戏也就以失败告终了,所以将帅看似能力很小但我们要

27、给它一个无穷的值来表示它的重要性,在计算机中我们用一个相对来说非常大的数字来表示将帅的值。对于炮和马的价值差别是很模糊的,很少有人会在下象棋的第一步就用自己这一方的炮去换掉对方的马,当然这里面包含有转换先手的原因,而马的吃子的效果不用考虑到局面棋子的多少,相对来说比较灵活。这里我们认为马的作用稍高于炮。我们可以得出一个棋子与分数的简单对应:车 马 象 士 将 炮 兵700 320 150 150 10000 300 100这是一种最简单的判断局面好坏的方法,利用这种方法加上高效的搜索算法也可以写出一个具有相当棋力的象棋程序。棋子除了它本身的价值还有它所处位置的影响,前面的内容我们就说到了如果一

28、个被封在死角的马的作用不及一个卧槽马的作用,甚至不如一个在对方九宫格附近的过河兵的作用。所以我们在考虑棋子本身价值的同时我们还需要考虑它的位置附加值。我们可以做出所有棋子位置附加值的映射作为模板存储起来,给一个棋子在不同的位置打一个分数,当评估局面的好坏时,也把位置附加值加权在内。像兵过河过后的附加值比没过河要大,兵进一步靠近对方的九宫格附加值更大,当兵被逼到对方的底线时附加值又会相应地减少。对于将帅来说位于最起始的位置时附加值是最大的。我们知道下围棋的时候最讲究的就是形和势,所谓的形就是棋子与棋子之间的相互作用。像一些必杀的棋,炮与炮的组合双重炮,炮与马的组合马后炮,这些都是由自己四川大学本

29、科毕业论文 中国象棋人机对弈9一方的棋子形成的强有力的杀招,当棋子的移动可以构成某些固定的形的时候,我们也应该给这样形加分。除了这些杀招外,还有一些非常强硬的组合,像连环马、担子炮、霸王車,根据不同的形加上相应的附加值。古文中有“夫六国与秦皆诸侯,其势弱于秦” ,所谓的势就是保护与被威胁的情况。当一方的某个棋子在下一步将会被对方吃掉的时候,如一方的马在对方的炮的吃子位置上,我们就认为被威胁的一方势要弱一些,就应该给主动威胁的一方加上相应的分数,而给被威胁的一方减去相应的分数。我们还需要考虑到,在中国象棋中经常存在连环吃的情况,如果你吃了对方的一个子,对方马上也能吃掉你的那个子,也就是说某一方的

30、一个棋子虽然在对方一个棋子吃子的威胁下,但是被威胁的那个棋子又在己方的某一个棋子的保护之下,这种局面处于动态稳定,我们不予加分。如果对子的两颗棋子本身价值及位置附加值等相差甚远,我们又需要另外作考虑。上面介绍了一些常用的判断局势的依据,依据这些依据可以写出十分强大的象棋程序,但是如果和顶尖棋手较量还有一定的差距。就像完全展开博弈树一样,这是一个理想的状态。对于评估函数,如果它能像人一样或者比人的思维更强,它能考虑到各种各样的情况,计算到各种各样的因素,换句话说它是一个完美的评估函数,那么我们就不再需要搜索算法。我们只需要凭借评估函数就能知道要走的棋是哪一步。但是这样的评估函数我们都知道至少现在

31、是不可能的,但是人们也在朝着这个方向努力,神经网络评估函数就是想实现这个目标。庞大的象棋程序会吸纳成千上万的优秀棋局作为计算机的参考,并且计算机还具有一定的学习修正能力。这需要用到更深奥的知识,如现在的加强学习法,自适应遗传算法等。四川大学本科毕业论文 中国象棋人机对弈105.搜索算法5.1极大极小值搜索算法中国象棋是一种零和博弈游戏,所谓零和即一方的收益必然意味着另一方的损失,博弈双方的收益和损失相加总和永远为零。博弈双方轮流下棋,都选择对自己最有利即对对手最坏的情况,这样交替就形成了一颗博弈树。为了阐述方便,我们假设后边都是一个叫 Max 的一方即将下棋,而他的对手叫做 Min,而评估函数

32、计算出的分数都是相对于 Max 的得分。当 Max 下棋的时候他一定会选择对自己最有利的着法,即得分最高的局面,我们称为 Max 点,而轮到 Min 下棋的时候,他一定会选择对 Max来说最坏的局面,即得分最低的局面,我们称为 Min 点。这个轮流思考的过程我们用搜索算法表达出来就是极大极小值搜索算法。图 5.1 一颗博弈树如图 5.1 是一颗分支为 3,深度为 2 的博弈树。正方形的点代表它是一个极大值点,它选择它的后继者中值最大的局面。圆形的点代表它是一个极小值点,它选择它的后继者中值最小的局面。例如点 p(1) ,它是一个极小值点,在它的后继者中 p(1,2)的值最小,所以它的值就为 3

33、。对于根节点p 来说,它是一个极大值点,它的后继者中 p(1)的值最大,所以它的值就为 3。下边是极大极小值的一段伪代码。int Maxmin(int depth)四川大学本科毕业论文 中国象棋人机对弈11If (0=depth)return Evalute(); /返回评估函数的值if (Max 节点)for (生成每一个可能的走法)执行走法;flag=Maxmin(depth-1);撤销走法;If (flagvalue)value=flag;if (Min 节点)for (生成每一个可能的走法)执行走法;flag=Maxmin(depth-1);撤销走法;If (flagvalue来判断

34、value 是否赋值。这样就可以大大地简化代码,伪代码如下:int Maxmin(int depth)If (0=depth)return Evalute(); /返回评估函数的值四川大学本科毕业论文 中国象棋人机对弈12for (生成每一个可能的走法)执行走法;flag=-Maxmin(depth-1);撤销走法;if (flagvalue)value=flag;这样做没有改变程序的效率,只是使得代码整洁易懂。这种做法也叫做负极大值算法。可能有人会问这样不是改变了返回值,程序的正确性怎样保证。其实要做修正的不仅仅是这里,在评估函数中,当下棋的是Max 点时返回负的估值,当下棋的是Min 点时

35、依旧返回原来的估值。这样就保证了经过处理的返回值保持不变,这里还需要向评估函数传递一个参数,用来表明当前下棋的是谁。5.2 alpha-beta剪枝算法上一小节中我们已经讨论过,将一颗博弈树完全展开几乎是不可能的,要找到必胜的第一步也是不可能的。但是如果越靠近博弈树的末端我们可以认为越接近最终局面,也就是说我们希望尽可能的搜索更深的层次,但是搜索的深度和时间的花费是成正比的,我们必须提高搜索算法的效率才能节约更多的时间。这样我们就会想到每次搜索的过程中是不是有很多其实不需要搜索的分支浪费了很多时间。到底哪些分支不需要搜索了,哪些分支需要减掉呢,我们来看下边的分析。图 5.2四川大学本科毕业论文

36、 中国象棋人机对弈13如图 5.2,我们采用的是从上到下从左到右的深度优先搜索,p(1,1 )的值 v(1,1 )=3,由于 p(1)是一个极小值点,它的取值是它所有继承 者中值最小的那个点,于是我们可以得到 v(1)=5,也就是说点p(1,2 )的值绝对不会比 5 小。我们再看点p(1 ) ,它的值绝对不会比 3 大,所以它不会取它第二个子节点 p(1,2 )的值,那么p(1,2 )剩余的子节点就不用搜索了。这时就发生 了 alpha 剪枝。同样地,由于根节点p 的值取的是它的子节点中最大的值,由于 p(1)=3 ,那么可以得出 p 的值 v=3。而 p(2)的第一个子节点的值可以推出 p(

37、2)的值 v(2)alpha)alpha=flag;if (alpha=beta)break;Return alpha;传递参数的时候之所以要调换 beta 和 alpha 的值,是因为要迎合负极大值算法。应用 alpha-beta 算法可以省去很多冗余的分支,节省很多时间。在 alpha-beta 剪枝算法中我们希望剪枝发生越早越好,这就和节点的顺序有关,事实上根据这个思想 alpha-beta 剪枝算法可以进一步改进。相应的改进方法有静态启发和迭代深化等。四川大学本科毕业论文 中国象棋人机对弈145.3 alpha-beta剪枝算法的改进上面已经说过 alpha-beta 剪枝算法非常依赖

38、于棋子走法的搜索顺序,如果每次运气都非常不好,总是先搜索到最坏的走法,那么剪枝永远不可能发生,那么结合了alpha-beta剪枝算法的极大极小值搜索算法就相当于简单的极大值极小值搜索算法。如果每次都搜索到最好的走法,那么 alpha-beta 算法的效率就接近于数学理论值,搜索的有效分支因子就相当于实际分支因子的平方根。由于在简单的 alpha-beta 算法中,博弈树中的走法是随机的,alpha-beta 算法虽然能达 到一定的剪枝效果,但是它还有很大的提升空间。我们可以尽可能早地去搜索我们认为比较好的走法,也就是可以产生剪枝的走法。我们把之前产生了剪枝的走法记录下来,当遇到下次需要这个走法

39、的时候它也有可能产生剪枝,我们就优先搜索这个走法。我们还可以保存同样的分支,当搜索到同样的分支的时候,前一个分支的走法发生的剪枝也可能使得后一个分支发生剪枝,于是我们可以借鉴先前的走法,优先搜索先前的走法。当我们使用alpha-beta 剪枝算法时,我们常常传 递一个无穷大的值 beta 和一个无穷小的值alpha 到函数里面去。我们搜索的 时候 alpha 和 beta 的值就像一个窗口,凡是不再这个窗口范围的值都被排除,发生了剪枝。我们知道,如果 alpha 和 beta 的差值越小越容易发生剪枝,于是我们起初传递的无穷大和无穷小效率不高。我们可以根据上一次的搜索找到一个估计值 N,并且找

40、到 alpha 和beta 距离 N 的波动范围 e,于是我们可以传递一个更小的 alpha-beta 范围为 N-e,N+e。这样做可能 会返回不正确的最大值最小值,但是却大大提高了效率。当返回值不再预测的范围之内时,需要重新进行搜索,这种消耗的时间和提升的效率比起来是值得的。中国象棋每个局面平均有几十个走法,但是开局和残局区别是非常大的,开局的时候所有的棋子都在,而残局的时候可能就只有个十几个棋子。通常我们搜索的深度根据难度选择的不同会设定一个固定值,这样开局搜索的时间相对来说就会很长,为了照顾开局的搜索时间而设定的搜索深度在残局的时候只需要很短的时间进行搜索,这样就没能够充分的利用时间。

41、于是我们就可以想到在棋局进行的过程中根据实际的情况可以慢慢地增加搜索的深度,这样就可以使得时间得到充分地利用。而在开局的时候我们可以利用开局库和一些定式,比如要尽早出马等,来节约一些搜索的时间。在前边介绍评估函数的时候我们就说到一个现象,如果我们设定的搜索程度是 n 层,那么当搜索到 n 层的时候程序就不会继续搜索了,而这个时候下棋的一方可以吃掉对方的一个棋子,比如说车可以吃掉一个炮,程序就可能认为这是一个巨大的优势从而选择了这个走法。但是这个时候会产生一种情况,那就是当车吃掉炮的时候对方的某一个棋子可能吃掉这个车,这就相当于下棋的一方用车去换了对方一个炮,这是相当不理智的。这种现象被称为水平

42、效应。要规避这种现象有好几种方法。当搜索到设定深度的时候来四川大学本科毕业论文 中国象棋人机对弈15判断局面时候相对静止,如果不是则继续搜索到相对静止的局面。这个所谓的相对静止的局面就是除了吃子、将军等引起局面非常大的变化的走法。如果父节点和子节点的估值相差过大,也可以选择继续往下搜索。6.界面的实现6.1棋盘区前边已经介绍过界面的实现用的是微软 MFC类库,用的系统开发环境 VC+6.0。首先建立一个 MFC 工程,将不需要菜单栏工具栏去掉,运行一下我们就得到了一个 Windows应用程序的基本框架,这是 MFC特别方便的地方。我们首先考虑棋盘区的设计。棋盘区需要一副背景图,下边是在网上找的

43、一副图。图 6.1位图是一副资源,它有一个 ID 号为 IDB_GROUND。这里需要用到一个类 CBitmap,需要把位图资源和一个CBitmap 变量关联起来。CBitm ap 类封装了 Windows 图形设备接口中的位图,并且提供了操纵位图的成员函数。CBitmap m_Bitmap_Background;m_Bitmap_Background.LoadBitmap(IDB_GROUND);然后再把 CBitmap 变量和 CDC 句柄关联起来。CDC 类定义的是设备上下文对象的类。CDC 对象提供处理器显示器或打印机等设备上下文的函数。通过 CDC对象的成员函数进行所有的绘图。m_D

44、c_Background.SelectObject(m_Bitmap_Background);接着用 CDC 的函数把它画到客户区。所要用到的函数是 BitBlt() 。四川大学本科毕业论文 中国象棋人机对弈16画完背景过后就需要画棋盘了,画棋盘首先要用到画笔,这需要用到一个类 CPen,它用来在 CD 上完成绘制线条的任务。初始化时系统自动提供了一个默认的黑色画笔,如果对这个默认的画笔不满意,可以自己创建画笔来替换它。自定义画笔需要使用 CPen 类的构造函数,创建自己的CPen 类对象。画棋盘需要用到 CDC类的几个成员函数 Moveto() 、Lineto() ,Moveto()是将画笔

45、移到起始点,Lineto()是从起始点画一条直线到终点。棋盘画好过后就是在棋盘上边摆放棋子了,棋子也用位图表示,使用和画背景相同的办法把棋子画到棋盘上。还有一点值得注意,当窗口移动、遮挡、大小变化的时候都会进行窗口重绘,重绘擦出先前所画的东西,所以我们必须在 Ondraw()函数中进行处理,应用程序窗口的客户区进行绘图的所有代码都必须写在这个函数中。棋盘区画好过后就需要做一些消息响应处理。消息就是指Windows 发出的一个通知,告诉应用程序某个事情发生了,在我们这个程序中就是点击鼠标、改变窗口尺寸等。消息本身是作为一个记录传递给应用程序的,这个记录中包含了消息的类型以及其它的信息。我们程序中

46、常常相应的鼠标点击消息,它相对应的结构体就包含了单机鼠标的消息号、单机鼠标时的坐标。当轮到人下棋的时候鼠标左键点击客户区,响应函数会判断在该位置上是否有己方的棋子,只有当己方棋子存在的时候才会发生动作,将该棋子选中,相应地我们还可以给这个选中动作关联一个声音文件。当我们继续点击鼠标左键时,如果依然是己方棋子程序会重新选中这个棋子,如果是空位或者是对方棋子,响应函数会判断按照规则是否可以走到这个位置上或者形成吃子,如果可以的话就会把选中的棋子画到这个位置上,清楚起始位置和终点位置上原来的棋子。当轮到电脑下棋的时候,它是不会响应我们的鼠标点击事件的。棋盘区还有一个功能,就是在实现读取棋谱的菜单项时

47、,会在棋盘的下方画上两个图片按钮“上一步” 、 “下一步” ,这两个图片按钮会响应鼠标左键点击事件从而来演示棋谱。6.2菜单项的设计菜单栏在客户区的上方,主要是实现一些基本的操作和功能。在 MFC 菜单也是当做一种资源管理的,利用 MFC设计菜单非常便捷。我们从左到右一个个介绍每个菜单的选项和功能。首先是“游戏”菜单,它包括“我先走” 、 “电脑先走” 、 “音效” 、 “退出”四个子菜单。每个子菜单的功能一目了然, “我先走”是代表由人执红棋, “电脑先走”是代表电脑执红棋, “音效”选中时会伴有各种操作棋子的声音, “退出”代表退出游戏,如果你正在棋局中点击“退出” ,它会提醒你正在游戏中是否退出程序。当重新选择选择先手的时候,棋盘区的棋子都会回到初始位置。四川大学本科毕业论文 中国象棋人机对弈17第二个菜单是“难度”菜单,它包括七个等级“傻瓜” 、 “菜鸟” 、 “新手” 、 “入门” 、“业余” 、 “专业” 、 “大师” 。从前边的章节中我们知道,搜索算法搜索的程度越深,越接近最终局面,我们认为这样得出的走法越高明,这样使用的时间也越多,于是我们通

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报