1、计 算 机 博 弈创 新 教 育 的研 究 与 实 践 梅险 侯 利元 谢文 高旭 孙伟 李冬平 哈 尔 滨理 工 大学 摘 要: 随着Alphago 在围棋上战胜人类, 计算机博弈再次引起业内的广泛关注。 人工智 能有望成为互联网经济的下一个 经济支撑点。 高等学校在开展相关创新教育时普 遍面临门槛高、 项目偏、 交流少的困难。 本文以计算机博弈创新教育的平台建设 为主线, 分析了影响计算机博弈创新教育的主要问题和产生原因, 阐述了改革 和推广计算机博弈教学的研究和实践过程。 关键词 : 人工智能; 计算机博弈; 创新教育; 作 者简 介: 梅险 (1975-) , 男, 黑龙江哈尔滨人,
2、高级实验师, 研究方向:计算 机博弈研究。 基 金: 黑龙江省大学生 创新创业项目 “用户交互特征识别系统的研究 ”和“智能 博弈在教研领域的应用推广 ” 一、高等学校开展计算机博弈创新教育的意义和现状 ( 一) 高等 学校开 展计算 机博 弈创新 教育 的意义 1997 年 IBM 计算机 Deep Blue 战胜等级分排名世界第一的国际象棋世界冠军加 里 卡斯帕罗夫。这标志着计算机下棋成为衡量计算机人工智能水平的重要参 考。2016 年Google 计算机Alpha Go 战胜韩国围棋冠军李世石。随着信息领域 的企业巨头和著名研究机构在计算机棋牌方面的研究和展示, 计算机博弈的研 究意义和
3、应用价值得 到学术界和产业界的重视和关注。 计算机下棋是人工智能在博弈论领域的应用。 通过研究计算机博弈可以揭示博弈 论的本质, 预示人工智能的发展前景。 经历了十几年的发展, 互联网的经济红利 已经所剩不多, 下一个经济增长点很可能是人工智能相关产业。 高等教育担负着 培养高素质从业人员的重任。 在众多人工智能研究领域中, 计算机博弈是最符合 中国国情、 最适合铺开推广的研究方向。 因为它需要的硬件条件不高, 各大高校 现有的计算机设备基本都能满足开展研究的需求。 学生通过对计算机博弈的学习 和研究, 可以提高计算机程序设计能力、 动手实践能力和科研创新能力, 同时可以提高对团队协作和质量检
4、测的理解和重视。 如何通过多种教学形式对大学生开 展计算机博弈知识普及, 提高大学生研究能力和创新意识是当前高校创新教育 面临的机遇和问题。 ( 二) 高等 学校开 展计算 机博 弈创新 教育 的现状 目前国内本科生阶段开展计算机教学和研究的高等院校数量还不多。 数据显示北 京、 辽宁、 黑龙江、 重庆等地高校计算机博弈研究起步相对较早, 区域内院校对 人工智能和计算机博弈的教学和研究支持力度较高。以黑龙江为例, 每2.72 万 本科在校学生有1 支队伍参赛, 其参与程度约是山西地区的 14 倍。数据也反映 出国内高校计算机博弈研究分布还不是很均衡。 很多省份还处于空白状态或刚刚 起步。普及推
5、广计算机博弈的目标任重道远。 二、开展计算机博弈创新教育的常见问题和产生原因 ( 一) 起步 阶段博 弈项目 规则 不熟, 造成 学生参 与数 量不多, 积 极性也 不高 本科学生在校期间, 除了要完成大约40 门课程的学习任务之外, 还面临社会实 践、就业压力和升学压力。前几年计算机博弈没有得到社会的普遍认可和重视, 对口的就业机会不多, 造成学生参与计算机博弈研究单纯是出于对棋牌游戏的 兴趣。而早期的计算机博弈项目多以国外的棋种为主, 比如点格棋、亚马逊等, 很多内地学生连名字都没听说过, 更不要说了解博弈规则和掌握对局技巧, 即 使根据规则文本编写程序实现对局, 离智能的目标也相差甚远。
6、 因此, 项目本地 化程度是影响计算机博弈普及 推广的主要原因。 ( 二) 计算 机博弈 早期入 门技 术门槛 普遍 偏高 内地非计算机专业的理工科学生课程通常只包括约 70 学时的程序设计课程。这 些课时对于无基础的学生只够掌握常规语法和简单算法。 而几乎所有计算机博弈 项目都是在平面棋盘上描述棋子在不同时刻的状态和价值。 仅仅描述棋盘静止状 态就需要对二维数组和相关的编码计算有比较深刻的理解。 要让棋子按照规则合 法地运动起来, 还须要根据规则描述行棋招法的数据结构描述。 比如中国象棋项 目, 虽然内地群众基础较好, 大约1/10 的学生日常有用中国象棋娱乐消遣的习 惯。 但是把象棋的最简
7、单 行棋规则“马走日、 象走田 ”用程序描述出来需要相当 复杂的逻辑结构。 这个入门程序的复杂度让有兴趣参与计算机博弈学习和研究的 学生也容易产生畏惧心理。 或者由于较长时间无法提高水平突破瓶颈, 造成原有 参与学生的大量流失。 ( 三) 计算 机博弈 交流学 习的 环境还 不完 善 现有的内地高等院校的计算机博弈研究和学习交流主要是通过全国大学生计算 机博弈大赛和相关的国际国内学术会议。 交流时间不充分使得探讨很难深入。 异 地参与比赛或会议的差旅费用对于学生来说压力也不小。 三、促进计算机博弈创新教育普及和提高的探索和实践 ( 一) 增设 内地学 生喜闻 乐见 的博弈 项目 在内地开展计算
8、机博弈竞赛的早期阶段, 多数项目都是来自国外的博弈游戏项 目。 虽然研究价值比较明确、 研究基础理论比较充实, 但是学生缺乏对项目的日 常应用理解, 因此参与兴趣普遍不高。 在研究中, 团队成员分析发现传统二人军 棋暗棋群众基础较好, 具有不完全信息博弈的特点, 造成防守策略一方有较大 优势。 因此多数成熟的玩家会考虑优先防守, 从而造成无人主动进攻的僵局。 因 此, 研究组对传统的二人军棋暗棋规则作了必要的调整。 使二人军棋暗棋游戏重 新进入高校学生的视野, 并得到高度认可。 随后, 研究组对 国内群众基础更好、 玩家规模更大的斗地主游戏规则进行了分析 和研究。 研究组设计了斗地主的编码规则
9、和计算机通信协议指令, 使每个参与博 弈对局的程序之间有统一和公平的信息交互。 自从开发和设计了军棋和斗地主博弈的规则和协议, 这两个项目随之成为全国 大学生计算机博弈大赛的正式项目, 很多学生都积极参与到这两个项目的计算 机博弈技巧的研究中。 ( 二) 建立 便捷的 对局平 台并 发布易 学的 示例代 码 传统计算机博弈多为两人完全信息博弈, 双方需要在计算机上显示相应的棋盘 图像。 在本科计算机教学中普遍注重对语法的教学和对基础算法的教学 。 对鼠标 和图形界面等基本不涉及或仅仅一带而过。 因此对于没有统一图形平台界面的博 弈项目, 参与者须要投入相当的精力学习相关知识, 而这部分精力的投
10、入与博 弈研究的本质关系并不大。 研究组为新增的项目军棋和斗地主项目分别开发了图 形化对战平台, 使掌握基本控制台编程技能的学生即可参与博弈研究, 并集中 精力到博弈算法方面。 对战平台通过统一的交互协议实现快速通讯, 避免了人工操纵可能出现的误操 作, 提高训练和对局的效率。 统一的对战平台还是非完全信息博弈项目的, 可以 免于依赖人工裁判的重要技术方向。 要加快新建博弈项目的 普及, 还须要设计简单易懂的入门示例代码。 以便各个新 参与的学校可以快速尝试开展深入研究, 避免因对通信协议理解偏差造成的时 间和精力的浪费。 为此, 研究组开发了简练的军棋示例代码。 它可以实现最简单 的行棋规则
11、, 又给各学校提升代码效果质量预留了充分的空间。 研究组也开发了 斗地主示例程序。 由于斗地主牌型规则特别复杂, 研究组将各种牌型的基本辅助 判断以库函数的形式写入头文件, 节省了初学者对复杂牌型进行基本判断的开 发精力和时间。 示例程序还提供了辅助提示函数, 对当前桌面的出牌牌型进行提 示, 把所有可出的合法牌型列举出 来, 供学生智能引擎选择, 使研究者更集中 精力在博弈算法研究上。 ( 三) 建立 具有远 程参与 功能 的网络 交流 平台 为了加强各校之间的计算机博弈研究深入交流, 研究组还开发了核心算法模块 评估网络博弈平台。 选手只须要编写并提交一个函数程序即可实现对五子棋博弈 项目
12、的对局, 函数的接口参数为二维数组, 表示决策时棋盘上双方的棋子分布。 函数的返回值是有落子位置行列坐标描述的棋盘位置编码。通过网络交流平台, 使异地的两个学校可以在不承担差旅费用开销压力的情况下实现定期的交流。 四、结语 经过对计算机博弈创新教育的分析和探索, 研究组发现以博弈平台结合多种教 学模式从理论到实践极大地提升了学生的动手能力和创新能力。 军棋平台和斗地 主平台在训练和比赛中运行稳定, 判定准确, 被指定为全国大学生计算机博弈 大赛官方唯一指定平台。 参与研究开发平台和示例程序的学员在毕业时普遍被重 点高等学校录取为研究生或被著名 IT 企业高薪聘用。 参考文献 1 徐心和, 邓志立, 王骄, 徐长明, 刘纪红, 马宗民.机器博弈研究面临的各 种挑战J. 智能系统学报, 2008 (8) :288-293. 2 陈卓 .“人机大战 ” 到底应该关注什么?J. 软件和集成电路, 2016 (4) :52-53. 3 王亚杰, 邱虹坤, 吴燕燕, 李 飞杨, 周凤.计算机博弈的研究与发展J.智 能系统学报, 2016 (12) :788-798. 注释 ()2017.12 黑龙江教育 理论与实践