1、有限自动机可识别语言的基数 迟晓晴 王玉涵 王艳慧 山东科技大学数学与系统科学学院 摘 要: 利用有向图的邻接矩阵研究有限自动机的可识别语言的基数问题。通过建立有限自动机的可识别语言与其有向图中从初始结点 (有限自动机的初始状态) 到终止结点 (有限自动机的终止状态) 的路的一一对应关系, 利用邻接矩阵给出了有限自动机的可识别语言的基数公式, 研究了两个自动机不等价的充分条件。关键词: 有限自动机; 可识别语言; 邻接矩阵; 作者简介:迟晓晴 (1993) , 女, 硕士研究生, 主要研究方向:自动机理论、代数学;E-mail:;作者简介:王玉涵 (1992) , 女, 硕士研究生, 主要研究
2、方向:自动机理论;作者简介:王艳慧 (1984) , 通讯作者, 女, 山东科技大学讲师、获英国约克大学哲学博士, 主要研究方向:代数学、半群理论、自动机理论, E-mail:。基金:国家自然科学基金 (No.11501331, No.11471255) Cardinal of regular language of the finite automataCHI Xiaoqing WANG Yuhan WANG Yanhui College of Mathematics and Systems Science, Shandong University of Science and Techno
3、logy; Abstract: We study the cardinal problem of regular language of finite automata by using adjacency matrix of directed graphs. By establishing a one-to-one correspondence relationship between the regular language of the finite automaton and its directed graph from the initial node (the initial s
4、tate of the finite automaton) to the termination node (the end state of the finite automaton) , the cardinality formula of the regular language of the finite automaton is given by using the adjacency matrix, and the sufficient conditions for the two automata to be unequal are studied.Keyword: finite
5、 automata; regular language; adjacency matrix; 1 引言自动机是计算理论中最简单的数学模型1。它不仅是计算机科学理论的基础, 而且与神经网络和模型论等领域密切相关2-3。有限自动机在软件工程、句法分析、形式语言和程序语言等多个领域得到了有效的应用4-6。由于自动机具有固定的内在状态、记忆能力和识别判断能力或决策能力, 因此它适宜于作为一切信息系统的数学模型7-9。特别的, 在形式语言方面, 自动机提供了一种处理语言的可靠工具10-11。自动机可识别语言12-15是形式语言与自动机理论研究的一个重要领域16-17。从图论的角度讲, 自动机可看作一个有
6、向图。利用图的邻接矩阵可研究图中的路及图中任意两个结点间的可达性等问题。对于一个字符集 上的有限自动机M, 一个字 是 上有限字符串的集合) 可被 M 识别当且仅当在 w 的作用下, 按照状态转移函数, 自动机由初始状态到达终止状态。这表明, 如果把自动机看作一个有向图, 可利用其邻接矩阵, 研究该自动机可识别的语言。因此, 本文利用有向图的邻接矩阵研究有限自动机可识别语言的基数问题。2 有向图的邻接矩阵本节简单回顾有向图及其邻接矩阵的相关知识, 详见文献18。一个图是一个三元组 , 其中 是一个非空的结点集合, 是边集合, 是从边集合 E 到结点元序偶 (有序偶) 集合上的函数。若把图中的边
7、 看作总是与两个结点关联, 那么一个图亦可简记为 , 其中 V 是非空结点集, E 是连接结点的边集。若边 e 与结点有序偶相关联, 则称该边为有向边。每一条边都是有向边的图称有向图。每一条边都有权值的有向图称赋权有向图。根据文献18中简单图的邻接矩阵的定义, 任意一个有向图的邻接矩阵的定义如下:定义 1 设 是一个有向图, 它有 n 个结点 。则 n 阶方阵 称为 G 的邻接矩阵, 其中 , 若从 存在 k 条边, 注 1:在有向图同构的意义下, 有向图与其邻接矩阵存在一一对应的关系, 即有向图确定时, 其邻接矩阵唯一确定, 反之, 邻接矩阵确定时, 其对应的有向图唯一确定。例 1 设图 G
8、 如图 1 所示, 其邻接矩阵是图 1 有向图 G 下载原图文献18中证明, 若 是一个简单图 G 的邻接矩阵, 则中的 i 行, j 列元素表示 等于 G 中联结 的长度为 m 的路的数目。下面证明此结论对任意一个有向图的邻接矩阵仍然成立。引理 119 (乘法原理) 若完成一件事情要经过两个步骤, 其中第一步有 n1种不同的方法, 第二步有 n2种不同的方法, 对完成这件事情共有 n1n2种方法。定理 1 设 A 是有向图 G 的邻接矩阵, 其中 中的 i 行, j 列元素等于 G 中从结点 的长度为 m 的路的数目。证明:对 m 用数学归纳法。当 m=1 时, 由定义 1 可知显然成立。当
9、 m2 时, 假定命题对 m 成立, 由故由假定知, 表示从 vi到 vk的长度为 m 的路的数目, 而表示从 vk到 vj的长度为 1 的路的数目, 故根据引理 1 知, 上式右边每一项表示从 vi经过一条长度为 m 的路到 vk, 再从 vk经过一条边到 vj的总长度为m+1 的路的数目。对所有 k 求和, 即得 是所有 vi到 vj的长度为m+1 的路的数目, 故命题对 m+1 成立。对于图 1, 易得其中 , 表示 G 中从 v1到 v4的长度为 2 的路的数目为 3。如图 1 所示, 从 v1到 v4的长度为 2 的路为 v1v 2v 4, v1v 3v 4和 v1v 3v 4。3
10、有限自动机及其可识别语言为保证本文知识的完整性, 本节回顾有限自动机及其可识别语言的一些基本概念。定义 220有限自动机 M 是一个五元组 , 其中, Q 是一个非空有限集合, 称为状态集; 是一个非空有限集合, 称为字符集;q 0Q 是 M 的初始状态 (或开始状态) ;FQ 是 M 终止状态的集合;:QQ 是一个映射, 称为状态转移函数。对于一个有限自动机 , 每个 qQ 称为 M 的一个状态。若 qF, 则 q 是 M 的一个终止状态 (或接收状态) 。对任意的 (q, a) Q, pQ, = (q, a) 表示 M 在状态 q 读入字符 a 时, 其状态由 q 转移到 p, 即因此,
11、按照结点表示状态, 边表示遵循 的状态转移, 有限自动机 M 可以用一个赋权有向图来表示。与 M 对应的赋权有向图 M的结点集合是 Q, 边集合例 2 给定有限自动机 , 其中定义为与 M 对应的赋权有向图 M如图 2 所示。图 2 有向图 M 下载原图若 是一个非空有限的字符集, 则 是 上有限个字符构成的字符串的集合, 即 。这里 含有空字符 。给定一个有限自动机 , 其状态转移函数 可以诱导定义一个从 Q 到 Q 的映射, 即 :QQ, 其作用法则对任意的若对任意的 , 则称 w 可被自动机 M 识别 (或接受) 。在例 2 中, 若取 则即, 在图 2 中, 则 , 从而 w1不能被自
12、动机 M 识别。若取 , 则即, 在图 2 中, 则 , 从而 w2可被自动机 M 识别。注 2:若 被有限自动机 识别, 则在与 M 对应的赋权有向图 M中存在一条由 w 作为权值的从 q0到 的路, 即, 其中。反之, 因 M 与 M一一对应, 故若在 M中, 存在从的路, 即 可被有限自动机 M 识别。M=给定一个有限自动机 , 中所有可被 M 识别的字符串的集合称为有限自动机 M 可识别的语言, 记作例 2 中4 有限自动机可识别语言的基数本节利用有向图的邻接矩阵研究有限自动机可识别语言的基数。一个集合 S 含有元素的个数称为这个集合的基数 (或势) , 记作 。一个有限自动机 , 对
13、应的有向图记作 M。对任意的 qF, 表示 M中从 q0到 q 的所有路的集合。令由注 2 知, 一一对应, 因此可得命题 1 对于一个有限自动机一个有限自动机 , 对应的有向图 M的邻接矩阵 是一个 的方阵, 用 Q 标识 的行和列。由定理 1 知, 对任意的 qF, 行, q 列的元素表示的是 M中从 q0到 q的长度为 m 的路的数目。因此其中 中 q0行, q 列的元素。进而, 由命题 1 可得以下结论。定理 2 对于一个有限自动机例 3 给定一个有限自动机 , 其中定义为与 M 对应的有向图 M如图 3 所示。图 3 有向图 下载原图有向图 M的邻接矩阵是 其中 N 为自然数集。因例
14、 4 自动咖啡机 M 售出一杯咖啡 15 元, M 只接受 5 元和 10 元的纸币。在确定收到足够的钱时它处于 4 种状态 。M 在投入新的纸币后改变状态, 且终止状态只接受最终金额为 15 元。与对应的有向图如图 4。图 4 咖啡机 M 下载原图其中 a 和 b 分别表示输入的纸币金额为 5 元和 10 元。易知咖啡机M 的邻接矩阵为则 进而 由此可知获取一杯咖啡的投币方式有三种。两个有限自动机 M1和 M2等价当且仅当 因此若 等价, 则 中含有长度为 的字的数目必相等。由定理 1 可得不等价的一个充分条件。推论 1 对于两个有限自动机 , 若存在 , 使得 则 不等价。5 结论利用有向
15、图的邻接矩阵给出了有限自动机的可识别语言的基数公式, 讨论了判定两个自动机不等价的充分条件。这些工作将有限自动机与矩阵联系起来, 为应用矩阵理论处理一些自动机问题奠定基础。参考文献1Panier E R, Tits A L.A superlinearly convergent feasible method for the solution of inequality constrained optimization problemsJ.SIAMJournal on Control and Optimization, 1987, 25:934-950. 2沈恩绍.模型论逻辑与理论计算机科学J.
16、数学进展, 1996, 25 (3) :193-202. 3Alon N, Dewdney A, Ott T.Efficient Simulation of Finite Automata by Neural NetsJ.Journal of the ACM, 1991, 38 (2) :498-514. 4Bertsekas D P.Constrained optimization and lagrange multiplier methodsM.New York:Academic Press, 1982. 5Gao Yuelin, Xue Honggang, Shen Penpin.A new rectangle branch-and-reduce approach for solving nonconvex quadratic programming problemsJ.Applied Mathematics and Computation, 2005, 168:1409-1418.