1、设 G=(V,R)是一个无向图。如顶点集 V 可分割为两个互不相交的子集,并且图中每条边依附的两个顶点都分属两个不同的子集。则称图 G 为二分图。v 给定一个二分图 G,在 G 的一个子图 M 中,M 的边集E中的任意两条边都不依附于同一个顶点,则称 M 是一个匹配。v 选择这样的边数最大的子集称为图的最大匹配问题(maximal matching problem)v 如果一个匹配中,图中的每个顶点都和图中某条边相关联,则称此匹配为完全匹配,也称作完备匹配。最大匹配在实际中有广泛的用处,求最大匹配的一种显而易见的算法是:先找出全部匹配,然后保留匹配数最多的。但是这个算法的复杂度为边数的指数级函
2、数。因此,需要寻求一种更加高效的算法。匈牙利算法是求解最大匹配的有效算法,该算法用到了增广路的定义(也称增广轨或交错轨) :若 P 是图 G 中一条连通两个未匹配顶点的路径,并且属 M的边和不属 M 的边(即已匹配和待匹配的边)在 P 上交替出现,则称 P 为相对于M 的一条增广路径。由增广路径的定义可以推出下述三个结论:v 1. P 的路径长度必定为奇数,第一条边和最后一条边都不属于 M。v 2. P 经过取反操作 (即非 M 中的边变为 M 中的边,原来 M 中的边去掉)可以得到一个更大的匹配 M。v 3. M 为 G 的最大匹配当且仅当不存在相对于 M 的增广路径。从而可以得到求解最大匹
3、配的匈牙利算法:v (1)置 M 为空v (2)找出一条增广路径 P,通过取反操作获得更大的匹配 M代替 Mv (3)重复(2)操作直到找不出增广路径为止根据该算法,我选用 dfs (深度优先搜索)实现。程序清单如下:int matchi /存储集合 m 中的节点 i 在集合 n 中的匹配节点,初值为-1。int n,m,match100; /二分图的两个集合分别含有 n 和 m 个元素。bool visit100,map100100; /map 存储邻接矩阵。bool dfs(int k)int t;for(int i = 0; i 6-2-5-1-4。我们借由它来描述一下二分图中的增广路径
4、的性质:(1)有奇数条边。(2)起点在二分图的左半边,终点在右半边。(3)路径上的点一定是一个在左半边,一个在右半边,交替出现。(其实二分图的性质就决定了这一点,因为二分图同一边的点之间没有边相连,不要忘记哦。)(4)整条路径上没有重复的点。(5)起点和终点都是目前还没有配对的点,而其它所有点都是已经配好对的。(如图 1、图 2 所示, 1,5和2,6 在图 1 中是两对已经配好对的点;而起点 3 和终点 4 目前还没有与其它点配对。)(6)路径上的所有第奇数条边都不在原匹配中,所有第偶数条边都出现在原匹配中。(如图 1、图 2 所示,原有的匹配是 1,5和 2,6,这两条配匹的边在图 2 给
5、出的增广路径中分边是第 2 和第 4 条边。而增广路径的第 1、3 、5条边都没有出现在图 1 给出的匹配中。)(7)最后,也是最重要的一条,把增广路径上的所有第奇数条边加入到原匹配中去,并把增广路径中的所有第偶数条边从原匹配中删除(这个操作称为增广路径的取反),则新的匹配数就比原匹配数增加了 1 个。(如图 2 所示,新的匹配就是所有蓝色的边,而所有红色的边则从原匹配中删除。则新的匹配数为3。)不难想通,在最初始时,还没有任何匹配时,图 1 中的两条灰色的边本身也是增广路径。因此在这张二分图中寻找最大配匹的过程可能如下:(1)找到增广路径 1-5,把它取反,则匹配数增加到 1。(2)找到增广
6、路径 2-6,把它取反,则匹配数增加到 2。(3)找到增广路径 3-6-2-5-1-4,把它取反,则匹配数增加到 3。(4)再也找不到增广路径,结束。当然,这只是一种可能的流程。也可能有别的找增广路径的顺序,或者找到不同的增广路径,最终的匹配方案也可能不一样。但是最大匹配数一定都是相同的。对于增广路径还可以用一个递归的方法来描述。这个描述不一定最准确,但是它揭示了寻找增广路径的一般方法:“从点 A 出发的增广路径”一定首先连向一个在原匹配中没有与点 A 配对的点B。如果点 B 在原匹配中没有与任何点配对,则它就是这条增广路径的终点;反之,如 果点 B 已与点 C 配对,那么这条增广路径就是从
7、A 到 B,再从 B 到C,再加上“从点 C 出发的增广路径”。并且,这条从 C 出发的增广路径中不能与前半部分的增广 路径有重复的点。比如图 2 中,我们要寻找一条从 3 出发的增广路径,要做以下 3 步:(1)首先从 3 出发,它能连到的点只有 6,而 6 在图 1 中已经与 2 配对,所以目前的增广路径就是 3-6-2 再加上从 2 出发的增广路径。(2)从 2 出发,它能连到的不与前半部分路径重复的点只有 5,而且 5 确实在原匹配中没有与 2 配对。所以从 2 连到 5。但 5 在图 1 中已经与 1 配对,所以目前的增广路径为 3-6-2-5-1 再加上从 1 出发的增广路径。(3
8、)从 1 出发,能连到的不与自已配对并且不与前半部分路径重复的点只有 4。因为 4 在图 1 中没有与任何点配对,所以它就是终点。所以最终的增广路径是3-6-2-5-1-4。但是严格地说,以上过程中从 2 出发的增广路径(2-5-1-4)和从 1 出发的增广路径(1-4)并不是真正的增广路径。 因为它们不符合前面讲过的增广路径的第 5 条性质,它们的起点都是已经配过对的点。我们在这里称它们为“增广路径”只是为了方便说明整个搜寻的过程。而这两 条路径本身只能算是两个不为外界所知的子过程的返回结果。显然,从上面的例子可以看出,搜寻增广路径的方法就是 DFS,可以写成一个递归函数。当然,用 BFS
9、也完全可以实现。至此,理论基础部份讲完了。但是要完成匈牙利算法,还需要一个重要的定理:如果从一个点 A 出发,没有找到增广路径,那么无论再从别的点出发找到多少增广路径来改变现在的匹配,从 A 出发都永远找不到增广路径。要用文字来证明这个定理很繁,话很难说,要么我还得多画一张图,我在此就省了。其实你自己画几个 图,试图举两个反例,这个定理不难想通的。(给个提示。如果你试图举个反例来说明在找到了别的增广路径并改变了现有的匹配后,从 A 出发就能找到增广路径。 那么,在这种情况下,肯定在找到别的增广路径之前,就能从 A 出发找到增广路径。这就与假设矛盾了。)有了这个定理,匈牙利算法就成形了。如下:初始时最大匹配为空for 二分图左半边的每个点 ido 从点 i 出发寻找增广路径。如果找到,则把它取反(即增加了总了匹配数)。如果二分图的左半边一共有 n 个点,那么最多找 n 条增广路径。如果图中共有m 条边,那么每找一条增广路径(DFS 或 BFS)时最多把所有边遍历一遍,所花时间也就是 m。所以总的时间大概就是 O(n * m)。