1、I人 工 智 能 原 理实 验 报 告模拟退火算法解决 TSP 问题II目 录1 旅行商问题和模拟退火算法 .11.1 旅行商问题 11.1.1 旅行商问题的描述 .11.2 模拟退火算法 11.2.1 基本思想 .12 TSP 模拟退火算法的实现 22.1 TSP 算法实现 .22.1.1 TSP 算法描述 22.1.2 TSP 算法流程 32.2 TSP 的 C 实现 42.2.1 加载数据文件 .42.2.2 计算总距离的函数 .52.2.3 交换城市的函数 .52.2.4 执行模拟退火的函数 .52.3 实验结果 .62.4 小结 .63 源代码 611 旅行商问题和模拟退火算法1.1
2、 旅行商问题1.1.1 旅行商问题的描述旅行商问题(Traveling Salesman Problem,简称 TSP)又名货郎担问题,是威廉哈密尔顿爵士和英国数学家克克曼(T.P.Kirkman)于 19 世纪初提出的一个数学问题,也是著名的组合优化问题。问题是这样描述的:一名商人要到若干城市去推销商品,已知城市个数和各城市间的路程(或旅费) ,要求找到一条从城市 1 出发,经过所有城市且每个城市只能访问一次,最后回到城市 1 的路线,使总的路程(或旅费)最小。TSP 刚提出时,不少人认为这个问题很简单。后来人们才逐步意识到这个问题只是表述简单,易于为人们所理解,而其计算复杂性却是问题的输入
3、规模的指数函数,属于相当难解的问题。这个问题数学描述为:假设有 n 个城市,并分别编号,给定一个完全无向图 G=(V,E) ,V=1,2,n,n1。其每一边(i,j) E 有一非负整数耗费 Ci,j(即上的权记为 Ci,j,i,j V)。并设 1,ij0ijX边 ( , ) 在 最 优 线 路 上, 其 他G 的一条巡回路线是经过 V 中的每个顶点恰好一次的回路。一条巡回路线的耗费是这条路线上所有边的权值之和。TSP 问题就是要找出 G 的最小耗费回路。1.2 模拟退火算法模拟退火算法由 KirkPatrick 于 1982 提出 7,他将退火思想引入到组合优化领域,提出一种求解大规模组合优化
4、问题的方法,对于 NP-完全组合优化问题尤其有效。模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其缓慢降温(即退火),使之达到能量最低点。反之,如果急速降温(即淬火)则不能达到最低点。加温时,固体内部粒子随温升变为无序状,内能增大,而缓慢降温时粒子渐趋有序,在每个温度上都达到平衡态,最后在常温时达到基态,内能减为最小。根据 Metropolis 准则,粒子在温度 T 时趋于平衡的概率为 exp(-E/(kT),其中 E 为温度 T 时的内能 , E 为其改变量,k 为 Boltzmann 常数。用固体退火模拟组合优化问题,将内能 E 模拟为目标函数值f,温度 T 演化成控制参数 t,
5、即得到解组合优化问题的模拟退火算法:由初始解 i 和控制参数初值 t 开始,对当前解重复产生“新解计算目标函数差接受或舍弃”的迭代,并逐步衰减 t 值,算法终止时的当前解即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制,包括控制参数的初值 t 及其衰减因子 a、每个 t 值时的迭代次数 L 和停止条件 C。1.2.1 基本思想模拟退火算法可以分解为解空间、目标函数和初始解 3 部分。其基本思想是:(1)初始化:初始温度 T(充分大),初始解状态 s(是算法迭代的起点 ),每个 T 值的迭代次数 L;(2)对 k
6、=1, ,L 做第(3)至第 6 步;(3)产生新解 s;(4)计算增量 cost=cost(s)-cost(s),其中 cost(s)为评价函数;(5)若 t 0 则接受 s作为新的当前解,否则以概率 exp(-t/T)接受 s作为新的当前解;( 1-)2(6)如果满足终止条件则输出当前解作为最优解,结束程序。终止条件通常取为连续若干个新解都没有被接受时终止算法;(7)T 逐渐减少,且 T 趋于 0,然后转第 2 步运算。 具体如下(1)新解的产生和接受模拟退火算法新解的产生和接受可分为如下 4 个步骤:由一个函数从当前解产生一个位于解空间的新解。为便于后续的计算和接受,减少算法耗时,常选择
7、由当前新解经过简单地变换即可产生新解的方法,如对构成新解的全部或部分元素进行置换、互换等。产生新解的变换方法决定了当前新解的邻域结构,因而对冷却进度表的选取有一定的影响。计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生,所以目标函数差的计算最好按增量计算。事实表明,对大多数应用而言,这是计算目标函数差的最快方法。判断新解是否被接受。判断的依据是一个接受准则,最常用的接受准则是 Metropo1is 准则:若 t 0 则接受 S作为新的当前解 S,否则以概率exp(-t/T)接受 S作为新的当前解 S。当新解被确定接受时,用新解代替当前解。这只需将当前解中对应于产生新解时的变换部分予
8、以实现,同时修正目标函数值即可。此时,当前解实现了一次迭代,可在此基础上开始下一轮试验。而当新解被判定为舍弃时,则在原当前解的基础上继续下一轮试验。模拟退火算法与初始值无关,算法求得的解与初始解状态 S(是算法迭代的起点) 无关;模拟退火算法具有渐近收敛性,已在理论上被证明是一种以概率收敛于全局最优解的全局优化算法;模拟退火算法具有并行性。(2)参数控制问题模拟退火算法的应用很广泛,可以求解 NP 完全问题,但其参数难以控制,其主要问题有以下 3 点 7:温度 T 的初始值设置。温度 T 的初始值设置是影响模拟退火算法全局搜索性能的重要因素之一。初始温度高,则搜索到全局最优解的可能性大,但因此
9、要花费大量的计算时间;反之,则可节约计算时间,但全局搜索性能可能受到影响。实际应用过程中,初始温度一般需要依据实验结果进行若干次调整。温度衰减函数的选取。衰减函数用于控制温度的退火速度,一个常用的函数为:(1)()Ttt式中是一个非常接近于 1 的常数,t 为降温的次数。 马尔可夫链长度 L 的选取。通常的原则是:在衰减参数 T 的衰减函数已选定的前提下, L 的选取应遵循在控制参数的每一取值上都能恢复准平衡的原则。2 TSP 模拟退火算法的实现TSP 是典型的组合优化问题,模拟退火算法是一种随机性解决组合优化方法。将TSP 与模拟退火算法相结合,以实现对其求解。2.1 TSP 算法实现2.1
10、.1 TSP 算法 描述(1)TSP 问题的解空间和初始解TSP 的解空间 S 是遍访每个城市恰好一次的所有回路,是所有城市排列的集合。TSP 问题的解空间 S 可表示为 1,2,n的所有排列的集合,即 S = (c1,c2,cn) | (c1,c2,cn)为1,2,n 的排列) ,其中每一个排列 Si 表示遍访 n 个城市的一个路径,ci= j 表示在第 i 次访问城市 j。模拟退火算法的最优解与初始状态无关,故初始解为随机函数生成一个1,2,n的随机排列作为 S0。(2)目标函数( 1-2)3TSP 问题的目标函数即为访问所有城市的路径总长度,也可称为代价函数:112 11, ,ni ni
11、Cccdcdc,现在 TSP 问题的求解就是通过模拟退火算法求出目标函数 C(c1,c2,cn)的最小值,相应地,s *= (c*1,c*2,c*n)即为 TSP 问题的最优解。(3)新解产生新解的产生对问题的求解非常重要。新解可通过分别或者交替用以下 2 种方法产生:二变换法:任选序号 u,v(设 uv n),交换 u 和 v 之间的访问顺序,若交换前的解为 si= (c1,c2,cu,cv,cn),交换后的路径为新路径,即:si= (c1,cu-1,cv,cv-1,cu+1,cu,cv+1,cn)三变换法:任选序号 u,v 和 (uv),将 u 和 v 之间的路径插到 之后访问,若交换前的
12、解为 si= (c1,c2,cu,cv,c,cn),交换后的路径为的新路径为:si= (c1,cu-1,cv+1,c,cu,cv,c+1,cn)(4)目标函数差计算变换前的解和变换后目标函数的差值:c= c(si)- c(si)(5)Metropolis 接受准则根据目标函数的差值和概率 exp(-C/T)接受 si作为新的当前解 si,接受准则: 1,0exp(/)ccT2.1.2 TSP 算法流程根据以上对 TSP 的算法描述,可以写出用模拟退火算法解 TSP 问题的流程图 2-1所示:( -1)( 2-)4图 2-1 TSP 的模拟退火流程52.2 TSP 的 C 实现2.2.1 加载数
13、据文件下面是加载数据文件的一个例子:中国 31 省会城市数据:1304 2312;3639 1315;4177 2244;3712 1399;3488 1535;3326 1556;3238 1229;4196 1044;4312 790;4386 570;3007 1970;2562 1756;2788 1491;2381 1676;1332 695;3715 1678;3918 2179;4061 2370;3780 2212;3676 2578;4029 2838;4263 2931;3429 1908;3507 23763394 2643;3439 3201;2935 3240;314
14、0 3550;2545 2357;2778 2826;2370 2975;当调用数据文件函数时,包含城市坐标信息的矩阵载入到数组中。2.2.2 计算总距离的函数这是一个城市间计算距离的函数,根据给定路径计算该路径对应总路程。inline double dist(int x1, int y1, int x2, int y2) return sqrt(double(x2-x1)*(x2-x1)+(y2-y1)*(y2-y1);inline double totaldist(path p) int i;double cost = 0;for (i=1; i rnd)curpath = newpath
15、; if (curpath.Length #include #include using namespace std;const int MAXN = 200; /最大城市数const double INIT_T =100000; /初始温度const double RATE = 0.05; /温度下降率 const double FINAL_T = 1E-10; /终止温度const int IN_K = 10000; /内层循环数struct path /定义路径结构类型int CityMAXN; /依次遍历的城市的序号double Length; /所有城市的总长度;int N; /城市
16、数量double DMAXNMAXN; /任意两个城市之间的距离path F_Path; /最优的遍历路径inline double dist(int x1, int y1, int x2, int y2) /计算两点之间的距离return sqrt(double(x2-x1)*(x2-x1)+(y2-y1)*(y2-y1);inline double totaldist(path p) /计算遍历路径总长度int i;double cost = 0;for (i=1; i rnd)curpath = newpath; if (curpath.Length“, F_Path.City+i);p
17、rintf(“ %d“, F_Path.City1);printf(“n“);sa();printf(“最优路径长度: %.4fn“, F_Path.Length);for(int j=0;j“, F_Path.City+j);11printf(“ %d“, F_Path.City1);printf(“n“);end = clock();cost = (double)(end - begin) / CLOCKS_PER_SEC;printf(“%lf secondsn“, cost);/printf(“Elapsed time:%u secs.n“,clock()/CLOCKS_PER_SEC);return 0;