模拟退火算法的旅行商问题.doc-道客多多

资源描述

1、I人工智能原理实验报告模拟退火算法解决 TSP 问题II目录1 旅行商问题和模拟退火算法 .11.1 旅行商问题 11.1.1 旅行商问题的描述 .11.2 模拟退火算法 11.2.1 基本思想 .12 TSP 模拟退火算法的实现 22.1 TSP 算法实现 .22.1.1 TSP 算法描述 22.1.2 TSP 算法流程 32.2 TSP 的 C 实现 42.2.1 加载数据文件 .42.2.2 计算总距离的函数 .52.2.3 交换城市的函数 .52.2.4 执行模拟退火的函数 .52.3 实验结果 .62.4 小结 .63 源代码 611 旅行商问题和模拟退火算法1.1

2、旅行商问题1.1.1 旅行商问题的描述旅行商问题（Traveling Salesman Problem，简称 TSP）又名货郎担问题，是威廉哈密尔顿爵士和英国数学家克克曼(T.P.Kirkman)于 19 世纪初提出的一个数学问题，也是著名的组合优化问题。问题是这样描述的：一名商人要到若干城市去推销商品，已知城市个数和各城市间的路程（或旅费），要求找到一条从城市 1 出发，经过所有城市且每个城市只能访问一次，最后回到城市 1 的路线，使总的路程（或旅费）最小。TSP 刚提出时，不少人认为这个问题很简单。后来人们才逐步意识到这个问题只是表述简单，易于为人们所理解，而其计算复杂性却是问题的输入

3、规模的指数函数，属于相当难解的问题。这个问题数学描述为：假设有 n 个城市，并分别编号，给定一个完全无向图 G=（V，E），V=1，2，n，n1。其每一边(i,j) E 有一非负整数耗费 Ci,j(即上的权记为 Ci,j，i，j V)。并设 1,ij0ijX边（，）在最优线路上，其他G 的一条巡回路线是经过 V 中的每个顶点恰好一次的回路。一条巡回路线的耗费是这条路线上所有边的权值之和。TSP 问题就是要找出 G 的最小耗费回路。1.2 模拟退火算法模拟退火算法由 KirkPatrick 于 1982 提出 7，他将退火思想引入到组合优化领域,提出一种求解大规模组合优化

4、问题的方法，对于 NP-完全组合优化问题尤其有效。模拟退火算法来源于固体退火原理，将固体加温至充分高，再让其缓慢降温(即退火)，使之达到能量最低点。反之，如果急速降温(即淬火)则不能达到最低点。加温时，固体内部粒子随温升变为无序状，内能增大，而缓慢降温时粒子渐趋有序，在每个温度上都达到平衡态，最后在常温时达到基态，内能减为最小。根据 Metropolis 准则，粒子在温度 T 时趋于平衡的概率为 exp(-E/(kT)，其中 E 为温度 T 时的内能， E 为其改变量，k 为 Boltzmann 常数。用固体退火模拟组合优化问题，将内能 E 模拟为目标函数值f，温度 T 演化成控制参数 t，

5、即得到解组合优化问题的模拟退火算法：由初始解 i 和控制参数初值 t 开始，对当前解重复产生“新解计算目标函数差接受或舍弃”的迭代，并逐步衰减 t 值，算法终止时的当前解即为所得近似最优解，这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制，包括控制参数的初值 t 及其衰减因子 a、每个 t 值时的迭代次数 L 和停止条件 C。1.2.1 基本思想模拟退火算法可以分解为解空间、目标函数和初始解 3 部分。其基本思想是：(1)初始化：初始温度 T(充分大)，初始解状态 s(是算法迭代的起点 )，每个 T 值的迭代次数 L；(2)对 k

6、=1，，L 做第(3)至第 6 步；(3)产生新解 s；(4)计算增量 cost=cost(s)-cost(s)，其中 cost(s)为评价函数；(5)若 t 0 则接受 s作为新的当前解，否则以概率 exp(-t/T)接受 s作为新的当前解；（ 1-）2(6)如果满足终止条件则输出当前解作为最优解，结束程序。终止条件通常取为连续若干个新解都没有被接受时终止算法；(7)T 逐渐减少，且 T 趋于 0，然后转第 2 步运算。具体如下（1）新解的产生和接受模拟退火算法新解的产生和接受可分为如下 4 个步骤：由一个函数从当前解产生一个位于解空间的新解。为便于后续的计算和接受，减少算法耗时，常选择

7、由当前新解经过简单地变换即可产生新解的方法，如对构成新解的全部或部分元素进行置换、互换等。产生新解的变换方法决定了当前新解的邻域结构，因而对冷却进度表的选取有一定的影响。计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生，所以目标函数差的计算最好按增量计算。事实表明，对大多数应用而言，这是计算目标函数差的最快方法。判断新解是否被接受。判断的依据是一个接受准则，最常用的接受准则是 Metropo1is 准则：若 t 0 则接受 S作为新的当前解 S，否则以概率exp(-t/T)接受 S作为新的当前解 S。当新解被确定接受时，用新解代替当前解。这只需将当前解中对应于产生新解时的变换部分予

8、以实现，同时修正目标函数值即可。此时，当前解实现了一次迭代，可在此基础上开始下一轮试验。而当新解被判定为舍弃时，则在原当前解的基础上继续下一轮试验。模拟退火算法与初始值无关，算法求得的解与初始解状态 S(是算法迭代的起点) 无关；模拟退火算法具有渐近收敛性，已在理论上被证明是一种以概率收敛于全局最优解的全局优化算法；模拟退火算法具有并行性。（2）参数控制问题模拟退火算法的应用很广泛，可以求解 NP 完全问题，但其参数难以控制，其主要问题有以下 3 点 7：温度 T 的初始值设置。温度 T 的初始值设置是影响模拟退火算法全局搜索性能的重要因素之一。初始温度高，则搜索到全局最优解的可能性大，但因此

9、要花费大量的计算时间；反之，则可节约计算时间，但全局搜索性能可能受到影响。实际应用过程中，初始温度一般需要依据实验结果进行若干次调整。温度衰减函数的选取。衰减函数用于控制温度的退火速度，一个常用的函数为：(1)()Ttt式中是一个非常接近于 1 的常数，t 为降温的次数。马尔可夫链长度 L 的选取。通常的原则是：在衰减参数 T 的衰减函数已选定的前提下， L 的选取应遵循在控制参数的每一取值上都能恢复准平衡的原则。2 TSP 模拟退火算法的实现TSP 是典型的组合优化问题，模拟退火算法是一种随机性解决组合优化方法。将TSP 与模拟退火算法相结合，以实现对其求解。2.1 TSP 算法实现2.1

10、.1 TSP 算法描述（1）TSP 问题的解空间和初始解TSP 的解空间 S 是遍访每个城市恰好一次的所有回路，是所有城市排列的集合。TSP 问题的解空间 S 可表示为 1,2,n的所有排列的集合，即 S = (c1,c2,cn) | (c1,c2,cn)为1,2,n 的排列），其中每一个排列 Si 表示遍访 n 个城市的一个路径，ci= j 表示在第 i 次访问城市 j。模拟退火算法的最优解与初始状态无关，故初始解为随机函数生成一个1,2,n的随机排列作为 S0。（2）目标函数（ 1-2）3TSP 问题的目标函数即为访问所有城市的路径总长度，也可称为代价函数：112 11, ,ni ni

11、Cccdcdc，现在 TSP 问题的求解就是通过模拟退火算法求出目标函数 C(c1,c2,cn)的最小值，相应地，s *= (c*1,c*2,c*n)即为 TSP 问题的最优解。（3）新解产生新解的产生对问题的求解非常重要。新解可通过分别或者交替用以下 2 种方法产生：二变换法：任选序号 u,v(设 uv n)，交换 u 和 v 之间的访问顺序，若交换前的解为 si= (c1,c2,cu,cv,cn),交换后的路径为新路径，即：si= (c1,cu-1,cv,cv-1,cu+1,cu,cv+1,cn)三变换法：任选序号 u,v 和 (uv)，将 u 和 v 之间的路径插到之后访问，若交换前的

12、解为 si= (c1,c2,cu,cv,c,cn)，交换后的路径为的新路径为：si= (c1,cu-1,cv+1,c,cu,cv,c+1,cn)（4）目标函数差计算变换前的解和变换后目标函数的差值：c= c(si)- c(si)（5）Metropolis 接受准则根据目标函数的差值和概率 exp(-C/T)接受 si作为新的当前解 si，接受准则： 1,0exp(/)ccT2.1.2 TSP 算法流程根据以上对 TSP 的算法描述，可以写出用模拟退火算法解 TSP 问题的流程图 2-1所示：（ -1）（ 2-）4图 2-1 TSP 的模拟退火流程52.2 TSP 的 C 实现2.2.1 加载数

13、据文件下面是加载数据文件的一个例子：中国 31 省会城市数据：1304 2312;3639 1315;4177 2244;3712 1399;3488 1535;3326 1556;3238 1229;4196 1044;4312 790;4386 570;3007 1970;2562 1756;2788 1491;2381 1676;1332 695;3715 1678;3918 2179;4061 2370;3780 2212;3676 2578;4029 2838;4263 2931;3429 1908;3507 23763394 2643;3439 3201;2935 3240;314

14、0 3550;2545 2357;2778 2826;2370 2975;当调用数据文件函数时，包含城市坐标信息的矩阵载入到数组中。2.2.2 计算总距离的函数这是一个城市间计算距离的函数，根据给定路径计算该路径对应总路程。inline double dist(int x1, int y1, int x2, int y2) return sqrt(double(x2-x1)*(x2-x1)+(y2-y1)*(y2-y1);inline double totaldist(path p) int i;double cost = 0;for (i=1; i rnd)curpath = newpath

15、; if (curpath.Length #include #include using namespace std;const int MAXN = 200; /最大城市数const double INIT_T =100000; /初始温度const double RATE = 0.05; /温度下降率 const double FINAL_T = 1E-10; /终止温度const int IN_K = 10000; /内层循环数struct path /定义路径结构类型int CityMAXN; /依次遍历的城市的序号double Length; /所有城市的总长度;int N; /城市

16、数量double DMAXNMAXN; /任意两个城市之间的距离path F_Path; /最优的遍历路径inline double dist(int x1, int y1, int x2, int y2) /计算两点之间的距离return sqrt(double(x2-x1)*(x2-x1)+(y2-y1)*(y2-y1);inline double totaldist(path p) /计算遍历路径总长度int i;double cost = 0;for (i=1; i rnd)curpath = newpath; if (curpath.Length“, F_Path.City+i);p

17、rintf(“ %d“, F_Path.City1);printf(“n“);sa();printf(“最优路径长度: %.4fn“, F_Path.Length);for(int j=0;j“, F_Path.City+j);11printf(“ %d“, F_Path.City1);printf(“n“);end = clock();cost = (double)(end - begin) / CLOCKS_PER_SEC;printf(“%lf secondsn“, cost);/printf(“Elapsed time:%u secs.n“,clock()/CLOCKS_PER_SEC);return 0;

展开阅读全文