1、遗 传 算 法,绪 论 遗传算法的生物学基础生物在自然界中的生存繁衍,显示出了其对自然环境的自适应能力。受其启发, 人们致力于对生物各种生存特性的机理研究和行为模拟,为人工自适应系统的设计和开发提供了广阔的前景。遗传算法(Genetic Algorithms,简称GA)就是这种生物行为的计算机模拟中令人瞩目的重要成果。基于对生物遗传和进化过程的计算机模拟,遗传算法使得各种人工系统具有优良的自适应能力和优化能力。遗传算法所借鉴的生物学基础就是生物的遗传和进化。 遗传与变异遗传(Heredity) 世间的生物从其父代继承特性或性状,这种生命现象就称为遗传(Heredity),由于遗传的作用,使得人
2、们可以种瓜得瓜、 种豆得豆,也使得鸟仍然是在天空中飞翔,鱼仍然是在水中邀游。, 构成生物的基本结构和功能的单位是细胞(Ce11)。 细胞中含有的一种微小的丝状化合物称为染色体(Chromosome),生物的所有遗传信息都包含在这个复杂而又微小的染色体中。 基因经过生物学家的研究,控制并决定生物遗传性状的染色体主要是由一种叫做脱氧核糖核酸(deoxyribonucleic acid 简称DNA)的物质所构成。 DNA在染色体中有规则地排列着,它是个大分子的有机聚合物,其基本结构单位是核苷酸,许多核苷酸通过磷酸二酯键相结合形成一个长长的链状结构,两个链状结构再通过碱基间的氢键有规律地扭合在一起,相
3、互卷曲起来形成一种双螺旋结构。基因就是DNA长链结构中占有一定位置的基本遗传单位。 遗传信息是由基因(Gene)组成的,生物的各种性状由其相应的基因所控制。 基因是遗传的基本单位。细胞通过分裂具有自我复制的能力,在细胞分裂的过程中,其遗传基因也同时被复制到下一代,从而其性状也被下一代所继承。,生物的遗传方式:1. 复制生物的主耍遗传方式是复制。遗传过程中,父代的遗传物质DNA被复制到子代。即细胞在分裂时,遗传物质DNA通过复制(Reproduction)而转移到新生的细胞中,新细胞就继承了旧细胞的基因。2. 交叉有性生殖生物在繁殖下一代时,两个同源染色体之间通过交叉(Crossover)而重组
4、,亦即在两个染色体的某一相同位置处DNA被切断,其前后两串分别交义组合而形成两个新的染色体。3. 变异在进行细胞复制时,虽然概率很小,仅仅有可能产生某些复制差错,从而使DNA发生某种变异(Mutation),产生出新的染色体。这些新的染色体表现出新的性状。如此这般,遗传基因或染色体在遗传的过程中由于各种各样的原因而发生变化。,进化地球上的生物,都是经过长期进化而形成的。根据达尔文的自然选择学说,地球上的生物具有很强的繁殖能力。在繁殖过程中,大多数生物通过遗传,使物种保持相似的后代;部分生物由于变异,后代具有明显差别,甚至形成新物种。正是由于生物的不断繁殖后代,生物数目大量增加,而自然界中生物赖
5、以生存的资源却是有限的。因此,为了生存,生物就需要竞争。生物在生存竞争中,根据对环境的适应能力,适者生存,不适者消亡。自然界中的生物,就是根据这种优胜劣汰的原则,不断地进行进化。 生物的进化是以集团的形式共同进行的,这样的一个团体称为群体(Population),或称为种群。 组成群体的单个生物称为个体(Individual), 每一个个体对其生存环境都有不同的适应能力,这种适应能力称为个体的适应度(Fitness)。,遗传算法中将n维决策向量Xx1,x2,xnT用n个记号Xi(i=1,2,n)所组成的符号串X来去示:Xxlx2xn Xx1,x2, ,xnT 把每一个xi看作一个遗传基因,这样
6、,X就可看做是由n个遗传基因所组成的一个染色体。 这里的等位基因可以是一组整数。也可以是某一范围内的实数值,或者是纯粹的一个记号。最简单的等位基因是由0和1这两个整数组成的,相应的染色体就可表示为一个二进制符号串。 这种编码所形成的排列形式X是个体的基因型,与它对应的X值是个体的表现型。 对于每一个个体X,要按照一定的规则确定出其适应度,个体的适应度与其对应的个体表现型X的目标函数值相关联,X越接近于目标函数的最优点,其适应度越大;反之,其适应度越小。遗传算法中,决策变量X组成了问题的解空间。对问题最优解的搜索是通过对染色体X的搜索过程来进行的。从而所有的染色体X就组成了问题的搜索空间。,生物
7、的进化是以集团为主体的。与此相对应,遗传算法的运算对象是由M个个体所组成的集合,称为群体(或称种群)。与生物一代一代的自然进化过程相类似,遗传算法的运算过程也是一个反复迭代过程:第t代群体记做 P(t),经过一代遗传和进化后,得到 t+1 代群体,记做 P(t+1),这个群体不断地经过遗传和进化操作,并且每次都按照优胜劣汰的规则将适应度较高的个体更多地遗传到下一代,这样最终在群体中将会得到一个优良的个体X,它所对应的表现型X将达到或接近于问题的最优解X*。,遗传算法的运算过程,主要过程:步骤一:初始化。设置进化代数计数器t0;设置最大进化代数T;随机生成M个个体作为初始群体P(0) 。 步骤二
8、:个体评价。计算群体P(t)中各个个体的适应度。 步骤三:选择运算。将选择算子作用于群体。用各种算法选择适应度好的个体作为优先配对繁殖的个体,使适应度好的基因有更多的机会繁殖后代,使优良生物的基因得以遗传和保留。 步骤四:交叉运算。将交叉算子作用于群体。随机地从配对库中选择双亲进行串处理,得到新一代基因。位串处理时,对随机选择的双亲的位串随机地取一个截断点,将双亲的基因码链在截断点处切开,交换双亲的位串尾部,得到两个后代的基因个体。 步骤五:变异运算。将变异算子作于群体。群体P(t)经过选择、交叉、变异运算之手得到下一代群体P(t+1)。 步骤六:终止条件判断。若tT,则tt+1,转到步骤二;
9、若tT,则以进化过程中所得到的具有最大适应度的个体作为最优解输出,终止计算。,基本遗传算法描述,Procedure GA Begininitialize P(0);t=0;while (t=T) dofor i=1 to M doEvaluate fitness of P(t);end forfor i=1 to M doSelect operation to P(t);end forfor i=1 to M/2 doCrossover operation to P(t);end forfor i=1 to M doMutation operation to P(t);end forfor i
10、=1 to M doP(t+1) = P(t);end fort=t+1end while end,遗传算法的手工模拟计算示例为更好地理解遗传算法的运算过程,下面用手工计算来简单地模拟遗传算法的各个主要执行步骤。例:求下述二元函数的最大值:max f(x1,x2)=x12+x22s.t. x1 1,2,3,4,5,6,7x2 1,2,3,4,5,6,7(1) 个体编码遗传算法的运算对象是表示个体的符号串,所以必须把变量 x1, x2 编码为一种符号串。本题中,用无符号二进制整数来表示。因 x1, x2 为 0 7之间的整数,所以分别用3位无符号二进制整数来表示,将它们连接在一起所组成的6位无符
11、号二进制数就形成了个体的基因型,表示一个可行解。例如,基因型 X101110 所对应的表现型是:x 5,6 。个体的表现型x和基因型X之间可通过编码和解码程序相互转换。,(2) 初始群体的产生遗传算法是对群体进行的进化操作,需要给其淮备一些表示起始搜索点的初始群体数据。本例中,群体规模的大小取为4,即群体由4个个体组成,每个个体可通过随机方法产生。如:011101,101011,011100,111001(3) 适应度汁算遗传算法中以个体适应度的大小来评定各个个体的优劣程度,从而决定其遗传机会的大小。本例中,目标函数总取非负值,并且是以求函数最大值为优化目标,故可直接利用目标函数值作为个体的适
12、应度。(4) 选择运算选择运算(或称为复制运算)把当前群体中适应度较高的个体按某种规则或模型遗传到下一代群体中。一般要求适应度较高的个体将有更多的机会遗传到下一代群体中。,本例中,我们采用与适应度成正比的概率来确定各个个体复制到下一代群体中的数量。其具体操作过程是: 先计算出群体中所有个体的适应度的总和 fi ( i=1.2,M ); 其次计算出每个个体的相对适应度的大小 fi / fi ,它即为每个个体被遗传到下一代群体中的概率, 每个概率值组成一个区域,全部概率值之和为1; 最后再产生一个0到1之间的随机数,依据该随机数出现在上述哪一个概率区域内来确定各个个体被选中的次数。,(5) 交叉运
13、算交叉运算是遗传算法中产生新个体的主要操作过程,它以某一概率相互交换某两个个体之间的部分染色体。本例采用单点交叉的方法,其具体操作过程是: 先对群体进行随机配对; 其次随机设置交叉点位置; 最后再相互交换配对染色体之间的部分基因。,可以看出,其中新产生的个体“111101”、“111011”的适应度较原来两个个体的适应度都要高。,(6) 变异运算变异运算是对个体的某一个或某一些基因座上的基因值按某一较小的概率进行改变,它也是产生新个体的一种操作方法。本例中,我们采用基本位变异的方法来进行变异运算,其具体操作过程是: 首先确定出各个个体的基因变异位置,下表所示为随机产生的变异点位置,其中的数字表
14、示变异点设置在该基因座处; 然后依照某一概率将变异点的原有基因值取反。,对群体P(t)进行一轮选择、交叉、变异运算之后可得到新一代的群体p(t+1)。,从上表中可以看出,群体经过一代进化之后,其适应度的最大值、平均值都得到了明显的改进。事实上,这里已经找到了最佳个体“111111”。,注意 需要说明的是,表中有些栏的数据是随机产生的。这里为了更好地说明问题,我们特意选择了一些较好的数值以便能够得到较好的结果,而在实际运算过程中有可能需要一定的循环次数才能达到这个最优结果。,基本遗传算法应用举例 基本遗传算法在函数优化中的应用。例 Rosenbrock函数的全局最大值计算。max f(x1,x2
15、) = 100 (x12-x22)2 + (1-x1)2s.t. -2.048 xi 2.048 (xi=1,2),如图所示: 该函数有两个局部极大点, 分别是:f(2.048, -2048)=3897.7342和f(-2.048,-2.0048)=3905.9262其中后者为全局最大点。,遗传算法的特点遗传算法是一种宏观意义下的仿生算法,它模仿的机制是一切生命与智能的产生与进化过程。作为一种随机优化与搜索方法,遗传算法有如下特点:(1)遗传算法的操作对象是一组可行解,而非单个可行解;搜索轨道有多条,而 非单条,因而具有良好的并行性.(2)遗传算法只需利用目标函数的取值信息,而无需梯度等高价信
16、息,因而适用于大规模、高度非线性的不连续多峰函数的优化以及无解析表达式的目标函数的优化,具有很强的通用性。(3)遗传算法的择优机制是一种“软”决策,加上其良好的并行性,使它具有良好的全局优化性能和稳健性。(4)遗传算法操作的可行解集是经过编码的,目标函数可解释为编码个体(可行解)的适应值,因而具有良好的可操作性与简单性。,遗传算法的应用遗传算法提供了一种求解复杂系统优化间题的通用框架,它不依赖于问题的具体领域,对问题的种类有很强的鲁棒性,所以广泛应用于很多学科。下面是遗传算法的一些主要应用领域:(1) 函数优化(2) 组合优化(3) 生产调度问题(4) 自动控制(5) 机器人学(6) 图像处理(7) 人工生命(8) 遗传编程 (9) 机器学习,Thank you !,