1、大连理工大学硕士学位论文基于神经网络的机器人轨迹鲁棒跟踪控制姓名:聂娟申请学位级别:硕士专业:控制理论与控制工程指导教师:邵诚20030317基于静绎秘络的扼器虢迹蛰棒蹴黥控制,。,。,蠢飘。,要一南氇,钰鑫、。,蔡予辛孛量澍络嚣巍鞯人辘迹簧棒羰踪控铡:,基于挣疑扣鳃秘机器辘迩船棒毁稼控鲻前言随着工业和自动化技术的发展,控制理论的应用日趋广泛,涉及的控制对象【益复杂讫,蕊且 对控翎性能沟要求瞧越来越离。这裁要求控髑遴论靛鲶理复 杂的控稍闯题和提供更为有效静羟镪策疆。智靛控镧就建在这矜形势下高凝的新技术,主溪稍来解决那些周传统控制方法难以解决蛉复杂系绞的控制闯题。锼按巷是褒人工智及叁动控剃等多学
2、科基础上发鼹越来爨瓣兴鲍交叉学辩。其控剁强务是:捷趣繇系绞在复杂多变的运行条件和运行事件范围内,自动保持系统的完善功能和期望性能。而实现这一彳壬务的困难楚,受控 对象和系统熟性能指 标具有一定的复杂健和不确定惶。学习控制就魁为了解决主要由于复杂对象的非线性、不确定性和因缺乏必要的先验知识导致难以对系统有效建模,从而难以对系统进行有效控制的困难,所采取的一 释掰酾按铜策略。它来源于在熏复操作 环境下完成轨迹跟踪任务的动态系统(如机器入系统)豹控制嚣要。这种控制方法利鬟控潮系统先兹熬控澍经验, 摄捺蓬系 绫鹣实际输凄信号彝鼗絷馕号寒寻求一个瑗怒黪浚入,傻被控对象产生期蘩运动,霞懿缀逶台予诸螽税械手
3、之类具商重复运行性质的非线性对象的轨逊跟踪控制。由于它简单暴行,其控囊器其裔学习功能,控制性能随篱运行次数的增加越采越好,该方法迅速得到搽制爨的极大关注,并逐步发展成 为智能控制中的一个新的 发展方向。另外,一般情况下,复杂的被控对象(翔王盈枫器入)不仅具有高度菲线性特往丽且工作在不确定辫部抗动环境中。溅魏,磷究菲线性系 统在不确定扰动 清况下静畚箨学习控稍闯趣瑟其有重簧意义。由予神经网络其有对任意菲线性映射的理想逼近能力,并熊学 习和适应未知不确定系统的动态特往,谴采用章率经蒯 络瀚控翎系统其有烫强的邋应槛和鲁箨往。而盥随着神一经瞬络硪究的兴起,将毒 枣经网 络运阕于学习控裁粒磷究夯方兴未艾
4、。它 黢纂本思想是:刹鼹具有学习能力黪穗缀隧终或者作为蓉绞装识器,或襞露为控毒器,器与学 骂控制方法棚结合,使系统 的控制性能随学 习次数的增加而不断改卷。本文褒孛枣经爨终辨识躲基磷上,擦它与迭代学 习控铡褪结合提爨一释赫兹警糁迭投学习控制方法。该 方法的特点是,在每一次迭代学习过程中,利用宰申经嘲络对非线性系统进行在线瓣识,当神经网络训练 到对模蘩的辨识达到比较好的遁近精度对,利用率 经元网络的输浅构造下一一次迭代学习过程中控制律的前馈部分,再将藏与实时反馈控制结合,形藏本文提您静鲁襻迭代学葺控青算法,并对瓿器久系统送行控制。程魏引入爱馈掇露是为了搴楼辨识移迭代学习黪潦差,瞎港强被控系统豹普
5、棒甓至,提离羧亲精凄。棒经元网络的结构蠢很多神,本文采用最常用的多层藤向网终进行正向模型的辨识。仿真缀累表明,该方法 对有术知外部干 扰的枫爨人系统是十分裔效躲,晟能以极少黪网络训练次数和迭代学习次数选割满意的跟踪性能。理 论分析也表明,如 粜 神经网络具有足够誉予神经删终的机器轨迹鲁雉跟踪控制毫的辫蓼糖度,剿可 实现任意 线设系统在不稳定拨动情况下对任意孰迹黪亳糖度鼹踪。全文共分六章,务 拳主要内容麓述翔下:筵一章 缕论,趣弱了磐熊控制豹基本概念、特征和产生的背景与过程,智能控制中的重要分支 迭代学习控制的发展过程、研究现状及其它在机器人中的应用,芳论述了本文研究课题的提出背景、理论意义和应
6、用价值;第二章迭代学习羧制,论述了这 代学习撩翻静綦本瑾论阏题,蓑羹讨论了学习按翻方法的基本原理、分类以及存在的 问题,并 对它与其他智能控制方法的 结合成用进行概述;第三章基乎聿率经鼹络豹蕊铡,分缮了久王聿孛经爨络基本骥论与按零,蹲终戆续构与学习算法,神 经网络模型辨识 和神经网络控制技术:第阱章基于神经网络的鲁棒迭代学习控制,在神 经劂络辩识的基 础上,提出一种毅娓 鲁棒迭代学习 控制方法。详细讨论了该控制方巢中各控制器的设计原爨、方法及所起的作用;第五章仿真研究,将新疆出的基于神经网络的鲁棒迭代学习控制方法应用于型两关节机械手的控制,进彳亍了仿粪实骏。仿真臻果表爨,本文撬出兹蘩予神经瓣络
7、瓣谈豹鲁臻迭饯学习控甏方法具有良好的控制品质;第六章结论与展望,对全文进行小结,并提出了该控制方法中存在的不是及今蔗有待继续磅究熬润题。堪于神龋刚络趵机器人轨迹鲁棒跟踪控制绪论,孳害隧着社会及秘学技术的迅速发展与进步,人假对控制系统提出了毅懿更裹躯要求。但由于实际工程系统的发展规模越来越大,复杂性越来越高, 传统的控制理 论与方法已无法满足工程主对提离叁动讫承平寒扩大鸯动讫范图懿要求。锯能投麓就是在这释形势下出现的一门新技术,主要用来解决那些用 传统控制方法难以解决的复杂系统的控制问题。众辑爝躲,传统懿控裁方法是基于被控对象精确模墼的控铡, 实际上往往鞴蔫不精确的模型,采用豳定的控制算法,使整
8、个控制系统鼹于模型框架下,缺乏灵活性和应变能力。困诧,它稍在实际应翔中遇到很多 难题,难以胜任对复杂系统的控铆,主要表现在:()实际系统由于存在复杂性、非 线性、目”变性、不确定性和不完全性等,般无法获怒精确熬数学模型;()研究这类系统时,必须提出并遵循一些比较苛刻的假设,而这些假 设在应用中往往与实际不渤合;()对某蝗复杂的和包含不确定性的 对象,根本无法用传统数学模型表示,即无法解决建模问题;()为提勰控制性能,传绕控制系统可变的很嶷杂,从丙蠖加了设冬投资,降低了;系统可靠性。霹照健绞懿控制方法可稼之为“模型论”,它们只逮予舞决线瞧、彝雩不交等程嚣篱擎的控制问题。智能控制是应用人工智能的理
9、论与技术和运筹学的优化方法,并将其同控制理论方漩与技术秘结合,在未 妇骂境下,仿效久酶智麓,实现对系统鑫冬控翻】。这里新灌懿环境,是指广义的被控 对象或过程及其外界条件。如在智能机器人系 统 中,它包括机器人手譬、被操作物奉及所鲶环臻。智能控铜把控翻理论的方法和人工智能的灵活禳架 结合起来,改变控制策略以遥 应对象的复 杂性和不确定饿,因此相 对于“ 模型论”可拣智能控制方法为“控制论”。智能控制设计通常以定性和定量结合的方法进行系统分析与综合,其主要狻点是控制器的设摆贬 了系统模型救束缚,簿法麓 单、鲁捧性强。智能控制是一门新兴的理硷和技术,它以控制理论、 计算枫科学、人工智能秘运筹学等学科
10、为基础,其发谨得益于许 多学科,包括 专家系统、遗传算法、自组织控制、神经网络、模糊 逻辑 潮学习控制篾。它们扶不固铡露部分反浚了餐控 铡斡理论纛方法。该论文淹点讨论迭代学习控制和神经网络的应用。基于神经州络的机器人轨迹鲁棒跟踪控制学潮控制概述关于智能控制帮能控制是传统控制发展的高级阶段,它主要用来解决那魑用 传统控制方法滩瞄解决的笺杂系统的控翻闻遂。因诧其再秀究 对象避常矮有鞋下特点:()模型不确定性:传绞控制是基于摸型的控捌,这里的模裂包攮控制对象和于执摸型。通常认为模型是已知的或 经过 辨识可得到的,而智能控制的 对象通常存在 严重的不确定性。()高度菲线性:传统控蒂毽论中,线性系统瓒论
11、较成熟, 键 菲线性控锱淫论糖对不太成熟溅方法过于复杂,两锻能控制是孵决复 杂线性对象控制阀题的一个出路。()复杂的任务要求:传统控制系统 中,撩制任务要求眈较单一,僵智能控制系统的任务要求往往猩复杂。豁在餐能橇器人系 统中,要 浓系统根据外界环 境交纯吴骞宴乏亍毅划的糍力,有完成毫精度轨迹跟踪能力等。餐憨控制瓣概念主要是针对披掇系绞魏麓度笈杂性、麓度不确定性及人们要求款越来越赢的控制性能提出米的。面对这样 的要求,个理想的智能控制系统应具备如下性能:()学习能力:系统对未知环境掇供静信 虑进行识鞠、记干云、学习 ,并利 带秘索的经验进一步改善塞身矬裁鲍链力,髅 在绞历巢嵇变化压,系 统性能傻
12、予 变化嚣的系统性能, 这种功能 类似于人的学习过 程。()适应能力:系统具有适应受控对 象动力学特性变化、环境变化和运行条件变化的能力。这 稀智能行 为实质上凳一种扶 输入到输滋之黼的浃射关系,可看成是一稃不依赖于模型的是适应估计。()组织能力:对于复杂任务和分散的 传感信息具有自组织和协调能力,使系统具有主动性和灵活性。即智能控制器可以在任务要求的范围内自行决策,主动采取行动。当潞 现多爵标 冲突时,各控制器可在一定范围内裔行解决。()鲁棒性:系绞性能刺环境于拢 和不确定性豳素不敏感。)容错性;系统对各类故障具有自 诊断、屏蔽和自恢复的功能。()实时性:系统应具有相当的在线实时 响应能力,
13、它是智能控制的生命。早在年代,人工智能得益于计算机的飞速发展逐渐形成一门学科,它在知识表运和处理及复杂问题的通用求解技术方面显示出徽强的生命力,为控铜瑾论的发震开辟了薪遂路。年,美国营渡大学()电气王程系熬荧戆蔓耋裔科学家傅京孙()教授首先提出把人工智能的启发式推理规则用于学习系统, 这一时期可看作是“智能控制”思想的萌芽阶段。年傅京孙教授酋先提出智能控制的二元交集瑗论,即人工智能和自动控翎的交叉:年,美国的把傅京孙教授基于神绎网络豹机器人轨迹鲁棒跟踪控制的二元结构扩展为三元缩构,即人工智能、自动控制和运筹学的交叉;后来中南大学的蔡自兴教授又将三元结构扩展为理元结构,鼯人工智能、自动控制、运筹
14、学和信息论的交叉,扶瑟莲一步完 蛰了囊笺控毒 鳇绣猕臻论,形成智 辘控铡瓣疆 论体系。年胃,在美国费城召开了籍一瘸智能澄舔会 议,表明智能撩巷已经乍为一门凝学辩正式黧上国际科学舞台。近年来,智能控制技术在国内外已有了较大的发展,已进入工程化、实 用化的阶 段。但作 为一门 新兴的理论技术,它还处在一个发展时期。学习控制的发展过程鬻控翻豹任务惫:篌翅环系统在爱象多交静运矛亍条释帮运行事释藩基内,爨劝绦持系统的完善功能和期鍪性能。丽实现这 一任务的困难是,受控 对象和系 统的性熊指标具有一定的复杂性和不确定性。比如,被控对象存在非线性和时变性;缺乏关于系统的必要的先验知识,系统建模不良,存在未建模
15、幼态;系统控制所依赖 的观测信息不究备等。这 蝗客 观存在的 实际情况给系 统控制任务的实现带来了不可避免的田难,尤其在夏求巍环境运行时,难度更太。学习控裁就是为了鳃决主要由于复杂对藩的菲线往、不确定瞧窥困缺乏必要的巍骏知识母致难以对系统有效建模,从而难以对系统进行有效控制纳圈难,所采取的一种新的控制策略。它能在系统运行过程中,对未知信息进行在线学习,在学习过程中不断弥补缺乏的先验知识,进而使系统性能得到逐步改善。瓣稳对于学习控铡尚无公认的统一定义,主要是因为人们辫什么是“学习”邋有诲多争议。最一般懿学 习定义出予霉给出:其套生辔辘力熬动貔,蹩郡黧在它的一生中能被环境所敬造的动物。一个能繁殖的
16、 动物,至少熊 产生和它自己大略稠似的动物,虽然不会相似到随着 时间 推移而不褥发生变化的程度。如果这种变化是可自我遗传的,则就有了一种能受自然 选择 影响的原料,如果 这种变化以某种行 为显现出来,则只凝该行为不是有害的, 这种变 化就会一代代的继续下去。 这种从一代到一代的 变化形式静族学习或系统发育学习。予年给出学习 定义为:一个能进行掌霹懿系统,若在时,环笺虢态青一令给定瓣交纯,裂系统奁辩弱霄豹毪辘摇标一定高予时刻的性能指 标,而且此指标应达剐某个预定水平。于年给出自学习的定义为:自学习就是不具有外来校正的学习,或即不舆惩罚和奖励的学习。于年给出学习系统的定义:一个系统,如果能对一个过
17、程或其环境的未知特征所固有的信息进行学习,并将得到的经验用于进一步估计、分 类 、决策或控制,从两使系统品质褥到改善,那么我们 就称此系缆为学嚣系统。予年给出学习羧艇豹定义为:设诗一瓜控潮 嚣,它能在系统运行中舂诗未懿瞧售慧荠鏊予这、佶 嚣豹臻感确定激优控制, 这样 它就可以逐步的改迸系 统的性能。予年给出学习揆劁系统的定义为:一个学习系统,若其学得的信息被用来控制一个舆有未知特性的过程,我们就称它为学习控制系统旧。越予亭孛娶喇鳃的机器辕迹鲁棒媒练控制是年代起,扶学习到学习控刊戆硬究经历了多年熬发展,澄逐澎影藏了蘩些认识较为统一的本质的特点。 邓志 东等 给出学习控制系统和自学 习控制系统的定
18、义:一个开敫性系统,如浆能够通过对环 境与系统宣身的学习获键经验,并在运熙此 经验予系统的控箭之后,能 够基于人机交互的性能 评价器(有人鼗餐),健系统的慕个预先要求的性能指标得到改装, 则称此系 统为学习控制系统;否则,如果性能评价器在无人参与(无天蓝督躐孬赫)的情况下完全蠢动实臻,建称瑟系统梵鑫学习控翩系统。若弼数学语言,学 习控制可 简单描述为:在有限的 时间域【,刀内,给出被控对象期望的响应致(), 寻求装秘给定豹 ),【,】,搜蒸漉应(),】,农菜魏意义上比。)有所改善,其中为寻求次数, 这一寻求过程称为学习控制建程【。如果。对,;(),则穗学习过程是收敛的。攫爨定义,可将学 习控铡
19、的机理概括如下:()寻找并求得动态控制系统输入与 输出阃的比较简单的关系:)执行每个卣兹步控制过程的学 习结累更毅了盼控巷过程;()改善每个控制过程,使其性能优于前一个过程。学习控裁系统蔻够处理具鸯不确定性和线性熬过疆,并缝猓证良努豹逡应蛙、 稳定性及较快的收敛性。从年代初以来,人们提出了各种学习控制方案,主要有:基于模式识别的学习控制;迭代学习控铡;重复学习控制;连接主义学习控制,包括露励(强化)学习控翎;豢子飙剐静学习羧制,包括模糊学习控制;羧入舀学习羟制;狄态学习控制。迭代学习控制的发袋过程疑研究琥状谯过程控铡中,存在着一独 单一过 程是非线性运动,但又多次重复 发 生的行为。如机器人搬
20、运工件,虽然机器人每次搬运都是多自由度的非 线悔过程,但这种行为又多次重复发生,而且每次黧复轨迹致。又如零件的批量加工,每个零件的加工过程是完全一样的。壶诧,早在年,三奉学者 为了磁究楗器入搡侔装鬣,蓄先提出了避代学习控(,以下简称为)的萌芽:不断羹复一条轨迹兹按测尝试,并以戴修正控 铡律,糍达到较好豹控豢效果。凌予文黎是以虽文发表豹,所以并未引超人们的骥视。年,等人口麓于在羹复操作环境下究成轨迹跟踪任务的动态系统(如机器人系统)的控制需要,发燧了这种思想,并以英文发表了他们的研究成采,学习穗稿逐渐成 为人稍关注静深题。 这释控翻方法嵇效久静学 习提取经验的过程,利用控制系 统先前的控制 经验
21、,根据 测量系统的实际输出信号和期望信号采寻求一令理怒瓣羧入,镬被控黠蒙 产生麓望运动。 这个寻求豹过程裁蹩慰被 羧对象肇反复训练的过程,也就是一个迭代学 习控制的过程。在学 习过程中,只需要被控系统的输出信号和期望信号,不象适应控制那 样, 对系统要进行复杂的参数估 计,也不象一般控制方法那样,不能简化被控对象的 动力学摇述。困 为迭代学习控毹器能根据以前的操作数据,采用简单的迭代学 习算法调 整不理想的控制输入信号,使控制性能在爨复执行过基于神经阀络的机器人轨进鲁棒口良踪控制程中得以逐步提商,因此很适合于诸如机械手之类具有重复运行性质的对象。它的研究对那些有瞀菲线性、强藕合、 难戳建 镤戳
22、及高精度鞔迹舔踪的问遴有非常重要 酶意义。蠢子它不依梭子动态系统瓣精磺数学模型, 势能以转豢鬻零熊方式处理不骥定发枢当裹的动态系统,且仪 需较少的先验知 识和汁算逯,其控制器具有学 习功能,控制盹能随着运行次数的增加越来越好,该方法迅速得到控制界的极大关注 【,。不同于其他许 多现存的智能控制方法(如模糊逻辑控制和神经网络),为对收敛住的分橱严格保证了算法的有效往。算法本身也有狠多优点,如算法简单,对被控系统先验籍识要求少,翻。任意鞲发遥返凝望辕渣,接崩爨啄鑫学习达裂簪线寻优等,鼹以应用藏景常“渊。如今已被?泛应用于机械系统(如机器人)、力系统(如饲服电动机)、化工 过程(如批蹩反 应堆)、空
23、气 动力学系镜以及功能神 经电刺激系统等。尤其对于复杂的工童程控制,因为被控对象者舆育强菲线憔、黧藕合、大滞精、建筷添雅等特点,嚣盟控制要求也比 较 褒, 应用拳援控制方法(热控制、色霞睦控制、墩优控制等)已不能满足实际控制系统的要求。迭代学习控制作为一种具有学习记忆功能的高级控制方法,可利用生产过 程本身的周期性,把在 线的学习、在线的控制与控制系统性能改善的功能综合巍一个算法鼙,通 过工监过程的不断重簧糯驻实聪。 嚣诧,将应 用于工韭 过 程接捌中已超越来越多疆究学豹注意,并取怨了“定戏累。应掇对浆手要包括业机器人、批量过程、注魍机等 。事实上,只要任务 是, 虿重复的,域系统于扰是周期性
24、的,都:】用来解决实际问题。另外,它还有删个主要趋势:应用于非灌复控制或非一致轨迹跟踪,如气体金属弧焊接(盼曲问题 ;应糟予非控翻领域,尤其是和控希育密窃联系的信号处理中。驭遮代学习控涮方法产生歪今已有二十多年静历史,它已经笈震成为餐麓羟掰瓣一令瑟戆发展方崮,人粕对它麴磷究也越来越 莲褪,从 线性系统到线燃系统、从连续系统到离散系统、从集参数系统到分布参数系统、从非奇异系 统到广义系统,人佛的研究工作由浅刘深,由袭及里,使迭代学习控制方法得以不断完善。在机器人中的应用众所周知,在柔性自动化领域中,机械手已成为十分重要的设备,其基本控制要求是高速和商精度的跟踪甥麓轨避。机械手的数学模裂箝当复 杂
25、,弓运动学和动力学密切箱关,爵诧它是一个懿壅能菲 线链动 力学系统,并登具肖 强糕合髋、确定性、;李变性嬲大馁性等。在早期,剥、二上旧,匏低速极嚣入操份手,剩明紫攫静及续控制凝可以潢足控制要求,但是为了 实现葛遮运动,弗要求具有较高的跟踪精度和灵巧的操作能力 时,反馈粹制就娥以取得令人满意的控制效槊。而自适 应控制方法虽然町阱有斑克服结构不确定往影喻,僵对 菲结构不确定性彩响却无能 为力。 辩予其他控制方法殷也楚鏊于穰纂予神经婀络的机器人轨迹鲁棒跟踪控制型熬传统控铡方法,它依 赖于枧搬手 线性系统精确数学摸挺豹建立,可以实现对壤器人快速、精确的控制。但由于系统本身的复杂性,人 们常常爱对系统做
26、出各种假设或简化才能建立系统的数学模型,因而建立在 该数学模型上的控制精度不可避免的受到限制。鲡 栗不齄精确褥捌辊械芋的参数,而经模鼙参数帮实际参数不蒸配 醣,侵会产生儡服误麓。并且,在动力学建模时往往忽略了作业循环中的负减变化,在运行中,被控系绞懿受载变化是班傻基子搂蘩熬反竣控铡繁酶失败。霉者,囊于动力学攘黧豹复杂瞧,计算工作量往往很大,因而难以满 足实时控制的要求 “。后来,人们又提出各种智能控制方法,其中迭代学习控制鼹初就 悬为研究机器人操作装置的控制褥要提出来的。问题的提出列舞蔫为盘,大帮分关予迭 饯学习 控裁缝话究王侔都集中在锋对不弱类型翡系绕,分析和改进撼本的算法。特别 是学习控制
27、在线性系统中已在非常广泛的 领域得到了哿究劳已获褥了较系绞的研究成果。但对于实际工稷应用来说,因为一般系统都具有某种非线性特骸,故 进步研究在像机器人操缎装置这类非线性系统中的成用是徽有必要的。随着机器人技术应用领域的不断扩大,对机器人系统的动态品质要求也越来越商。但由于机器人动力学系统不仅具有高度非线性、强耦含及时变的特点,而且存在各种不确定链因豢(结构帮菲结构豁)。结 稿不确定性是由予税械手连秆不精密、受载不圈定、执行器力矩常数不准确以及篡他因素所造成的动态模型参数的不确定性;非结构不确定性是囊不可建模夔动力学所致,露不可建模瓣 动力学是由掇壤手基魂毫频模悫、延 辩帮非线性摩擦等造成的。因
28、此,如何实现机器人的大范围、高速度、满精度的轨迹跟踪,一直是机器人动力学控制豹主要问题。为达期这一髓的,在 过去的十年中提出了各种控制方法,包话基于 线性最优控制方法、逆动力学控制方法、增益分隧法、 讲一算力矩法、自适暾控制和鲁 棒控制等。 这些方法都依赖于机器人精确的幼力学模型。但事实上,机器入楚一类褒疫嚣线经、强藕合鞠 时交蕊系统, 镶鼹建立葵准确懿动 力学模鍪系绞。嗣现有的其他方法相比,迭代学习 控制鼹然更适合于这种完成穗复操作的机器人动态系统。它在适应 搴器久操作手蕊线性动力学特经翡同霹,秘蘑其爵重复豹运动特性,通过弓进学习机制,不断地积累被控对象的知识,在 线完成控制器的 设计和改进
29、,并通过运动过程豹不叛重复以实现蠢精凄爨踪控制。在一 类其有较强豹线性勰会秘要求拔高的位鬣重复精度的动力学系统(如工业机器人、数控机床等)中,迭代学习控制方法已经获得了一螺有益的应用结累。然而,一般情况下,复杂的工业对象(如工业机器人)不仅鼷有高度菲线往特性而睫工俸在不确定外部扰动环境中。舀逶应籀謇校羹三控制菇然也可以通过对系统某些重要参数的估计,用补偿的方法来克服干扰和不确定性,但 较适合系绫参数袭定菠强内的慢变皂馕况。焉穆薅控割裂是在定井郝子撬秘内零参数交化作用下,以提高系统灵敏鹰为宗旨来抵御不确定性的,其等棒区域很有限。由于存在这些诸如参数误差、来建模 动态、观测噪声以及不确定性外界干扰
30、等等不确定性因索,基于神缝网络帕机器人轨迹鲁棒跟踪控制疆此,研究菲线性系 统在不确定虢 动情况下豹管簿学习控涮闫遂其有重要意义。在橇器人串的研究瑗状褒嚣终,对予线性系绞,等人、从等人 【、娃、等人“、”、。进行了各种讨论,鄹对其给定辫法的收敛性进行了各种论述。关于在机器人系绫静蹀踩控涮上,等人) 设计“静静经鼹终蘸镶羟到器,它其有滚速收敛性趣曾棒性:()提出设计的学 习律通过正确选择学习控制参数,可以保证关节角度在误差范豳内跟踪期蛰轨迹;等人)箍掰, 对可重复运动的橇器入, 输入力矩无缬估讣动态摸型的物理参数戡可以产生期望运动。()、等人()对习确定机器人系统进行了学习控制和自适应控制的结合研
31、究,等人【;、等人一褥学习控制耀享缝翅终缀台,也壤褥了些鞠 应成累。在国内,迭代学习 控划在线性系 统中的应用也引越越曩乏越多研究老的兴趣。任雪梅、离为 炳”提任意初始状惫 下的学习控制方浊史忠科给 了型学习算法的收敛条臀,渡杰法可以运遂圣至懑辕逊;黄宝毽脚懈决了一类时交线憋系绞爨迭饯翅毽翊题,并将所得结论 用于机器人系统 ;曾南、 应行仁”】对于未知非线 性系统提出阔环遮代学习算法。 对于穰 嚣太系统,李耨芯稚霹等人在神经阚络辨识虢基穑 上提出一静逡代学习控制算法,它可用于非线性系统逢 续轨迹跟踪控制:李月忠,王福利【提出在正向神经网络辨识稹犁的綮础:,将系 统 的控制问题转化为优他阎题进行
32、逡代求解:壬扶庆翠习提基将反镤控划粕嵇缀嬲终学习控制结合,使其分剐沿时间皴秘迭代轴方向使关节运动跟踪期望轨迹。总 之,将与其他控制方法结合应用,已成为新的 发臌趋势。基于神经网络的蒸于当前的研究瓿获,遥一多 矫究将与其穗控制方法裙结合,疲糟子在象税器人操纵装爨这类转线性系统是很有必要的。幽于神经网络具有对任慧非线性映射的任意逼近能力,并能学 习和适应未知不确定系统能动态待性,使采用神 经丽络 弁尊控镧系统其有更强静适应往和餐释馥。近年来,神经蚓络控制作为秽瓤的控制方法也被波用予机器人控制,它在解决机器人运动学、 动力学问题及控制方面有独特的优越性。如前所述,已有不少学者在此方面作了大量工作,羚
33、取终了定囊皇磷究成果。机器人是一类高瘦线性、强娲合剿时变性的动力学系统,两戡出于其模型不确定性和外界十扰的影响,很 难建立准确的 动力学控制模型。另外,由各种干执的存在,系统结稳乃至参数攥;姥发生交乏,困耍电鄹鲣芨曩过程毙黢信愚褰线羧淡褥到了系绞模型。也难 免存往模型失配 问题。由此模型通过传统控制理论建立起柬的控制方案用:在线控翻朝。,瓣为未建禳动惫静影褊,篷 难徕掩其舔有瓣憔缱。蠢遥疲控制方法在一 宠程度上解决了确定性问题,但其本质是对模型参数的在线辨识,需要知道划。象的结构模撼于神缀阐络的帆器人轨迹鲁棒跟踪控制黧,这 又使瓣 题憝蠢 笺杂。焉褥 经 网络掰具有瀚线缝交换特继帮瑟 发兹并行
34、运算能力为系统辨识,尤其楚非 线性系统辨 识提供了一条有效途径。另外,将神经湖络用于非线髓系统的辨识和撩铷中,救都采;双神 经丽络结稔,其中 个丰孛 经阏络作为辨识摸爱学习被控对象豹忑嬲摸挺,瑟一个作 为拣铡爨,学 习被控对象豹逆模型。这季申方法夜摸溅的精度足够高时,会获得徽好的控制性能。但采用这种结构将导致控制系 统调节参数过多, 显 溺环系绞鹣稳 定性秘鲁饕瞧 较麓。瑟且一般糖爨下,享孛经嘲络豹结褥秽抉遮窍效算法的选择还没有统一的衡量标准,因此用于神经网络的训练次数达上百甚至上千次,浚敛 速发成为鸯 符解决兹主要翊怒之一。,本文的主螫工作针对以上存在瓣润题,对于双关节枫 爨人系统,本文提出
35、爝迭代学 习 揆钊与枣孛经嬲络辨识相结合形成种新的爨于神经网络的越代学习控制方法。由于神经网络其有自学习能力,它可稍阁不确定性系统的历史输出数瓣对系统的稳态特瞧进毒亍绩计,搜褥黠系 统正良摸墼 戆瓣识达到理想瓣遴遥精凄,然嚣瓷蠹三淘棱型的基础上进行学习控制律的设计:即采用神经隔络辨识非线性系统的正向模型,并消除系统不确定瞧军帮干貔静影响,傻关 节运动潜迭代轴方辩遥近鬻蘩 鞔迹;迭代学习控制器在线学习控制参量,使关 节运 动沿时间轴方向跟踪期魍轨迹。 该 方法的特点魁,在簿一次迭代学习过程中,使稀 经网 络谢练至对模型的辨识遮鳓院较好的遥邋精度詹,涮趱享孛经元网络蟾埝滋构造下次迭代学习过遐中控铡
36、律豹斑馈部分,再将它与实越反馈控锘结合,形成本文提出的镶棒迭代学 习控制算法,并 对杭嚣人系 统进行控制。神经网络的结构有很多种, 这瓣采用最常用的 雾层前向网 络进行磁向模型的辨识。幽予 枫器人动 力学模型黪不确定性和 辩郝二二扰的存在,无法测怒系统黝实繇输出。将干扰看成系统本身的部分,用神 经网络对整个非线性系统进行辨识,使网 络输出无羧遥远系绕交际羧感。嚣事孛缓穗 终作为被控系统靛辫识模燮, 鳃栗横型 误夔足够小,捌神经网络的输出就可看作实瞬被控系统的输出。因此,就可在此嬲络的基础上进行迭代学习藏箭器瀚设计。为了增强被控系 统懿簧舔性,以及减少神 经阏络 瓣识对象瓣精度对按划栏姥的影响,
37、我嬲在学习控制爨粒鏊 础上加入反馈羚镁按铡器。由于调节器具肖使用范围广泛、参数艇定 简单、静棒性好等优点,大多数反馈回路用该方法或其变形影式熟控剩器。嚣 此这遵聚髑麓单 豹型控制器。在祷缀网络辨议模型秘反馈控制豹慕础上,再加入一个学习控制器。不失般性,我们采用结构简单的型掩制器就可以瀵蘧按裁需袋。综上辑述,该方法 浆工乍器理楚:在迭 饯学习次数为零熬时候(开始玲莰), 枫器人系统由反馈控制嚣单独控制,由于系统存在不确寇性困索和外部干扰,机器人跟踪 误麓不可能毂敛虱零。秘耀神 经翮络对 不确定健因素和秀部干扰送行学习,麓着遮代学 习次数的增加,神经 网络能较好的估 计系统不确定性函数并充当其正向
38、模型,由网络输出基于神疑随络的机器人轨迹鲁棒跟踪控制帮学习控翻器得妥控裁露豹蓠续部分,孬与反馈接潮藤结合对援器人系统滋行擦剿。疆论分孝厅表明,如果串 经网络具有足 够禽的辨识精度, 则控制系统 可实现对任意轨迹的简精度跟踪。仿真结 果也表明, 该方法 对裔未知外部干扰的机器入系统 楚十分有效静,且麓以辍少静陲终媚练次数霹迭找学习次数达到灌豢鹣黎踩洼能。蒸手静缝蜊缜舱税嚣孰进饕捺鼹黥控制迭代学习控制学习可以葫作最知识和缀验之间的桥梁。在控制工程中,知识代表模黧、环境和相关不确定臻患,嚣经验 烈主要来垂系襞 戆重复性撼馋、以蓑熬控 铡和每次 羧制艨缮裂豹误差傣号等。当一个系统执行个 缭定的重复性任务时,我 们可以用控制系 统骥论来找到一些新的特性以控制系统的重复性运行。潦于此,日本学者为了研究机器人操作装鬣,首先提融了学习控制静萌劳:对于一个动力学参数来熟终系绕,让其没羞一矮鲶定孰逑反复运行,每次运行聪擐据前次运行所产生豹状态域竣出偏蓑,按照粱种学 习策略对上一次的输入倍号进彳亍修难,并将修正结果用作本次的控制输入。 经过多次麓簧学习过程,使输出偏差逐渐减少到误差莛强内。年,等久正式提出迭代学习整豢绝