收藏 分享(赏)

基于激光雷达和神经网络的移动机器人综合局部路径规划.doc

上传人:weiwoduzun 文档编号:1880236 上传时间:2018-08-28 格式:DOC 页数:110 大小:1.47MB
下载 相关 举报
基于激光雷达和神经网络的移动机器人综合局部路径规划.doc_第1页
第1页 / 共110页
基于激光雷达和神经网络的移动机器人综合局部路径规划.doc_第2页
第2页 / 共110页
基于激光雷达和神经网络的移动机器人综合局部路径规划.doc_第3页
第3页 / 共110页
基于激光雷达和神经网络的移动机器人综合局部路径规划.doc_第4页
第4页 / 共110页
基于激光雷达和神经网络的移动机器人综合局部路径规划.doc_第5页
第5页 / 共110页
点击查看更多>>
资源描述

1、中南大学硕士学位论文基于激光雷达和神经网络的移动机器人综合局部路径规划 姓名:赵慧申请学位级别:硕士专业:模式识别与智能系统 指导教师:蔡自兴 20040101仃枷培组帐廿铋即啪缸它,他商他嘲觚嘶吼,罄钯矗。潞(),鲢锕珊舔,:坞啪 鹳, 伽舭删 自蝴廿咖一。蝴吨。脑 砌 蛐)【硪廿施啪瑚恤粕蒯 山喇咖 鹋伽访锄 恤印 珊黼廿聃咖嘲如响驰萨驯私撕朗,盯 锄(鲫枷)舭叮脚(龇舯惦嘣)鹊址脚,蛐“胁 鲥,岍吣船分幻脚砸栅【:,舱心伽甜眦抽即拍也 ( 啪觚呻协印,盯印船培弱叫冯啪,蛔嗄他蚰硒盯 矾锄孔勰 鹏愀,啪孤“勰删 唧锄肌舭曲也曲呐,也姐灿岫盯嘲,蛆咖,锄糟阻钯,北豫比啪骶“原创性声明本人声明

2、,所呈交的学位沦文是本人在导师指导下进行的矽究二作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名:廷整日期:望!生年卫月且日 关于学位论文使用授权说明本人了解中南大学有关保留、使用学位论文的规定,即:学校有权保留学位论文,允许学位论文被查阅和借阏;学校可以公布学位论文的全部或部分内容,可以采用复印、缩印或其它手段保存学位论文;学校可根据国家或湖南省有关部门规定送交学位论文。作者签名:多盛导师签名竺

3、鍪丝日期:三竺!年羔月兰同赵麓硕士学位论文第一章绪论 第一章绪论移动机器人的导航控制移动机器人是机器人学中的一个重要分支。对它的研究始于六十年代,以斯坦福研究所的自主移动式机器人为标志,其主要目标是研究在复杂环境下机器人系统的实时控制问题,涉及到任务规划、运动规划与导航、目标识别与定位、机器视觉、多种传感器信息处理与融合以及系统集成等关键技术【。不同于传统的机器人手臂,移动机器人具有其特殊的机构模型和应用性,是一个集环境感知,动态规划与决策,行为控制与执行等多种功能于一体的综合系统。移动机器人的研究提出了许多瓤的、挑战性的理论与工程技术课题,引起了越来越多的专家学者和工程技术人员的兴趣。 移动

4、机器人具有非常广泛的应用范围,包括制造系统、服务行业、国防及其它社会应用方面。其最成功的应用是作为自动化生产系统中的物料搬运装置,用以完成机床之问、机床与工件库之间的工件传送。由于移动机器人的运动灵活性能,大大增加了生产系统的柔性和自动化程度。星际探索和海洋开发是另外两大促使移动机器人发展的重要因剥。从年代美国就开始研究火星探索移动机器入,以便在火星上软着陆后迸行移动收集数据。火星探测器“勇气号”、“机遇号”分别在年的月日和年的月日登陆火星,对火星进行为期个月的探测工作。我国也在积极研究月球车,希望能够早日登上月球进行科学探索。在海洋开发方面,移动机器人主要用来进行资源调查、石油矿藏开采、沉船

5、打捞等方面。现在移动机器人的研究除上述应用领域外,还涉及到其他很多应用领域。如导游机器人、娱乐机器人、手术机器人、捧雷机器人、采矿机器人等。 移动机器人的导航就是在有障碍物的情况下使机器入实现面向目标的运动。它的基本任务主要有:()基于环境理解的全局定位:通过对环境中景物的理解,识别人为路标或具体的实物,以完成对机器人的定位,为路径规划提供素材。()目标识别和障碍物检测:实时对环境中的障碍物进行检测或对特定目标进行检测和识别,提高控制系统的稳定性。()安全保护:能够避开障碍物使得机器人免遭损伤。 现有的导航控制方法主要分为两大类:确定性环境下的导航控制和未知环境下的导航控制。确定性环境下的导航

6、控制已经取得了大量的研究和应用成果卅,赵慧硕士学位论文第一章绪论它是在机器人内部存有完整的环境信息,在预先规划好的一条全局路径基础上,采用路径跟踪和避障技术,实现机器入的导航。一般采用基于功能的体系结构,即按照“感知建模一规划一行动”的模式进行导航,现已提出多种确定性环境下的导航方法。 关于未知环境下的导航控制也开展了一定的研究,提出了一些方法,但是尚未形成统一的体系结构【”。基于行为的反应式体系结构用行为封装了机器人控制中应具备的感知、探索、避障、规划和执行任务等能力,根据当前环境决定应该采取的行为 这些行为组合成不同的动作。【提出的一种并行分布式层级体系结构(, 简称)是基于行 为的控制结

7、构的典型代表。基于功能和行为的混合体系结构结合了两种方法的优缺点 】,混合式体系结构是机器人体系结构研究的重要发展趋势,并在未知环境中得到广泛应用。但是它的发展过程中也存在一些诸如基本功能模块的组合方式、整体规划与反应式行为如何协调以及各层次之间知识怎么流通等问题。 移动机器人的路径规划问题路径规划是移动机器人导航控制中的一个重要问题。它主要是指在存在障碍物的环境下,为机器人找到一条从起点到目标的安全路径,这条路径要达到时间较短或长度较短等优化条件。 现有的路局规划主要分为两大类,全局路局规划和局部路局规划。全局路局规划是在已知环境信息的情况下预先给出一条路径,然后机器人沿着这条路到达目标,在

8、机器人前进的过程中不再规划路径,因此也称为离线规划。全局规划局部路局规划是在不知道环境信息的情况下,机器人根据传感器传回的环境信息,实时避障,向目标前进,机器人边走边规划因此也称为在线规划。全局规划的研究已经取得了很大的成就,主要方法有几何法、启发式搜索方法、神经网络法等。它的主要步骤可分为】:)划分状态空间;)形成包括状态空间信息的搜索空间;)在形成的搜索空间上应用各种搜索策略寻找路径。现有的局部路局规划方法主要有人工势场法、强化学习、基于模糊逻辑和神经网络的规划、遗传算法等方法。 人工势场法将环境想象成一个虚拟的势场,其中目标对机器人起吸引作用,障碍对机器人起排斥作用,引力和斥力的合力方向

9、就是移动机器人的移动方向”舶。 这种方法运算简单、效率较高,但是存在局部最小、在相邻障碍物之间找不到路径等问题 。强化学习模仿生物对环境的适应能力,采用试探评价的方式进行学习。智赵慧硕士学位论文第一章绪论能系统采取某个动作,环境马上给出这个动作的评价信号,如果这个动作比较好,那么采取它的可能性就比较大。从而实现一种从状态空间到动作集合的映射”。这种方法可以在很大程度上避免局部最小值,而且不存在相邻障碍之训不能通过等问题,适用于环境存在突变和动态障碍物的情况。但是该法学习过程太长,机器人必须先在环境中试探学习较长时间才町以得到较好的从环境到动作的映射,而且涉及到矩阵运算,规划过程比较复杂。 利用

10、神经网络和模糊数学理论相结合可以实现具有模糊推理功能的局部规划器“。首先把机器人传感器的距离信息进行模糊处理。通过总结人的驾驶经验,形成一系列模糊规则,把模糊规则作为样本,对神经网络进行离线训练学习,通过对典型样本的学习,把规则融会贯通,在整体上体现出一定的智能。所有样本学习完以后,这个神经网络就是一个比较聪明、灵活的模糊规则表,具有一定的自适应能力。在实际应用中允许输入值偏离学习样本,但只要输人模式接进某一学习样本的输入模式,则输出也就接近学习样本的输出模式。这种性质使得神经网络可以模仿人脑在丢失部分信息时仍具有对事物的正确识别能力。 利用神经网络与遗传算法相结合可以实现具有学习能力的避碰控

11、制【“。通过进化学习实现机器人在非结构化环境中的避碰行为。把网络的权值看作一个参数空间,学习的目的就是在整个空间内寻找最优或满意的解。遗传算法的个体取为网络的所有权值的排列,多个个体作为最后的学习结果。在进化学习中,适应函数取为机器人行进步数,即在障碍环境中走得远的个体具有高的适应值移动机器人的感知系统移动机器人最基本的功能包括:感知、控制、执行。感知就是通过传感器将环境信息以及机器人当前状态传送到控制部分,由控制部分决定应该采取什么动作,执行部分执行控制部分做出的决定。如果把机器人和人对应起来的话,控制部分就相当于人类的大脑,执行部分相当于我们的手脚,而感知部分对应着我们的五官,我们主要通过

12、感知部分来认识世界改造世界。因此,可以说感知部分是移动机器人各项功能的基础。 机器人的传感器可以分为本体感受器和外部感受器 】,例如能量、里程计、关节角度、加速度等属于内部状态,以它自己的坐标轴来确定其位置;而摄像机、触觉传感器、超声波传感器、激光测距仪等则获取外部信息,机器人相对于环境而定位。外部传感器还可以分为接触式传感器和非接触式传感器。另一种分类方法是分为被动传感器和主动传感器。被动传感器依赖于环境所提供的媒介,例如摄像机需要外部光线才能正常工作。而主动传感器则将能量投射到环境中,赵慧硕十学位论文第章绪论例如激光测距仪发劓激光到环境中,接收返网的激光束用来测量距离。 常用的移动机器人系

13、统传感器有:撤光测距仪根据扫描机构的不同,激光测距雷达有和两种。它们大部分都是将激光发射出去并通过测量发射光和从物体表面反射回来的光之间的时间差进行测距。 激光测距雷达测量时间差有三种不同的技术【:脉冲检测法:商接测量反射脉冲与发射脉冲之间的时间差;相干检测法:通过测量调频连续波的发射光束和反射光束之间的差频测量时间差; 相移检测 过测量调频连续波的发射光束和反射光束之间的相位差测量时间。由于相位差是以,为周期的,这种方法测得的只是相对距离。激光测距范围广、精度高、传输速度快,适合机器人的实时避障,而且对象的形状、颜色、材质等都不会影响它的测量。激光测距仪能够以较高的频率提供大量的、准确的距离

14、信息,可以同时满足精度要求和速度要求。激光雷达是激光测距仪的一种,它是一种工作在从红外到紫外光谱段的雷达系统,可以分为脉冲激光雷达和连续波激光雷达。它的作用是能精确测量目标位置(距离和角度)、运动状态(速度、振动和姿态)和形状,探测、识别、分辨和跟踪目标。经过多年努力,科学家们已研制出火控激光雷达、侦测激光雷达、导弹制导激光雷达、靶场测量激光雷达、导航激光雷达等。超声传感器和利用激光测距仪通过计算光束飞行时间来测距类似,超声测距的原理也是通过检测超声波从发射器发射到碰到障碍物反射回接收器的时间来测距。由于超声传感器体积比较小价格低廉,目前在移动机器人中的应用非常广泛。 超声传感器的换能器一般都

15、是集成了发射和接收部分,首先换能器在发射状态将超声波发射出去就把自己转换成接收状态等待从环境中返回的超声波叭。这种方式本身决定了超声测距有一个最小的测距长度,因为换能器状态的转换需要时问 另外,由于超声波在空气中的传播能量有较大的衰减,如果返回的能量低于某个阈值,就会得不到距离信息。而且通常返回信号有较大干扰,难以获得准确的距离信息。超声的波长一般在几个毫米级别,比一般室内环境表面的粗糙度要大很多,容易产生镜面发射。超声波发射波束有一定的角度范围,一般在(一。)之间,因此反射目标的准确方位也无法确定。因此,超声传感器般用在对环境感知精度要求不高的场合,如只是大致知赵慧硕士学何论文第一章绪论道前

16、方是否有较大的障碍等。 全球定位系统()已经越来越广泛地应用于机器人系统,主要是室外移动机器人。本身不属于本体感受器,但是也不算是外部感受器,因为它不计算与环境地相对位置,而是通过卫星信号得到经度、纬度和高度【埽。由于美国军方的刻意引入误差,民用信号的定位误差有数十米之多,但是差分系统可以明显提高精度达到厘米级误差。但是在室内和某些城市环境,不能正常使用。除了以上这些传感系统以外,还有惯性导航系统、视觉传感系统等。惯性导航系统存在内部漂移问题,需要周期性重新标定。视觉传感系统应用最普遍的是摄像机,对它的研究涉及到三维重建、立体视觉等方面的问题。这些算法对于机器人而言太过复杂,不能实时工作。本文

17、的主要内容和结构本文的研究是在国家自然科学基金重点项目“未知环境下移动机器人导航控制的理论与方法研究”(批准号:)的支持下开展的。在系统阐述了移动机器人的研究背景与主要进展的基础上,对基于神经网络的移动机器人综合局部路径规划进行了深入的研究。具体内容安排如下: 第一章,简单介绍了移动机器人的路径规划问题和现有的感知系统,介绍本文的章节安排。 第二章,分析了两种典型的局部路径规划方法人工势场法和学习方法的优劣,在原有方法的基础上进行改进并且给出仿真结果。人工势场法尽管计算简单、方便灵活,但是存在局部晟小问题,在相邻障碍和较窄的走廊环境下不能常规划。为了克服它的局部最小问题,在碰到势场力为的情况下

18、,增加一个指向自由区域的虚拟力。学习方法对环境没有什么特别的要求,在很大程度上避免了局部最小。但是传统的采用神经网络实现的学习方法学习速度很慢,计算复杂,占用存储空间比较大。为了提高网络的学习速度,动作的选择采用模拟退火算法,的计算引入了自 组织机制根据动作之间的相似程度进行调整。第三章,给出本文的主要思想:采用神经网络为环境分类,在简单环境下采用第二章中改进的人工势场法,以充分发挥人工势场计算简单、方便灵活的优点,在存在相邻障碍物和走廊环境等人工势场法不能充分发挥作用的地方,引入第二章中改进的学 习方法进行规划,使得这两种方法实现优势互补。采用网络实现环境的分类;对网络结构、学习算法、样本选

19、取、权值初始化等问题进行了赵慧硕:学位论文第一章绪论些探讨,最后采用给出了分类结果。第四章,设计移动机器人的感知系统。激光雷达能够以较高的速率提供大量的、准确的距离信息,可以同时满足精度要求和速度要求。本文采用激光雷达完成环境信息的采集。本章中进行了激光雷达与计算机通信的接口设计和软件殴计。 第五章,综合了前面几个章节的研究内容,给出了基于神经网络的综合局部路径规划方法,实现了第二章中两种方法的结合,并且给出了仿真结果。第六章,总结与展望。 赵慧硕学位 论文第二章改进的局部路径规划方法 第二章改进的局部路径规划方法改进的人工势场法进行移动机器人的局部路径规划人工势场法是年由提出来的,实际上是对

20、机器人运行环境的一种抽象描述。它模仿物理学中势场的概念,将环境分为斥力极和引力极两类。目标点和希望机器人进入的区域称为引力极,障碍区域和不希望机器人进入的区域称为斥力极。引力极和斥力极周围按照一定的算法即势函数形成势,使障碍区域具有较高的势,形成势峰,自由区域具有较低的势,形成势谷。任何一点的势为所有极点在该点产生的势之和,这种势的负梯度形成抽象的势场力,一表现为障碍对物体产生排斥力和目标点对物体产生吸引力,合力使物体无碰撞地由起始位置运动到目标位置。这种方法由于其简单方便引起了研究人员的极大兴趣,近些年得到了很大的发展【】【 【】。但是由于机器人前进的方向总是沿着势场下降的方向,如果势场函数

21、并非严格单调而是存在局部最小,则机器入可能在这个点周围出现振荡,跳不出这个区域田。另外如果机器人前方存在相邻的障碍物但是障碍中间有足够的空间可以让机器人通行的情况下,由于两个障碍都将机器人推离自己,最终合力会将机器人推离这两个障碍同时也推离了它们之间的通道,造成机器入绕道行走。在较窄的走腐环境下如果存在突起的障碍,使机器人偏离了原来的运行方向,机器人假如向左转,左边的障碍将它推到右边,右边的障碍又可能将它推回左边,如此循环,机器人运行出现抖动,道路长度增加【】。本节将主要针对机器人的局部最小值做出一些改进,关于后两种情况的改进我们将在第五章介绍。算法研究势函数的形式可以根据实际需要定义,但一个

22、不变的宗旨就是与距离有很大关系 。离障碍物越近,斥力越大,离障碍物越远斥力越小甚至在超过一定的距离范围之后可以定义为零,以保证机器人安全前进。离目标点越近,引力越大,保证机器人到达目标 提出了只与位置有关的势场建立方法。其中引力函数与机器人到目标的距离平方成正比;斥力势场函数与机器入到障碍物的距离倒数的平方成正比。势场函数构造简单,易于实对计算。根据方法我们构造引力势场函赵慧硕十学位论文第章改进的局部路径规划方法数如下: 叽()口:()()其中,口是下比例系数,为机器人在工作坐 标系的坐标值,(,),(,是机器人到目标点的距离。 构造斥力势场函数如下: ,()吲击一扑川。其中,是正比例系数,)

23、是机器人到障碍物的最短距离,即()(忪一忱占 为 障碍物的边界,比是门槛距离删。巩的选择应根据障碍物和目标点的具体情况确定。为了充分利用传感器信息,在机器人离目标较远的时候可以令或等于传感器的探测范围。当机器人接近目标时,如果与目标的距离小于传感器探测范围时,令哦(吐,破),其中。是传感器的探测范围,是目 标点到各障碍物距离的最小者,以保证机器人能够达到目标。复合势场力为:)一):卜扎州高寺赤和小巩口,卜口(。),)以如果在某点势场不变,即一()时,机器人将会以为到达目标点而停止前进。所以我们在机器人运行的每一步都要计算一下一()是否成立,如果不成立,机器人就沿着()的方向前进。此时机器人运行

24、的下一步可以这样得到:钆,一田(,),。是第步时的位置坐标,占为正常数,表示每步的增长量。对于平面问题,这时机器人的安全路径坐标值为: 一刃警帆只一胛警()如果一【,(。)成立,我们在)的基础上再增加一个指向自由区域的虚拟力一()将机器人“拉”到自由区域。只()的方向为传感器读数最大的那个方向玎,如果有几个读数相同的话就取最靠近目标的方向,()的大小可以任意选取。则 :。?研()【卫只卵 整董堡兰焦堡壅箜三童堕堂塑星墅堕堡塑型互鳖仿真结果 规划出的路径地图的斥力势场 分布图简单环境下采用人工 势场法进行规划【、的选取代表避障和到达目标之间的权衡关系。选取得过大,则到达目标所占的比重较大,在传感

25、器信息不完全的情况下可能会撞到障碍物。选取过大,则考虑避障比较多,可能会造成机器人不必要的 绕路,增加路径 长度。给定地图如图,中所示,选取“,踟。图是相应地图的斥力势场。为了避免机器人撞上障碍物,我 们令障碍点的势场足够大,可以看到障碍物附近的势场比较高,随着距障碍物的距离增大势场减小。机器人应该在势场比较 赵慧硕士学位论文第二章改进的局部路径规划方法小的区域运动。 图是存在局部最小的情况,机器人在 圆形区域附近的势场不变,按常!方法机器人将在该点附近振荡,现在加入了指向自由区域的虚拟力作为机器人前进的方向,所以机器人可以跳出局部极小点。 图局部最小情况下的 规 划改进的学习进行局部路径规划

26、一学习 算法是由砒在年提出的 类似于动态规 划算法的一种强化学习方法】。它提供智能系统在马尔科夫环境中利用经历的动作序列选择最优动作的一种学习能力,并且不需要建立环境模型。 环境是一个有限状态的离散马尔可夫过程,智能系统在每一步都可以在有限的动作集合中选取某一动作,环境接受该动作后状态发生转移,同时给出评价信号。评价信号越大,表明选择的动作越好。 例如在时刻选取动作口,状态从,转移到。,得到 强 化信号, 和。的概率分布仅取决于口,及,而与以前的状态和动作无关。环境状态以如下概率变化到。: 加,口,盯,】()状态的值指从该状态出发,应用某种策略达到终结状态时,所获得的累计强化信号(或称积累回报

27、),是立即回报与延时回报之和【。状态的值反映了在指定策略下状态的价值(或称效用),而状态的值函数则在一定的策略下将状态映射为状态的值。在策略的作用下,状态只的值为: 赵慧硕士学位论文第二章改进的局部路径规划方法 矿。(),(石(,),口, 】矿。()()由于智能系统希望立即收到强化信号仞(毋),然后以概率移 动到一个赋值为(。)的状态。系统学习的目标是寻找一个合适的动作选择策略,使基于 该策略产生的动作序列可获得某种最优的结果(如积累回报最大)跚。动态规划理论保证至少有一个策略, 使得 旷(跗叫。( )嘴咖(跗),芝()。学习面 临的任 务是在初始条件未知的情况下决定万,希望找到一个策略( 动

28、作序列)使得评价总和达到最大。如果环境模型已知(即状态转移概率和强化信号模型已知)或者由观测可以得出,则上述问题可用动态规划解决。学习的思想是不去估计环境模型,而是直接优化一个可迭代计算的函数嘲渊。定义此函数为 在状态 吼时执行动 作口,且此后按最优动作序列执行时的折扣累计强化值削。即 (,),划(,“,酬( )其中,是折扣系数,是有限的动作集合。只有在得到最优控制策略的前提下上式才成立。在学习阶段, 误差信号如下式所示町: ,罂棚(),弘扣()【晴加没有被选中的动作不会对环境产生强化信号,因此这些动作的。学习的实现方法主要有两种方式:一种是采用神经网络方法田删;另一种是采用表格方法。采用表格

29、方法,当环境的状态集合或者智能系统可能的动作集合较大时,(,)需要占用大量的内存空间,而且也不具有泛化能力。因此我们采用最简单的神经网络网络来实现学 习。网络的设计图表示了采用神经网络实现学习的方法。实现学习的网络不同于一般的网络引。一般的网络都会预先给定输入向量和日标向量。实现学习的网络输入是在机器人前 进的过程中得到,每前 进一步采集环境信息作为输入向量;机器人根据一定的策略选择某个动作作为输出,环境根据这个动作给出强化信号,网络根据强化信号进行相应权值的调整。由环境提供的强化信号是对机器人产生动作的好坏作一种评价(通常为标量信号),而不是告诉机器人如何去产生正确的动作。由于外部环境提供了很少的信息,机器人必须靠自身的经历进行学习。通过这种方式,机器人在行 动 评价的环境中获得知识,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 通信信息 > 天线/微波/雷达

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报