1、xx 工程大学毕业设计(论文)I一级倒立摆的单神经元 PID 控制器的设计摘 要倒立摆装置被公认为自动控制理论中的典型试验设备,是控制理论教学和科研中最典型的物理模型。通过对它的研究不仪可以将控制理论中的许多分析问题加以验证,还能将控制理论涉及的三个主要基础学科:力学、数学和电学 (包含计算机)进行有机的综合应用。倒立摆可为多种具有实际工程背景的物理系统提供一个很好的实验平台,从而可以将所设计的控制器应用于此平台上。首先利用牛顿一欧拉方法对倒立摆系统进行建模,从 LQR 控制方法,传统的 PID控制方法与神经网络控制理论出发,学习了 LQR 算法和单神经元 PID 控制器算法,并根据控制模型设
2、计 LQR 控制器和单神经元 PID 控制器。通过 MZTLAB 仿真和倒立摆实验装置实现倒立摆系统的稳定控制。文中采用两种控制方法:LQR 控制和单神经元PID 控制法。通过仿真可以看出采用单神经元 PID 控制方法的控制效果比 LQR 控制效果要好,超调量小或无超调量,调节时间比 LQR 控制短。关键词:倒立摆 PID 控制 单神经元网络控制余黄伟:一级倒立摆的单神经元 PID 控制器的设计IIDesign of single neuron PID controller for an inverted pendulumAbstractNverted pendulum device is r
3、egarded as the typical test equipment in the theory of automatic control, and it is the most typical physical model in the teaching and scientific research of control theory. Through the research instrument can control many of the analytical problems in theory is verified, but also the control theor
4、y involves three main basic disciplines: mechanics, mathematics and electrical (including computer) for organic synthesis application. Inverted pendulum can provide a good experimental platform for a variety of physical systems with practical engineering background, so that the designed controller c
5、an be applied to the platform.Firstly, the Newton Euler method of inverted pendulum system modeling, the LQR control method, the traditional PID control method and neural network control theory, to study the related learning algorithm, the LQR algorithm and single neuron PID controller algorithm, an
6、d according to the control model design of LQR control system with the single neuron PID controller. The stability control of inverted pendulum system is realized by the MZTLAB simulation and the inverted pendulum experiment device. Two control methods are used in this paper: LQR control and single
7、neuron PID control.Through the simulation, we can see that the control effect of single neuron PID control method is better than the LQR control effect, the overshoot is small or no overshoot, and the control time is shorter than that of LQR control.Ey words: inverted pendulum PID control single neu
8、ron network controlxx 工程大学毕业设计(论文)III目录引 言 - 1 -第一章 绪论 - 2 -1.1 倒立摆简介 .- 2 -1.2 倒立摆的控制方法 .- 2 -1.3 本文的主要任务 .- 3 -第二章 一级倒立摆 - 4 -2.1 一级倒立摆的系统组成 .- 4 -2.2 一级倒立摆的物理模型 .- 4 -2.3 一级倒立摆的数学模型 .- 5 -第三章 LQR 控制 .- 8 -3.1 LQR 控制器的二次最优控制原理 - 8 -3.2 设计方案 .- 8 -第四章 单神经元 PID 控制 .- 10 -4.1 PID 控制的基本原理 .- 10 -4.2 单
9、神经元结构 .- 10 -4.3 控制算法 .- 12 -4.4 单神经元 PID 控制算法的建模 - 13 -第五章 仿真 - 15 -5.1 LQR 控制器仿真 - 15 -5.2 单神经元 PID 控制器仿真 - 15 -结论与展望 - 17 -致 谢 - 18 -参考文献 - 19 -附录 A- 19 -附录 B- 27 -附录 C- 30 -余黄伟:一级倒立摆的单神经元 PID 控制器的设计IV插图清单图 2-1 4图 2-2 5图 2-3 6图 3-1 8图 3-2 9图 4-1 10图 4-2 12图 4-3 14图 4-4 14图 5-1 15图 5-2 15图 5-3 16x
10、x 工程大学毕业设计(论文)- 1 -引 言倒立摆,顾名思义,是处于倒置不稳定状态,人为控制使其处于动态平衡的一种。一般是由一个可以在水平轨道上自由移动的小车和倒置摆铰链而成。倒立摆系统是一个典型的高阶次、多变量、严重不稳定和强耦和的非线性系统,是进行控制理论教学及开展各种控制实验的理想实验平台。对倒立摆系统的研究能有效的反映控制中的许多典型问题:如非线性问题、鲁棒性问题、镇定问题、随动问题以及跟踪问题等。PID 控制具有结构简单、稳定性能好、可靠性高等优点,尤其适用于不能建立精确数学模型的不确定性控制系统。PID 控制中一个关键的问题便是 PID 参数的整定。但是在实际的应用中,许多被控过程
11、机理复杂,具有高度非线性、时变不确定性和纯滞后等特点。在噪声、负载扰动等因素的影响下,过程参数甚至模型结构均会随时间和工作环境的变化而变化。这就要求在 PID 控制中,不仅 PID 参数的整定不依赖于对象数学模型,并且 PID 参数能够在线调整,以满足实时控制的要求。神经网络主要用来解决那些传统方法难以解决的控制对象参数在大范围变化的问题,其思想是解决PID 参数在线调整问题的有效途径。单神经元是构成神经网络的基本单位,神经元构成的单神经元 PID 控制器不但结构简单、学习算法物理意义明确、计算量小,而且具备自学习、自适应、自组织的能力,能够自动辨识被控过程参数,自动整定控制参数、能够适应被控
12、过程参数的变化,鲁棒性强、可靠性高,这类控制器已在实际问题中得到了应用本文提出一种方案利用单神经元 PID 来控制一级倒立摆。因为一级倒立摆系统是一个典型的高阶次、多变量、严重不稳定和强耦和的非线性系统单神经元,而 PID 控制具有结构简单、计算量小、权值学习时问短、鲁棒性强、易于实现等优点。同时利用 LQR 控制器与单神经元 PID 进行对比,仿真后得出结论单神经元 PID 控制方法的控制效果比 LQR 控制效果要好,超调量小或无超调量,调节时间比 LQR 控制短。 余黄伟:一级倒立摆的单神经元 PID 控制器的设计- 2 -第 1 章 绪论1.1 倒立摆简介倒立摆,顾名思义,是处于倒置不稳
13、定状态,人为控制使其处于动态平衡的一种。一般是由一个可以在水平轨道上自由移动的小车和倒置摆铰链而成。倒立摆系统是一个典型的高阶次、多变量、严重不稳定和强耦和的非线性系统,是进行理论教学及开展各种控制实验的理想实验平台。对倒立摆系统的研究能有效的反映控制中的许多典型问题:如非线性问题、鲁棒性问题、镇定问题、随动问题以及跟踪问题等。通过对它的研究不仅可以解决控制中的理论和技术实现问题,还能将控制理论涉及的主要基础学科:力学、数学和计算机科学进行有机的综合应用。其控制方法和思路无论对理论或实际的过程控制都有很好的启迪,是检验各种控制理论和方法的有效的“试金石”。倒立摆的研究不仅有其深刻的理论意义,还
14、有重要的工程背景。在多种控制理论与方法的研究与应用中,特别是在工程实践中,也存在一种可行性的实验问题,使其理论与方法得到有效检验,倒立摆就能为此提供一个从理论通往实践的桥梁,目前,对倒立摆的研究已经引起国内外学者的广泛关注,是控制领域研究的热门课题之一。 倒立摆不仅仅是一种优秀的教学实验仪器,同时也是进行控制理论研究的理想实验平台。由于倒立摆系统本身具有的高阶次、不稳定、多变量、非线性和强耦合特性,许多现代控制理论的研究人员一直将它视为典型的研究对象,不断从中发掘出新的控制策略和控制方法,相关的科研成果在航天科技和机器人学方面获得了广阔的应用 1。二十世纪九十年代以来,更加复杂多种形式的倒立摆
15、系统成为控制理论研究领域的热点,每年在专业杂志上都有大量的优秀论文出现。因此,倒立摆系统在控制理论研究中是一种较为理想的实验装置。 倒立摆主要应用在以下几个方面: (1) 机器人的站立与行走类似于双倒立摆系统,尽管第一台机器人在美国问世至今已有三十年的历史,机器人的关键技术机器人的行走控制至今仍未能很好解决。 (2) 在火箭等飞行器的飞行过程中,为了保持其正确的姿态,要不断进行实时控制。(3) 通信卫星在预先计算好的轨道和确定的位置上运行的同时,要保持其稳定的姿态,使卫星天线一直指向地球,使它的太阳能电池板一直指向太阳。 (4) 侦察卫星中摄像机的轻微抖动会对摄像的图像质量产生很大的影响,为了
16、提高摄像的质量,必须能自动地保持伺服云台的稳定,消除震动。1.2 倒立摆的控制方法倒立摆有多种控制方法 2。对倒立摆这样的一个典型被控对象进行研究,无论在理论上和方法上都具有重要意义。不仅由于其级数增加而产生的控制难度是对人类控制能力的有力挑战,更重要的是实现其控制稳定的过程中不断发现新的控制方法,探索新的控制理论,并进而将新的控制方法应用到更广泛的受控对象中。当前,倒立摆的控制方法可分为以下几类 : (1) 线性理论控制 将倒立摆系统的非线性模型进行近似线性化处理,获得系统在平衡点附近的线性化模型,然后再利用各种线性系统控制器设计方法,得到期望的控制器。PID 控制、状态反馈控制、能量控制、
17、LQR 控制算法是其典型的代表。 (2) 预测控制 xx 工程大学毕业设计(论文)- 3 -预测控制:是一种优化控制方法,强调的是模型的功能而不是结构。变结构控制:是一种非连续控制,可将控制对象从任意位置控制到滑动曲面上仍然保持系统的稳定性和鲁棒性,但是系统存在颤抖。预测控制、变结构控制和自适应控制在理论上有较好的控制效果,但由于控制方法复杂,成本也高,不易在快速变化的系统上实时实现。(3) 智能控制 智能控制(IC) 是一门新型的理论和技术,是传统控制的高级阶段,主要用来解决复杂系统的控制。近几年来国内外对智能控制的理论和应用研究十分活跃。随着智能控制技术的迅速发展,已提出了许多方法,如模糊
18、控制、神经网络、专家系统、遗传算法等。 (4) 多种算法相结合的控制 尽管各类算法有自己的优点,但也存在不足之处。多种算法相结合就可以取长补短,达到更好的控制效果。比如神经网络与模糊算法相结合、模糊控制与 PID 算法相结合、免疫算法和遗传算法相结合等。按偏差的比例(Proportion)、积分(Integral) 、微分(Derivative)控制,简称 PID 控制。PID 控制是过程控制中广泛应用的一种控制。 PID 控制器早在 30 年代末期就已出现。PID 控制器问世至今已有近 70 年历史,它以其结构简单、稳定性好、工作可靠、调整方便而 成为工业控制的主要技术之一。经过 50 多年
19、来的不断更新换代,PID 控制得到了长足的发展。特别是近年来,随着计算机技术的飞速发展,发生了由模拟 PID 控制到数字 PID 控制的重大转变。与此同时还涌现出了许多新型 PID 控制算法和控制方式。20 世纪 80 年代,随着神经网络在世界范围内的复苏,国内也逐步掀起了研究热潮。2004 年 10 月在合肥召开的“人工神经网络学术会议 ”已是第十四界学术年会了;2004年 8 月在大连召开的 ISNN2004 国际会议,引起了国内外神经网络研究者的广泛关注,产生了较大的影响;另外,国内外许多相关的学术会议都设有人工神经网络专题,如国内的 WCICA、CIAC、CDC、CCC 、CAA 国外
20、的 CCA、IDEAC 等,经过十几年的发展,中国学术界和工程界在人工神经网络的理论研究和应用方面取得了丰硕成果,学术论文。应用和研究人员逐年增加。神经网络可以任意逼近线性或非线性系统,能够实现几乎所有的常规非线性与不确定系统的控制 3。但是它通常由多个神经元单元和多层结构组成,结构复杂,权值训练的时间较长,不利于实时控制。而神经网络的各个神经元本身就具备白适应、自学习以及任意函数逼近的能力,而且具有结构简单、计算量小、权值学习时问短、鲁棒性强、易于实现等优点。 2因此单神经元 pid 控制能更好的控制一级倒立摆。1.3 本文的主要任务本论文的主要任务是研究直线型一级倒立摆的 PID 控制问题
21、。主要设计思想是通过倒立摆的摆干的位置反馈给系统,从而作出参数调整,使之达到期望的结果。 首先,通过牛顿力学的分析和微分方程的计算,初步建立一级倒立摆的数学模型,并计算出一级倒立摆的状态空间描述。 然后,在给定的目标函数下,利用 LQR 控制算法实现对倒立摆的稳定控制。然后,利用单神经元 PID 算法和搜索最优参数的方法,实现 PID 控制器参数整定与优化,并完成仿真实验。最后,比较两种控制算法的仿真结果,得出相应的结论,选择合适的算法进行控制器的设计。余黄伟:一级倒立摆的单神经元 PID 控制器的设计- 4 -第二章 一级倒立摆2.1 一级倒立摆的系统组成(1)在有限长的导轨 L 上作一直线
22、运动的小车;(2)与小车铰接在一起,并能在包含 L 的平面内绕 O 点转动的摆;(3)驱动小车的直流力矩电机和转轮,且使小车稳定在轨道中心位置附近的控制器;倒立摆系统主要由计算机、AD、DA、电机、电位计以及一些机械部件组成。计算机作为数字控制器实现对系统的实时控制,同时也为操作者提供人机界面,完成系统的监督管理功能;AD、DA 板在计算机内,完成数模,模数转换;放大器用于电压和功率放大。力矩电机是系统的执行元件;单位计是系统的测量元件,它分别测量小车相对于轨道中心点的位移,摆和铅垂线的角度偏移。系统的整套机械部件安装在一块架体上,上面固定着导轨支架、电机底座和传动装置等。通过导轨支架安装好导
23、轨,小车靠直线轴承与导轨配合通过拉线钢丝传递电机动力实现运动。图 2-1 所示是一级倒立摆系统的原理图计算机 DA 倒立摆驱动电路电机力矩传感器ADv +-x图 2-1 一级倒立摆系统的原理图2.2 一级倒立摆的物理模型倒立摆的物理构成可以表述为:光滑的导轨,可以在导轨上自由移动的小车,和一个质量块的摆杆。它们的铰接方式决定了它们在竖直平面内运动。水平方向的驱动力 F 使小车根据摆角的变化而在导轨上运动,从而达到倒立摆系统的平衡 4。其模型如图 2-2 所示。 该系统的被控变量分别为: 1 为摆杆偏离垂直方向的角度,X 为小车相对参考点(导轨的最左端位置) 的相对位移。摆杆的中心坐标为(X 1
24、,Y 1)。 实际上,倒立摆系统要保持竖直方向的稳定状态,前提是摆杆与竖直方向所成的角度必须在一定的范围之内。一般情况下,要求不得小于 5O 4。xx 工程大学毕业设计(论文)- 5 -小 车ub x0M G摆 杆m gX图 2-2 直线一级倒立摆的物理模型2.3 一级倒立摆的数学模型利用牛顿力学方法建立直线型一级倒立摆系统的数学模型。 为简化系统,我们在建模时忽略了空气阻力和各种摩擦,并认为摆杆为刚体。 在忽略了空气阻力和各种摩擦之后, 可将直线一级倒立摆系统抽象成小车和匀质杆组成的系统,如图 2-3 所示。 我们不妨做以下假设: M 小车质量m 摆杆质量 b 小车摩擦系数 l 摆杆转动轴心
25、到杆质心的长度 I 摆杆惯量 摆杆与垂直向上方向的夹角 摆杆与垂直向下方向的夹角(考虑到摆杆初始位置为竖直向下) 倒立摆系统数学模型的建立基于以下假设: 1.摆杆及小车都是刚体。 2. 皮带轮与皮带之间无相对滑动,传动皮带无伸长现象。 3. 小车的驱动力与直流放大器的输入成正比,而且无滞后,忽略交流伺服电机电枢组中的电感。 4. 实验过程中的库仑摩擦、各种动摩擦等所有摩擦力足够小,在建模过程中可忽略不计。 对摆杆进行受力分析,建立一级倒立摆系统的数学模型。 对摆杆的受力分解如图 2-3 所示。图中 1 为摆杆与竖直方向的夹角。 F11为小车对摆杆的水平分力,F 12为小车对摆杆的竖直分力。余黄
26、伟:一级倒立摆的单神经元 PID 控制器的设计- 6 -F1 2F1 1F2 2F2 11YX图 2-3 对摆杆的受力分析水平方向的方程为:(2.1)111112121 sinsisinsin lmlxlxmlxdtF 竖直方向的方程为:(2.2) 11111221211 cossisicos llllttygm 将两个方程合并:(2.3)x-mlglmlI cossin2当摆杆与垂直向上方向之间的夹角相比很小时,则可以进行如下处理:为了得到控制理论的习惯表达,即 u 为一般控制量,用 u 代0sin1co,表控制量的输入力 F,线性化得到数学模型方程为:(2.4)xml-glI2(2.5)
27、ubxM将式(2.4),(2.5)进行拉普拉斯变化为:(2.6)22slXsglSmlI(2.7)U-mbsX整理后得以 u 为输入量,以摆杆摆角为输出量的传递函数,将上式整理得:(2.8)222421 bglslMlIqssUsG其中 2lmlIMqxx 工程大学毕业设计(论文)- 7 -控制系统的状态空间方程为:(2.9)DuCXYBA方程组对 ,解代数方程,得如下状态空间方程:x(2.10) uMmlIlIxMmlIlMmIblglI- 2222222 00l011(2.11)uxxy010以小车加速度作为输入的系统状态方程,设 , 。假设如下表 2-1 所xXu示:符号 大小 单位M
28、1.32 Kgm 0.07 Kgb 0.1 N/m/sl 0.2 mi 0.0009 Kgm2表 2-1则有:(2.12)uxx75.301g75.301(2.13)uxxy01余黄伟:一级倒立摆的单神经元 PID 控制器的设计- 8 -第三章 LQR 控制3.1 LQR 控制器的二次最优控制原理大多数线性定常被控对象,采用传统的 PID 控制,都可以取得良好的控制效果;但对具有分布参数特性、非线性、大滞后和时变的系统,则难以获得满意的控制效果。线性二次调节器(Linear Quadratic Regnilator-LCR)在现代控制理论中占有相当重要的地位,在控制领域受到一定的重视。它的主要
29、优点是易于分析、处理和计算,而且通过LQR 控制法的倒立摆系统具有较好的鲁棒性与动态特性,同时具有能够得到现行反馈结构的优点,因此在实际的倒立摆控制系统中得到了广泛的应用。采用 LQR 控制的关键是如何选取控制加权矩阵 Q 和 R。入股这两个矩阵选取不当,可能使求得的解不能满足实际系统的性能要求,因而会导致控制失败。通过倒立摆LQR 最优控制系统设计与研究,并反复实验选取好加权阵 Q 和 R 可以很好的实现倒立摆的稳定控制。仿真及实验结果可以看到该力方法与极点配置状态反馈法一样都能取得良好的控制效果。LQR 控制器是应用线性二次型最优控制原理设计的控制器。它的任务在于,当系统状态由于任何原因偏
30、离了平衡状态时,能在不消耗过多能量的情况下,保持系统状态各分量仍接近于平衡状态 5。线性二次型最优控制研究的系统是线性的或可线性化的,并且性能指标是状态变量和控制变量的二次型函数的积分。LQR 是根据系统的状态方程 确定最佳控制向量矩阵 K,tButAXt,使得性能指标 达到最小 6。再根据期t-KXtU021dtRUtQtJTT望性能指标选取 Q 和 R,利用 Matlab,命令 (A, B, Q, R)就可以得到反馈矩阵 KlqrK的值。改变矩阵 Q 的值,可以得到不同的响应效果, Q 的值越大(在一定的范围之内),系统抵抗干扰的能力越强,调整时间越短。下面是是最优控制 LQR 控制原理图
31、。Y = A x + B u- KYu图 3-1 最优控制 LQR 控制原理图xx 工程大学毕业设计(论文)- 9 -3.2 设计方案假设 ,则系统状态方程为: ,10g u.x.x75301753601。uxxy010四个状态量 X, , , .分别代表小车位移、小车速度、摆杆角度和摆杆角速度,输出 包括小车位置和摆杆角度。设计控制器使得当给系统施加一个阶跃输x,y入时,摆杆会摆动,然后仍然回到垂直位置,小车可以到达新的指定位置。假定全状态反馈可以实现(4 个状态量都可测),找出确定反馈控制规律的向量K,用 MATLAB 中的 lqr 函数,可以得到最优控制器对应的 K。Lqr 函数允许选择
32、两个参数 R 和 Q,这两个参数用来平衡输入量和状态量的权重。假定 , .其中1R*CQQ1.1 代表小车位置权重,而 Q3.3 是摆杆角度的权重,输入 R 是 1。取 Q1.1=4000,Q3.3=100 由程序Clear: A= 0 1 0 0; 0 0 0 0;0 0 0 1;0 0 36.75 0;B= 0 1 0 3.75;C= 1 0 0 0;0 0 1 0;D= 0 0;Q11=4000,Q33=100;Q=Q11 0 0 0;0 0 0 0;0 0 Q33 0;0 0 0 0;R=1;K=lqr(A,B,Q,R); 可得 K=( -63.2456 -31.5520 94.025
33、7 14.8289)。 根据图 3-1 以及上述内容可在 Simulink 作出一级倒立摆 LQR 控制仿真模型如下图所示:余黄伟:一级倒立摆的单神经元 PID 控制器的设计- 10 -图 3-2 一级倒立摆 LQR 控制仿真模型、xx 工程大学毕业设计(论文)- 11 -第四章 单神经元 PID 控制4.1 PID 控制的基本原理在模拟控制系统中,控制器中最常用的规律就是 PID 控制 7。模拟 PID 控制系统原理框图如下图 4-1 所示。系统由模拟 PID 控制器和被控对象组成。PID 控制是将偏差的比例,积分和微分通过线性组合构成控制量。对被控对象进行控制。PID 系统原理图如下:图比
34、例微分积分 被控对象+-Y o u t ( k )4-1 模拟 PID 系统原理框图整个系统主要由 PID 控制器和被控对象组成。作为一种线性控制器,PID 控制器根据给定值 SV 和实际输出值 PV 构成偏差,即 ,然后按差的比例,积分t-yrte和微分通过线性组合构成控制量 8。对被控对象进行控制。由上图可知 PID 控制器理想算法为:(4.1)tdip teTeKtu01其中,K p,T i,T d 为别为 PID 控制器的比例增益、积分时间常数和微分时间常数。PID 各个校正环节的作用如下:1. 比例环节 即时成比例地反映控制系统的偏差信号 e(t),偏差一旦产生,控制器立即产生控制作
35、用,以减少偏差。偏差一旦生成,控制器立刻产生控制作用。以减少偏差。2. 积分环节 主要用于消除静差,提高系统的无差度。即积分环节可以消除系统的稳态误差,提高系统的控制精度。积分作用的强弱取决于积分时间常数 Ti,T i 越大,积分作用越弱,反之则越强。3. 微分环节 能反映偏差信号的变化趋势(变化速率 ),并能在偏差信号值变得太大之前,在系统中引入一个有效的早期修正信号,从而加快系统的动作速度,减小调节时间。4.2 单神经元结构(1)神经元模型在本文中研究的单神经元 PID 控制器中的单神经元模型如下图 4-2 所示。单神经余黄伟:一级倒立摆的单神经元 PID 控制器的设计- 12 -元的输出
36、为: 31iiwxA其中 xi,w i,分别对应神经元第 i 个输入、第 i 个输入所对应的连接权值,K 为神经元的增益( 比例系数) ,它对系统的快速跟踪和抗干扰能力有较大的影响 9。写为向量形式为: 。WX其中 X、W 分别为输入向量、输入向量的连接权值向量。(4.2)321,xX(4.3)wW经元控制器的输出: (4.4)31iikxKku(2)神经元的学习理论连接权的可塑性。神经元的记忆、学习都是以神经网络结构的变化为基础的,神经网络结构的变化又是靠连接权的变化来实现的,这就是说,连接权有可塑性。 Hebb 假设。关于神经元连接权的变化,心理学家赫布(D.o.Hebb)的假设是著名的,
37、这个假设的内容是:只有当神经元兴奋时,神经元的连接权值才被强化而增大。 学习环境的信息构造。神经元学习的好与坏,学习完成之后具有什么能力,与其所处的学习环境有关。学习环境包括学习内容、教师的指导内容、学习内容出现的频度。对于学习的神经元,学习环境相应地应包括: 输入信号向量、教师信号、输入信号向量重复出现的程度。神经元学习规则学习规则是修正神经元之间的连接强度或加权系数的算法,使获得的知识结构适应周围环境的变化,学习过程由学习期和工作期两个阶段组成 10。在学习期中,执行学习规则,修正加权系数。在工作期内,连接权值固定,计算神经元的输出。 单神经元控制器的自适应功能是通过学习改变连接权值来实现
38、的。学习算法就是调整连接权值哄的规则,它是单神经元控制器的核心,并反映了其学习的能力。学习算法如下: (4.5)kwkiii 1式中 为随过程递减的学习信号 ,i0 为学习速率。ki常用的三种主要学习规则是:(1) 无监督 Hebb 学习规则。Hebb 学习是一种相关学习,它的基本思想是: 如果有两个神经元同时兴奋,则它们之间的连接权值的增强与它们的激励的乘积成正比。用表示单元 i 的激励值(输出),o j 表示单元 j 的激励值,w ij 表示单元 j 到单元 i 的连接权值系数,则 Hebb 学习规则可用下式表示:(4.6)kokjiij式中 n 为学习速率。(2) 有监督 Delta 学
39、习规则。在 Hebb 学习规则中引入教师信号,将上式中的 io 换xx 工程大学毕业设计(论文)- 13 -成网络期望目标输出 di 与实际输出 oi 之差,即为有监督 Delta 学习规则。(4.7)ko-dkwjiiij上式表明,两神经元间的连接权值的变化量与教师信号 di 和网络实际输出 oi 之差成正比。(3) 有监督 Hebb 学习规则。将无监督 Hebb 学习规则和有监督 Delta 学习规则两者结合起来,组成有监督 Hebb 学习规则,即(4.8)ko-kdWjiiiij这种学习规则使神经元通过关联搜索对未知的外界做出反应,即在教师信号的指导下,对环境信息进行相关学习和自组织,使
40、相应的输出增强或削弱。k-odii4.3 控制算法单神经元自适应 PID 控制器是通过对加权系数的调整来实现自适应、自组织功能的,权系数的调整是按有监督的 Hebb 学习规则实现的 11,控制算法结构如图 4-2 所示。K状态变化器学习算法对象ru图 4-2 单神经元自适应 PID 控制系统结构由单个神经元构成的 PID 控制算式为 (4.9) 2121321 k-e-kewk-ewkeu 式中,神经元控制器的加权系数 w1(k),w 2(k),w 3(k)分别对应为自适应 PID 的积分、比例、微分系数;K 为神经元的比例系数,一般情况下去 K012。自适应控制器通过对加权系数 w1(k),
41、w 2(k),w 3(k)的调整来实现自适应功能,权系数的调整是按有监督的Hebb 学习规则实现的。其控制算法及学习算法为: (4.10)121321 k-e-kexk-exkex 式中, P, I, D 分别为比例、积分、微分的学习速率。对比例 P、积分 I、微分 D 分别采用了不同的学习速率, P, I, D 以便对不同的权系数进行调整 13。调整规则如下:a. K 值的选择非常重要,K 越大,则快速性越好,但超调量大,甚至可能使系统不稳定,应减小 K 值,若过渡时间过长,则增大 K 值。b. 若过程过渡时间太长,增大 P, D;若超调迅速下降至稳定值,而后升值稳态余黄伟:一级倒立摆的单神
42、经元 PID 控制器的设计- 14 -时问过长,可以减少增加积分作用;对于大延时系统,为减少超调, P, D 可以适当大些;若系统过渡时问太长,可以适当增大 D。(2) 单神经元自适应 PID 控制器学习算法改进在大量工程应用实际中,人们通过实践总结出 PID 控制器三个参数的在线学习修正,主要与 e( k) 和 e( k) 有关,因此可以将单神经元自适应 PID 控制算法中连接权值的学习修正部分作些修改 14,即将 xi( k) 改为 e( k) +e( k)改进后的算法如下:(4.1)31iiwK-uk(4.12)31ijji k/(4.13)euzk-wI1(4.14)kkP22(4.1
43、5)ezk-D33式中 , 采用上述改进算法后,连接权值的在线学习修正就不1k-eez完全是根据神经网络学习原理,同时参考了实际经验。K 值得选取非常重要。K 越大,则快速性越好,但超调量大,甚至可能使系统不稳定 15。当被控对象时延增大时,K 值必须减小以保证系统的稳定性。K 值过小则会使系统快速性变差。4.4 单神经元 PID 控制算法的建模目前,许多控制模型包括神经元 PID 控制模型的仿真建模还是采用基于编制程序的方式,木文则利用 Simulink 软件基于.上述算法搭建了相应的图形化仿真模块。Simulink 是 MATLAB 软件中集成的 1 个软件包,它提供了 1 种图形化的交互
44、式环境,只需用鼠标拖动的力一法便能迅速建立起系统框图模型,可以用来对动态系统进行建模、仿真和分析 16。它和 MATLAB 的无缝结合使得用户可以允分利用 MATLAB 的富资源,建立仿真模犁,监控仿真过程并分析仿真结果口另外,Simulink 在系统仿真领域中已经得到广泛的承认和应用,许多专用的仿真系统都支持 Sirnulink 模型,这非常有利于代码的甭用和移植。控制的设计:由图 4-2 可知,转换器的输入值 r 和输出值 y 偏差经过转换器后输出神经元学习控制所需的状态量控制信号 xi( k) ,神经元的输出为u神经元控制器通过对加权系数的调整来实现自适应、自组织功能,在该控制器中采用有
45、监督的 Hebb 学习算法。根据对算法的分析可知,神经元 PID 控制算法依次由状态量计算、权值修正计算、权值规范化计算和输出计算这几部分组成。因此,与算法相对应的控制仿真模块则应该由输入接口、偏差及状态量计算子模块、权值修正了模块、权值规范化子模块、输出计算子模块以及相应的反馈机制构成,各了模块的搭建策略参照式搭建完成的神经xx 工程大学毕业设计(论文)- 15 -元 PID 控制模块结构所示。图 4-3 单神经元 PID 控制器系统响应图由上图看出,与编程仿真方式相比,木文这种用图形化方式表示算法的框图仿真模型有着建模过程简单,流程结构清晰的优点。在此模块的基础上,可以很容易地依据算法的改
46、进相应改变模块结构,从而更快地检验算法改进后的性能。此外,由于模块接口简单明了,易于将该控制模块与其他实际系统的响应模块相连接,以测试该控制算法在实际系统中的应用效果。余黄伟:一级倒立摆的单神经元 PID 控制器的设计- 16 -第五章 仿真5.1 LQR 控制器仿真由附录 B 中的程序二中得程序可得出 LQR 控制器的响应如下图。图 5-1 LQR 控制系统响应图取 Q11=4000;Q33=100,则 K=( -63.2456 -31.5520 94.0257 14.8289),由图3-3 仿真可得出下图。图 5-2 一级倒立摆 LQR 控制仿真结果5.2 单神经元 PID 控制器仿真上述
47、神经元自适应 PID 学习算法的运行效果与初始值俏 wi (k)、比例系数 K 和学xx 工程大学毕业设计(论文)- 17 -习速率 P, I, D 的选取有关。为了检验神经元 PID 控制算法的效果,下面就利用上文所建控制模块对倒立摆进行仿真如图 5-13,仿真中使用的被控对象的数学模型为:30928703523 .s-.s.sU系统输入为阶跃信号。图 5-3 一级倒立摆单神经元 PID 控制仿真结果余黄伟:一级倒立摆的单神经元 PID 控制器的设计- 18 -结论与展望倒立摆由于其动态特性的复杂性,被视为控制理论的理想实验平台,有关的研究成果可广泛应用于军事、航天等领域以及一般工业过程控制
48、:如机器人行走过程中的平衡控制、火箭发射过程中的垂直控制和卫星飞行过程中的姿态调整控制等。由于倒立摆是一个具高阶次、不稳定、多变量、非线性和强耦合等特性的系统,必须采取十分有效的控制手段才能使之闭环稳定。将各种控制算法进行有机地结合并应用于倒立摆控制,也是一个很好的研究方向。本文以一级倒立摆系统为应用背景进行先进 PID 控制研究,主要为以下四个方面。一、利用牛顿一欧拉方法建立倒立摆系统的数学模型,为后续章节用 LQR 控制和单神经元 PID 控制倒立摆做了模型准各。二、对于系统,从 LQR 控制方法,传统的 PID 控制方法与神经网络控制理论出发,学习了单神经元 PID 控制器算法和 LQR 算法,井学习了相关学习算法。三、对系统设计 LQR 制器,选择合适的参数用 MATLAB 得出 K 值,对一级