1、分类号:TP273.4 U D C:D10621-408-(2008) 1615-0密 级:公 开 编 号:2004024016xx 信 息 工 程 学 院学 位 论 文基于模糊神经网络的一级倒立摆控制系统设计论文作者姓名: xxxx申请学位专业: 自动化申请学位类别: 工学学士指 导 教 师 姓 名 ( 职 称 ):xx(讲师)论文提交日期: 2008 年 06 月 02 日基于模糊神经网络的一级倒立摆控制系统设计摘 要倒立摆是一个典型的快速、多变量、非线性、本质不稳定系统,对倒立摆系统的研究在理论上和方法上具有深远的意义。对倒立摆的研究可以归结为对非线性、多变量、不稳定系统的研究。本文首先
2、叙述了对倒立摆系统稳定性研究的意义,概述了倒立摆的研究现状,并介绍了当前已有的稳定倒立摆的各种控制方法。然后在总结归纳模糊控制和神经网络控制的基础上给出了模糊逻辑和神经网络控制相融合的优点,介绍了模糊神经网络的基本知识,分析了模糊神经网络结构。论文以模糊控制理论为基础,采用了模糊控制中 Mamdani 模糊推理系统,对倒立摆的各个变量进行控制,并且采用了自适应神经网络对模糊控制规则进行了训练,并在此基础上设计出模糊神经网络控制器。最后,在现有倒立摆实物系统中进行了直线单级倒立摆的实时控制,并对相应结果进行了分析。实验结果证明,模糊神经网络模型控制精度高,收敛性好,对倒立摆有良好控制效果。 关键
3、词:倒立摆;模糊控制;神经网络;自适应Design of an Inverted Pendulum Control System Based on Fuzzy Neural NetworkAbstractInverted pendulum is a typical model of multi-variable, nonlinear, essentially unsteady system, and researching stability of inverted pendulum system has the profound meaning in theory and methodolo
4、gy. The research on inverted pendulum can be diverted to the research on nonlinear, multi-variable and unsteady system. In this article, first of all, analyze the meaning of researching the inverted pendulum system, give a summary on the research actuality of inverted pendulum, and introduce many co
5、ntrol ways on making inverted pendulum system steady. Based on the summary of fuzzy control theory and neural network control theory, the merit of combination fuzzy logic control with neural network control is presented. Then introduce the essential definitions, analyze the structure of fuzzy neural
6、 network. The article is based on the fuzzy control theory, it controls all the variables in the inverted pendulum with the use of Mamdani FIS and use adaptive neural network to exercise fuzzy control rules, and give a design method for fuzzy neural network system controller. At last, use the struct
7、ure chart of the system to control the inverted pendulum system. The experiment result proves that FNNC has higher precision, better astringency and it has much better control effect for inverted pendulum.Key words:Inverted Pendulum; Fuzzy control; Neural network; Adaptive目 录论文总页数:41 页1 引言 11.1 倒立摆系
8、统研究的目的和意义 .11.2 倒立摆系统研究的历史与现状 .11.3 倒立摆的控制方法 .21.4 本论文的工作任务及设计思路 .22 一级倒立摆系统的数学模型 32.1 倒立摆组成概述 .32.2 一级倒立摆的牛顿 欧拉方法建模 .42.2.1 微方程的推导 42.2.2 传递函数 62.2.3 状态空间方程 62.3 系统可控性的分析 .92.4 系统阶跃响应分析 102.5 本章小结 103 模糊控制与神经网络理论基础 .113.1 模糊控制理论 113.1.1 模糊集合及其运算 .113.1.2 模糊关系 .123.1.3 模糊控制 .133.1.4 模糊控制的特点 .133.2 神
9、经网络理论 143.2.1 神经网络基础 单神经元模型 .143.2.2 神经网络基本结构 .153.2.3 神经网络的学习 .163.2.4 神经网络控制 .173.2.5 神经网络控制特点 .183.3 模糊神经网络 183.4 本章小结 184 模糊神经网络控制器的设计与仿真 .194.1 神经网络实现模糊控制的基本原理 194.2 直线一级倒立摆模糊神经网络控制器的设计 214.2.1 模糊控制系统的设计 .224.2.2 模糊控制规则的神经网络训练 .264.3 倒立摆神经网络控制器的 MATLAB 仿真 .304.3.1 MATLAB 与 Simulink 简介 304.3.2 直
10、线一级倒立摆仿真实验 .314.4 本章小结 335 倒立摆系统的实时控制 345.1 倒立摆实物系统介绍 345.2 实时控制结果及分析 355.3 本章小结 37结 论 .37参考 文献 .39致 谢 .40声 明 .41第 1 页 共 41 页1 引言1.1 倒立摆系统研究的目的和意义在稳定性控制问题上,倒立摆既具有普遍性又具有典型性。它是本质不稳定系统的典型代表,对它的研究成果可以应用到许多应用领域。倒立摆系统可以用多种理论和方法来实现其稳定控制,如PID、自适应、智能控制、模糊控制以及人工神经元网络等都能在倒立摆系统控制上得以实现。而且当一种新的控制理论和方法提出以后,都可以考虑通过
11、倒立摆装置来验证其正确性和实用性。倒立摆系统在控制系统研究中受到普遍重视,倒立摆系统已被公认为自动控制理论中的典型试验设备,也是控制理论在教学和研究中必不可少的典型物理模型。通过对倒立摆系统的研究,不仅可以解决控制中的理论问题,还能将控制理论所涉及的几个基础学科力学、数学、控制理论(含计算机)、模糊控制和神经网络有机地结合起来,在倒立摆系统中进行综合应用。在控制理论发展的过程中,某一理论的正确性及其在实际应用中的可行性需要一个按其理论设计的控制器去控制一个典型对象来验证这一理论,倒立摆就是这样一个典型被控对象。作为一个受控装置,它成本低廉、结构简单、形象直观、便于实现模拟和数字两者不同的方式的
12、控制。作为一个本质不稳定的被控对象,只有采取行之有效的控制方法,才能使之稳定。对倒立摆系统进行控制,其稳定效果非常明了,可以通过摆动角度位移和稳定时间直接度量,控制效果的好坏一目了然。理论是工程的先导,对倒立摆的研究不仅有着极其深刻的理论意义,还有重要的工程背景,空间飞行器、磁悬浮和各类伺服云台的数学模型,都和倒立摆的数学模型有着很大的相似性,其它如海上钻井平台的稳定控制、火箭姿态控制、飞机安全着陆等都属于这类问题。因此对倒立摆机理的研究具有重要的理论和实际意义。1.2 倒立摆系统研究的历史与现状国外对一级倒立摆的研究从六十年代开始。Cannon 等人在 1966 年首次实现了对一级倒立摆的稳
13、定控制,Smith 等人于 1975 年也完成了对一级倒立摆的稳定控制,采用的方法是最优控制和状态重构。对二级倒立摆的研究从七十年代开始。1972 年 Sturgen 等人采用模拟的方法完成了对二级倒立摆的稳定控制,1978 年,Furuta 等人采用小型计算机实现了对二级倒立摆的稳定控制, 1980 年,他们又完成了二级倒立摆在倾斜轨道上的稳定控制。国内对倒立摆系统的研究工作是从八十年代开始的。1982 年,西安交通大学完成了二级倒立摆系统的研制和控制,采用了最优控制和降维观测器,以模拟电路实现。1983 年,国防科技大学完成了一级倒立摆系统的研制和控制。第 2 页 共 41 页1987 年
14、,上海机械学院完成了一、二级倒立摆系统的研制,采用微机实现控制,并且完成了二级倒立摆在倾斜轨道上的控制。1993 年,北京航空航天大学自控系张明廉等人设计了一级倒立摆仿人控制器,并通过 PC-286 等设备稳定了一级倒立摆,且具有良好的鲁棒性。90 年代后期,北京师范大学李洪兴教授提出了变论域自适应模糊控制的思想,这种思想体现了模糊控制的数学本质。2001 年 9 月 19 日,李洪兴教授采用变论域自适应模糊控制成功地实现了三级倒立摆实物系统的实时控制,具有很好的稳定性、鲁棒性和定位功能。2002 年 8 月 11 日,李洪兴教授领导的实验室又成功地实现了四级倒立摆实物系统控制,这无疑填补了一
15、项世界领域内的空白。这种方法为控制理论的发展开辟了新的途径。1.3 倒立摆的控制方法单级倒立摆系统的控制对象是一个单输入(力)和四输出(角度、角速度、位移和速度)的非最小相位系统,应用经典控制理论中解决单输入多输出系统的控制方法。首先对系统进行力学分析,应用牛顿第二定律,建立小车在水平方向运动和摆杆运动的方程,并进行线性化和拉氏变换,得出传递函数,从而得到倒立摆的状态空间方程。倒立摆系统以其自身的不稳定性为系统的平衡提出了难题,也因此成为自动控制实验中验证控制算法优劣的极好的实验装置。常见倒立摆的控制方法有:1PID 控制。通过对倒立摆系统的机理分析,建立倒立摆的动力学模型,使用状态空间理论推
16、导其非线性模型,并在平衡点处进行线性化得到倒立摆系统的状态方程和输出方程,从而设计出 PID 控制器实现其控制;2状态反馈控制。通过对倒立摆系统的分析和建模,使用状态空间理论推导出状态方程和输出方程,应用状态反馈和 Kalman 滤波相结合的方法,实现对倒立摆的控制;3神经网络控制:神经网络能够任意充分地逼近复杂的非线性关系,能够学习与适应严重不确定性系统的动态特性,所有定量或者定性的信息都等势分布储存于网络内的各种神经元,故有很强的鲁棒性和容错性。4自适应控制:采用设计出自适应控制器的方法对倒立摆进行控制。 5模糊控制:首先确定基本语言值,接着确定语言值的隶属函数,在隶属函数建立后,就可以建
17、立模糊控制规则。完成了上述步骤后,就基本上建立了倒立摆系统的模糊控制器。 除了上述一些控制方式外,还可以采取将几种控制算法相结合的方法,例如模糊自适应控制、模糊神经网络控制、分散鲁棒自适应控制等。第 3 页 共 41 页1.4 本论文的工作任务及设计思路工作任务:将模糊控制、神经网络控制相结合,设计模糊神经网络控制器,应用 Simulink 仿真后,在固高公司生产的直线单级倒立摆系统 GLIP2001 上进行实时控制。主要包括以下几个内容:1直线一级倒立摆的数学模型的建立与分析;2模糊神经网络控制器原理及设计方法; 3在 MATLAB 平台上进行数学仿真,检测控制结果 ;4采用设计好的控制器对
18、一级倒立摆实物系统进行实时控制。设计思路:建立一个能容纳模糊信息的神经网络,并让其学习包含在常规模糊控制器的规则集中,再用训练后的神经网络代替模糊关系矩阵,并以此构成模糊推理的核心。根据神经网络的并行运行机制,当被控对象的实际输出值与给定输入值有偏差时,模糊神经控制器就以极快的速度产生控制响应。另外,通过神经网络训练的样本可构造和发展模糊控制规则,可以发现优化输入输出隶属函数,通过与先进的学习方法相结合使系统具有较快的收敛速度。2 一级倒立摆系统的数学模型2.1 倒立摆组成概述先来介绍下现有深圳固高 GLIP2001 一级倒立摆系统的组成: 1在有限长的轨道 L 上做直线运动的小车;2与小车铰
19、接在一起,并能在包含 L 的平面内绕 O 点转动的摆;3驱动小车的直流力矩电机和转轮、钢丝等传动部分;4使倒立摆稳定在垂直向上的平衡位置,且使小车稳定在轨道中心位置的控制器。系统包括计算机、运动控制卡、伺服机构、倒立摆本体和光电码盘几大部分,组成了一个闭环系统。光电码盘 1 将小车的位移、速度信号反馈给伺服驱动器和运动控制卡,摆杆的位置、速度信号由光电码盘 2 反馈回控制卡。计算机从运动控制卡中读取实时数据,确定控制决策(小车向哪个方向移动、移动速度、加速度等) ,并由运动控制卡来实现该控制决策,产生相应的控制量,使电机转动,带动小车运动,保持摆杆平衡。第 4 页 共 41 页图 2.1 倒立
20、摆系统原理图通过对倒立摆系统的控制系统结构以及控制目标的分析可以看出,在该系统中,倒立摆摆杆的长度和质量均可以变化;暂态时,倒立摆的角度以及小车的位置可以设定为任意值;在控制过程中,被控量既有倒立摆摆杆的角度,又有小车的位移,并且两者之间存在彼此的联系,如摆杆偏向右侧,则小车向右运动,而当小车向右运动超过某一范围后,摆杆又开始向左偏移,为了保持摆杆的平衡,小车也随之向左运动。如此反复直到摆杆和小车都回到指定位置并保持平衡;而相应的控制量却只有一个作用力 u。因此,在整个倒立摆系统中,控制量和被控量之间很难用一个线性的传递函数或者状态方程进行精确地描述。所以可以认为倒立摆系统具有非线性、时变、多
21、变量耦合的特性。2.2 一级倒立摆的牛顿欧拉方法建模对于倒立摆系统,由于其本身是自不稳定的系统,实验建模存在一定困难。但是经过小心的假设忽略掉一些次要的因素后,倒立摆系统就是一个典型的运动的刚体系统,可以在惯性坐标系内应用经典力学理论建立系统的动力学方程。2.2.1 微方程的推导在忽略了空气阻力和各种摩擦之后,可将直线一级倒立摆系统抽象成小车和匀质杆组成的系统 3,如图 2.2 所示。图 2.2 直线一级倒立摆系统可以做如下假设:小车质量:1.096kgM摆杆质量:0.109kgm小车摩擦系数:0.1N/m/secb摆杆转动轴心到杆质心的长度:0.25ml摆杆惯量:0.0034kgm 2I加在
22、小车上的力F小车位置x摆杆与垂直向上方向的夹角摆杆与垂直向下方向的夹角(考虑到摆杆初始位置为竖直向下)第 5 页 共 41 页采样频率T图 2.3 是系统中小车和摆杆的受力分析图。其中 N 和 P 为小车和摆杆相互作用力的水平和垂直方向的分量。图 2.4 是摆杆的隔离受力图。注意:在实际倒立摆系统中检测和执行装置的正负方向已经完全确定,因而矢量方向如图所示,图示方向为矢量正方向。 图 2.3 小车隔离受力图 图 2.4 摆杆隔离受力图分析小车水平方向所受的合力,可以得到以下方程:(2-NxbFM1)由摆杆水平方向的受力进行分析可以得到下面的等式:(2-)sin(2lxdtm2)即: (2-si
23、cos2llxN3)把这个等式代入(2-1)中,就可以得到系统的第一个运动方程:(2-FmllxbmMsincos)( 24)为了推出系统的第二个运动方程,我们对摆杆垂直方向上的合力进行分析,可以得到下面方程:(2-)cos(2ldtmgP5)(2-cssin2ll第 6 页 共 41 页6)力矩平衡方程如下:(2-INlPlcossin7)合并这两个方程,约去 P 和 N,得到第二个运动方程:(2-cossin)(2xmlglmlI 8)设 ( 是摆杆与垂直向上方向之间的夹角) ,假设 与 1(单位是 弧度)相比很小,即 ,则可以进行近似处理: , ,1cossin。用 u 来代表被控对象的
24、输入力 F,线性化后两个运动方程如下:0)(2dt(2-umlxbMglI)(29)2.2.2 传递函数对式(2-9 )进行拉普拉斯变换,得到:(2- )()()()( 222 sUmlsbXsmMgllI10)注意:推导传递函数时假设初始条件为 0。由于输出为角度 ,求解方程组的第一个方程,可以得到:(2-)()()2sgmlIsX11)或 (2-glslIs2)()12)如果令 ,则有:xv(2-mglslIsV2)()第 7 页 共 41 页13)把上式代入方程组的第二个方程,得到:(2-)()()()()()()( 2222 sUmlsgmlIbsgmlIM 14)整理后得到传递函数:
25、(2-sqbmglsqlMsqmlIbslU23242)()()(15)其中 )()(22llI2.2.3 状态空间方程设系统状态空间方程为:(2-DuCXyBA16)方程组对 , 解代数方程,得到解如下:x(2- uMmlIMmlIglxMmlIb lIlIlI 222 2222 )()()( )(|)()( 17)整理后得到系统的状态空间方程:uMmlIlIxMmlIglmlMIbllIx 2222222 )(00|)()(0 1)(1 第 8 页 共 41 页(2-uxxy01018)由(2-9 )的第一个方程为: xmlglI)(2对于质量均匀分布的摆杆有:231lI于是可以得到: x
26、mlglm)(2化简得到:(2-l4319)设 , 则有:,xXxuulxlg43014301(2-uxxy0120)实际系统的模型参数如下:M 小车质量 1.096Kgm 摆杆质量 0.109Kgb 小车摩擦系数 0.1N/m/secl 摆杆转动轴心到杆质心的长度 0.25m I 摆杆惯量 0.0034kg*m2将系统的结构参数代入, 可以得到系统的实际模型。第 9 页 共 41 页摆杆角度和小车位移的传递函数:(2-26705.01.)(ssX21)摆杆角度和小车加速度之间的传递函数为:(2-26705.01)(ssV22)摆杆角度和小车所受外界作用力的传递函数:(2-30942.16.2
27、7083.5)(3 sssU23)以外界作用力作为输入的系统状态方程:uxx 356.20817.0825.72356.0193.81. (2-uxxy124)以小车加速度作为输入的系统状态方程:uxx3014.2901(2-uxxy0125)2.3 系统可控性的分析第 10 页 共 41 页对于连续时间系统:(2-DuCXyBA26)系统状态完全可控的条件为:当且仅当向量组 B, AB, , 是线BAn1性无关的,或 n 阶矩阵B AB 的秩为 n。BAn1系统的输出可控性的条件为:(2-12DCACD27)应用以上原理对系统进行可控性分析:(2-0130104.2910DCBA28)将该矩
28、阵代入上式,并在 MATLAB 中计算:clearA = 0 1 0 0; 0 0 0 0; 0 0 0 1; 0 0 29.4 0;B = 0 1 0 3;C = 1 0 0 0; 0 1 0 0;D = 0 0;cona1 = B A*B A2*B A3*B;cona2 = C*B C*A*B C*A2*B C*A3*B D;rank(cona1)rank(cona2)可以得到:第 11 页 共 41 页ans = 4ans = 2可以看出,系统的状态完全可控性矩阵的秩等于系统的状态变量维数,系统的输出完全可控性矩阵的秩等于系统输出向量 y 的维数,所以系统可控,因此可以对系统进行控制器的
29、设计,使系统稳定。2.4 系统阶跃响应分析上面已经得到系统的状态方程,先对其进行阶跃响应分析,在 MATLAB中键入以下命令:clear;A = 0 1 0 0; 0 0 0 0; 0 0 0 1; 0 0 29.4 0;B = 0 1 0 3;C = 1 0 0 0; 0 1 0 0;D = 0 0;Step(A,B,C,D)可以得到:图 2.5 直线单极倒立摆单位阶跃响应仿真可以看出,在单位阶跃响应作用下,小车位置和摆杆角度都是发散的。2.5 本章小结本章中首先介绍了一级倒立摆系统的组成及工作原理;其次根据牛顿力学方法对一级倒立摆整个系统进行了分析,列写系统的动力学方程,并对其进行了简化处
30、理,这样就得到了传递函数形式的一级倒立摆数学模型;最后,在MATLAB 平台上对倒立摆系统的进行了稳定性和可控性的分析。得出结论:倒立摆是一个不稳定系统,但它是可控的。3 模糊控制与神经网络理论基础第 12 页 共 41 页3.1 模糊控制理论模糊控制是一门发展迅速,有着广阔应用前景的新技术。随着模糊理论的不断深入以及系统的不断规范化,模糊控制技术将在广度和深度上进一步发展。同时,模糊控制技术应用的灵活性与简便性以及特有的处理模糊信息的功能,将在人工智能和新一代计算机的研制中发挥巨大作用 1。3.1.1 模糊集合及其运算设U为某些对象的集合,称为论域,可以是连续的或离散的; 表示 的uU元素,
31、记作 。论域 到0, 1区间的任一映射 ,即 ,都uUF1,0:确定 的一个模糊子集 , F 称为 的隶属函数( membership function)或隶属度(grade of membership)。也就是说 F 表示 属于模糊子集 的程度或u等级。在论域 中,可以把模糊子集表示为元素 与其隶属函数 的序偶)(uF集合,记为: (3-Uur,1)若U为连续,则模糊集F可记作: (3-uF/)(2)若U为离散,则模糊集F可记为:, (3-niiiFnFF uuuu121 /)(/)(/)(/)( n2,13)设A和B为论域U中的两个模糊集,其隶属函数分别为 ,和 ,则对于AB所有 ,存在下
32、列运算:u1A与B 的并(逻辑或)记为 ,其隶属函数定义为:BA(3-)(,max)()()( uuuBABA 4)2 A与B 的交(逻辑与)记为 ,其隶属函数定义为:(3-)(,in)()()( uuuBABABA 5)第 13 页 共 41 页3 A的补(逻辑非)记为 ,其传递函数定义为:A(3-)(1)(uA6)4 直积(笛卡儿乘积,代数积)若 。分别为论域nA21,中的模糊集合,则这些集合的直积是乘积空间 。中nU21, nU一个模糊集合,其隶属函数为:(3-)()()(),(min),( 112121 nAAnAAA uuun 7)3.1.2 模糊关系N元模糊关系R是定义在直积 上的
33、模糊集合,它可表示为:nU21(3- nnUnn nnRuu u 2121 )(),( )(,(,21 21218)因此,模糊关系也是模糊集合,所以它可用如上所述的表示模糊集合的方法来表示。此外,在有些情况下,它还可以用矩阵和图的形式来更形象地加以描述。当 , 是有限集合时,定义在 上的模糊nU21 nV21 VU关系R 可用如下 阶矩阵来表示。m(3-),(),(),( , )()()(21 22 1211 mnRnRnR mRRR yxyxyx 9)这样的矩阵称为模糊矩阵,由于其元素均为隶属度函数,故其均在0, 1中取值。模糊关系是定义在直积空间上的模糊集合,所以它也遵从一般模糊集合的运算
34、规则,例如:包含: ),(),(yxSRSR并: ),(SR交: (3-,10)第 14 页 共 41 页补: ),(1),(yxyxRR在日常生活中,两个单纯关系的组合可以构成一种新的合成关系。例如,有u, v, w 三个人,若v 是u的妹妹,而u又是w的丈夫,则v与w就是一种新的关系,即姑嫂关系。用关系式表示的话,就可写作:(3-夫 妻兄 妹姑 嫂 11)模糊关系和普通关系一样,两种模糊关系可以组合成一种合成关系。设P是 上的模糊关系,Q是 的模糊关系,则R和S是 上的模VUWVWU糊关系,它是 的合成,其隶属函数被定义为:(3-),(),(),(),( wvuwuuQPQPR 12)若式
35、中算子 代表“取小min”, 代表“取大max”运算,这种合成关系即为最大最小值合成,合成关系 。R3.1.3 模糊控制模糊控制理论从出现至今得到了飞速的发展,和常规的控制器相比,它无须建立被控对象的数学模型,对非线性、时变、大滞后系统控制效果良好。一般来说,根据人们的直接操作经验,再运用模糊集合论的知识,就可以构成一个模糊控制器。如图3.1所示即模糊控制器的原理框图:图3.1 模糊控制原理图不难看出,模糊控制器与一般控制器的相似点在于,其组成的基本环节是一致的,即由控制对象、控制器和反馈通道等环节组成。但两者的设计方法又有区别。模糊控制不受数学模型的束缚,而是利用模糊语言,采用条件语句组成的
36、语句模型,来确立各参数的控制规则并生成模糊控制表,并在实际过程中反复经人工修正。然后通过计算机采用查表法在控制表中找出相应的模糊控制量,最后经一定比例运算后得到实际控制量再加到被控对象上。3.1.4 模糊控制的特点模糊控制是建立在人工经验基础上的。对于一个熟练的操作人员,他并非第 15 页 共 41 页需要了解被控对象精确的数学模型,而是凭借其丰富的实践经验,采取适当的对策来巧妙地控制一个复杂过程。它在最近的短短十多年来发展如此迅速,这主要归结于模糊控制器的一些明显的特点:1无需知道被控制对象的数学模型模糊控制是以人对被控系统的控制经验为依据而设计的控制器,故无需知道被控系统的数学模型。2是一
37、种反映人类智慧思维的智能控制模糊控制采用人类思维中的模糊量,如高、中、低、大、小等,控制量由模糊推理导出。这些模糊量和模糊推理是人类通常智能活动的体现。3易被人们所接受模糊控制的核心是控制规则,这些规则是以人类语言表示的,如模糊全自动洗衣机中检测衣服较脏,则投入洗涤剂较多,洗涤时间较长,很明显这些规则易被一般人所接受理解。4鲁棒性好干扰和参数变化对控制效果的影响被大大减弱,尤其适合于非线性、时变及纯滞后系统的控制。但是模糊控制毕竟还是一门新兴学科,仍有许多问题有待解决。至今它还没有成为完善的系统分析技术。一般而言,目前在理论上还无法像经典控制理论那样证明运用模糊逻辑的控制系统的稳定性。模糊逻辑
38、控制规则是靠人的直觉经验制定的,它本身并不具有学习功能。在用软件实现的复杂系统中,模糊控制规则越多,控制运算的实时性越差,而且需要识别和建立规则和时间随规则数增加而以指数形式增长。正因为如此,模糊逻辑的应用范围受到限制,其作用长期不能得到充分发挥。未来的模糊控制技术是多种技术综合运用的产物,与其它智能控制方法如:专家控制、神经网络控制及遗传算法相结合是它的发展方向,另外模糊控制系统一般都是非线性系统,模糊控制系统参数的优化问题与非线性系统的优化问题紧密相关,所以研究非线性理论的发展将会对模糊控制的发展大有益处。3.2 神经网络理论人工神经网络 (ANN, Artificial Neural N
39、etworks),简称神经网络,是由人工神经元(简称神经元)互联组成的网络,它是从微观结构和功能上对人脑的抽象、简化,是模拟人类智能的一条重要途径,反映了人脑功能的若干基本特征,如并行信息处理、学习、联想、模式分类、记忆等。神经网络具有学习能力、自适应能力、自组织能力和容错修复能力,不需要对被描述的对象建模,能够较好地描述非线性系统和不确定性系统。第 16 页 共 41 页3.2.1 神经网络基础单神经元模型人脑神经元是组成人脑神经系统的最基本单元。对人脑神经元进行抽象简化后得到一种称为 MP 模型的人工神经元 10,如图 3.2 所示。 图 3.2 单神经元模型对于第 i 个神经元, 是神经
40、元接收到的信息, , 为链Nx.,21 21iwiN接强度,称之为权。利用某种运算把输入信号的作用结合起来,给出他们的总效果,称之为“净输入 ”,用 来表示。根据不同的运算方式,其中最简单一种是线性inet加权求和,此作用引起神经元 i 的变化,而神经元 的输出 是其当前的状态函iiy数 称之为激活函数(State of activation)。这样,上述模型的数学表达式如)(g下,式中: 。的 阈 值神 经 元 i(3-ijNjiixwnet113) )(iinetgy(3-14 )对于不同的应用,所采用的激活函数也不同,应用与控制中的神经元所采用的激活函数有以下三种:(a)线性函数 (b)
41、线性阈值函数 (c)Sigmoid 函数图 3.3 人工神经元激活函数特性1简单线性函数:神经元的激活函数 连续取值(图 3.3a),各神)(inetg经元构成的输出矢量 y 由输入矢量 X 与连接矩阵 W 加权产生,输出为(3-)()1(kky第 17 页 共 41 页15)2线性阈值函数(硬限幅函数) 这是一种非线性函数(图 3.3b),输出只取两值,如+1 或-1(或 1 与 0),当净输入大于某一阈值 时,输出取+1,反之取-1 ,这一特性可用符号函数表示。(3-)(sgn)(kWXky16)3Sigmoid 函数( S 型函数) 神经元的输出是限制在两个有限值之间的连续非减函数,其表
42、达式为:(3-)(1tanh)(0kXuky17)如图 3.3c 所示,通过改变 值的大小来调整曲线的曲率,函数的最大值分0别是+1 和-1。3.2.2 神经网络基本结构神经元与神经元之间按一定规则进行连接,便可构成神经网络,最一般的神经网络结构是神经元两两相连构成全连接型神经网络。事实上,多数情况下,神经元之间不会采用全连接形式的,因为,当神经元数目较大时,连接权值的数目将太多,难以处理。减少连接权值的一种做法是采用多层结构,如图3.4所示:图3.4 多层结构图3.4所示的多层结构神经网络还有多种变化。如在同一层内的神经元可以相连,或部分相连。输出层也可以有部分神经元反馈至隐层。从仿生学角度
43、来第 18 页 共 41 页说,多层结构神经网络更接近人脑结构。如视觉系统中,神经元就是具有层次结构的。输入信号经输入层后,进入中间层,经处理后,才进入输出层,最后产生响应。Kolgmogrov定理:隐含层神经元数目为2n+1的三层神经网络可以任意精度实现连续映射 (n是输入神经元个数, m为输出神经元个mnRF1,0:数)。在实际应用中,往往己知 中的若干样本,而不知其映射关系 ,A1,0F或者无法找出 的显示表达式,通过修正网络各个连接权值得到在最小二乘准则下的函数映射。3.2.3 神经网络的学习一般来说,神经网络的结构是相对固定的,但其功能上却可以多种多样,这是通过变化神经网络内部权值得
44、到的。给定某一任务,如何调整神经网络的权值,这就是神经网络学习要解决的问题。神经网络的学习大致分为两类:无监督学习和有监督学习。无监督学习又称自组织学习,其主要作用有两个,其一是数据压缩,输入数据经无监督学习后,维数减少,而信息损失则可以不大。其二是简化数据表示。这使得我们可用较简单的算法来解决问题。无监督学习只要求提供输入,而输出是学习过程自行产生。有监督学习主要作用是实现给定的映射关系。有监督学习要求提供输入及相应的输出(样本和期望),神经网络经过学习来实现这种输入输出映射关系。多层感知器的误差反向传播学习算法,是有监督学习典范之一。从另一角度看,神经网络学习解决的是状态动力学的问题。即网
45、络中不同神经元的状态变化情况。它可以是从整个神经网络的角度考虑问题;也可以是只考虑神经元的局部状态变化。在神经网络中,不同神经元是通过连接权值进行相互作用的,学习过程也就是权值的调整过程。神经元是神经网络的基本单元。神经元可能处于兴奋状态,也可能处于非兴奋状态。处于不同状态的两个神经元,其相互作用也是不同的,最基本的学习规则是从神经元的状态开始的,值得一提的是Hebb规则。Hebb规则是神经元学习最原始的规则,其具体表现形式为:在神经网络中,当两个相互连接的神经元,同时被激活时,则其连接权值得到加强,其余情况,连接权值不变。3.2.4 神经网络控制神经网络控制的研究始于20世纪60年代,196
46、0年,Widrow和Hoff 首先把神经网络用于控制系统。Kilmer和McCulloch 提出了KMB神经网络模型,并在“阿波罗”登月计划中应用,取得了良好的效果。70年代神经网络研究处于低谷,第 19 页 共 41 页所以神经网络控制没有再发展。从80年代后期开始,神经网络控制开始受到重视,但大多数集中在自适应控制方法上。目前,神经网络控制正朝着智能控制深度的方向发展。在智能控制系统中,最重要的有两点。一点是和知识基有关的推理机型,另一点是随环境变化的适应能力。一般而言。推理是以符号为元素执行的,而客观世界中的信号是数值,为了理解过程的状态。需要实施数值数据到符号数据的映射,这就要把数值数
47、据进行分类。另外,对过程的控制需要自适应控制器。神经网络的分类功能和学习能力使得它可以有效地用于智能控制系统。神经网络控制的结构和种类划分,根据不同的观点可以有不同的形式, 目前尚无统一的分类标准。如果从它与传统控制和智能控制两大门类的结合上考虑,可将神经网络控制原则上分为两大类:1基于神经网络的智能控制它是指只有神经网络单独进行控制或由神经网络同其它智能控制方式相融合的控制的统称,前者称为神经控制,后者称为神经智能控制。如神经网络直接反馈控制,神经网络专家系统控制,神经网络模糊逻辑控制,神经网络滑模控制,神经网络自适应控制等。2基于传统控制理论的神经控制基于传统控制理论的神经控制是指将神经网络作为控制系统中的一个或几个部分,用以充当辨识器、对象模型、控制器、估计器,或进行优化计算等。如神经网络逆控制,神经网络自适应控制,神经内模控制,神经预测控制,神经自校正控制等。3.2.