1、江苏大学硕士学位论文基于动态递归模糊神经网络的微生物发酵过程软测量方法研究姓名:张瑶申请学位级别:硕士专业:控制理论与控制工程指导教师:孙玉坤20100612江苏大学硕士学位论文,硒,(,), ,(),谢,:();学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权江苏大学可以将本学位论文的全部内容或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于保密口,在年解密后适用本授权书。不保密一。砷勺年;月,日沁年月目 独创性声明本人
2、郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中己注明引用的内容以外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:宕并曰影日期:汐,年月江苏大学硕士学位论文研究背景和意义研究背景第一章绪论微生物发酵工程【】是生物工程和现代生物技术及其产业化的基础。随着生物工程技术的迅猛发展,发酵工业的生产规模不断扩大,生产过程不断强化, 对自动控制技术的要求越来越迫切。然而,生物反应过程不同于一般的过程工业,它是一个时变、非 线性、强耦
3、合、不确定的多 变量输入输出的关联系统,涉及到生命体的生长繁殖过程,机理十分复杂。微生物的生 长代谢要依赖于多个状态变量,菌体的生长、 产物形成 对不同状态变量的要求差异很大, 为了实现微生物生长的最优生长轨迹,对这些过程变量的在线检测及多变量解耦控制是一项关键技术。但生物发酵过程中的某些量,如菌体浓度、基 质浓度、产物浓度等,目前无法在线测量,而这些量又是直接反映发酵品质的重要生化参量。因此如何实现关键生化参量的在线测量,并最终实现无耦合的最优控制,已成为生物发酵过程中迫切需要解决的问题之一。目前这些参数的检测一般都是通过人工定量取样后在实验室离线化验获得,这样不但影响了发酵过程的实时控制效
4、果,而且容易染菌,大大限制了先进控制技术在发酵过程中的应用。这对产量、效益和能耗都有很大的影响。对此问题的解决方法有两种方法:一是研究新的检测手段,研制在线测量传感器。近年来一些在线分析仪器(传感器)已有出现,但由于价格昂贵,维护保养复杂,测量滞后大,难以满足过程控制及生产要求,目前几乎还没有能真正应用于工业生产的在线测量这些参数的传感器。二是采用间接测量方法,即软测量技术对关键生物量参数进行在线估计。随着信息技术和计算机技术的发展,新出现的软测量技术是解决上述问题的有效途径。在生物发酵过程中,利用较易测出的辅助变量和离线分析的大量数据,建立软测量模型对主导变量进行在线估计是微生物发酵优化控制
5、新的方法。从总体上看,生物反应过程软测量的研究成果仍然是理论多于应用,很多关江苏大学硕士学位论文键变量(如总糖浓度和菌丝浓度)的软测量技术都没有解决,严重制约了先进控制理论在生物反应过程中的应用,生物反应设备的控制精度达不到国际先进水平,导致国外生物发酵设备大量涌入国内,占据国内很大的市场份额。特 别是细胞生物反应器完全依赖进口,昂贵的价格严重制约我国丌展生物技术的研究和生物制品的开发。因此,研究生物反 应过程数学模型的建立、 发酵过程关键参量的在线软测量,对提高我国生物反应设备的控制水平、提高装备性能、降低能耗、提高产量,缩 小与国际水平的差距,都具有重大意义。课题意义赖氨酸是人体必需氨基酸
6、之一,能促进人体发育、增 强免疫功能,并有提高中枢神经组织功能的作用,; 赖氨酸为碱性必需氨基酸,可以调节人体代谢平衡。赖氨酸为合成肉碱提供结构组分,而肉碱会促使 细胞中脂肪酸的合成。如果往食物中添加少量的赖氨酸,可以刺激胃蛋白酶与胃酸的分泌,提高胃液分泌功效,起到增进食欲、促进幼儿生长与发育的作用。赖氨酸还能提高钙的吸收及其在体内的积累,加速骨骼生长。如缺乏 赖氨酸,会造成胃液分泌不足而出现厌食、 营养性贫血,致使中枢神 经受阻、发育不良。人 们知道,蛋白质是构成人体细胞的主要成份,食物中的蛋白质进入人体后经过消化先分解成氨基酸,然后人体又利用这些氨基酸再合成新的人体蛋白质,如免疫抗体、消化
7、酶、血浆蛋白、生 长激素等都是合成后的人体蛋白 质。在合成蛋白质的各种氨基酸中,一 赖氨酸是最重要的一种,少了它,其它氨基酸就受到限制或得不到利用,科学家称它为人体第一必需氨基酸。近年来,科学家还发现,一赖氨酸是控制人体生 长的重要物 质抑长素(,)中最重要的也是最必需的成份,对人的中枢神经和周围神经系统都起着重要作用。人体不能自身合成一赖氨酸,必须从食物中吸取 赖氨酸是帮助其它营养物质被人体充分吸收和利用的关键物质,人体只有补充了足够的一赖氨酸才能提高食物蛋白质的吸收和利用,达到均衡营养,促进生长发育。菌体浓度,基 质中的葡萄糖浓度, 产物浓度是赖氨酸发酵过程中最重要的参数,直接影响着发酵过
8、程的控制和优化,也直接关系到发酵产品的产量和质量。如何实现这些重要参量的在线检测和确定一组最优的环境参量,实现无耦合的最江苏大学硕士学位论文优控制,是制约赖氨酸反应技术发展的“瓶颈”问题。同时,由于缺少 对过程参数的测量、监测 和控制的实时系统,使得 发酵产品的成本高、操作 费用高。降低 发酵过程的能耗、降低成本和提高产品的产率是发酵过程控制的一个目标,而实现这个目标最重要的环节,就是能够在不增加实际仪表的基础上实时地获得过程参数。长期以来,赖氨酸发酵工业的自动检测对象, 还主要集中在一些相 对比较容易测量的,有成熟的仪器仪表可以直接进行测量的参数上,比如温度、值、溶氧()、压 力等。而对于影
9、响发酵过程的某些关键生物量参数,如菌体浓度、基质浓度和 产物浓度等,目前还难以实时在线检测。目前这些参数的检测现状一般是通过人工定时取样后在实验室通过离线分析获得,工艺参数调整依赖于传统的经验方法, 这样不但影响系统的实时控制效果,而且容易染菌,大大限制了先进控制技术在生化过程中的应用。因此,应用神经网络等智能方法,研究赖氨酸发酵过程中生物量,基质糖度和产物浓度的软测量方法,实现它们的在线实时检测具有重要的理论意义和非常实际的应用价值。生物反应过程测控技术的发展现状与趋势要对发酵过程实行建模与控制,首先要解决过程的有关参数在线检测问题。一般的耗氧型发酵罐系统要测量的过程参数可分为物理参数、化学
10、参数和生物参数。物理参数通常有发酵罐温度,发酵罐压力, 发酵液体积,空气流量,冷却水流量,冷却水进出口温度,搅拌转速,泡沫高度等,这些参数都有成熟的传感器可以直接实现在线测量。化学参数典型的有值、溶解氧浓度(),它们对十发酵过程非常重要,发酵过程都需要有合适的酸碱环境才能朝着期望的方向进行,而溶解氧浓度则是限制菌体生长的关键因素之一,溶解氧低于临界值会使发酵过程急剧恶化。近年来,已有成熟的溶解电极可以应用。生物参数通常包括生物质呼吸代谢参数、生物质浓度、代 谢产物浓度、底物浓度以及生物比生长速率,底物消耗速率和产物形成速率等。主要生物参数如基质浓度、产物浓度和代谢物浓度, 还没有可在线实用的测
11、量仪器。在实验 室中,已有用质谱仪、高压液相分析仪()、流注式分析仪()江苏大学硕士学位论文和核磁共振分析仪来测量发酵液中各种物质的浓度。由于成本太高,尚没有处在应用阶段。所以,在工业生产 上,这些参数的测量大都基十取出发酵液样品到实验室采用化学分析方法或借用如仪器来分析。由于分析一个样品要很长的时间,一般是小时或数小时取样分析一次, 这对于实时控制来说,很 难利用这些数据。正在研究的测量方法有两种:一种是研究新的生物传感器,另一种是采用软测量技术,目前大多采用软测量技术。软测量的基本原理和应用软测量的基本原理软测量技术的理论起始于世纪年代提出的推断控制理论。推断控制的基本思想是采集过程中比较
12、容易测量的辅助变量(,也称为二次变量),通过构造推断估计器来估计并克服扰动和测量噪声对过程主导变量()的影响。推断控制系统的设计包括推断估计器的设计和控制器的设计。推断估计器是控制器的基础,也是整个推断控制系统设计的关键。估 计器的设计是根据某种最优准则,选择一组既与主导变量(即被估计变量)密切相关,又与容易测量的一组辅助变量密切相关,通过构造某种以辅助变量为输入,主 导变量为输出的数学模型,用计算机软件实现主导变量的在线估计。用数学关系式可以表示为(,“,)()即软测量模型的输出将依赖于控制输入“、可测扰动、辅助变量目的选取以及估计函数厂。另外,离线分析 值,通常被用于软测量模型的校正。这类
13、数学模型及相应的计算机软件也被称为软测量器或软仪表。在微生物发酵过程中,由易测量的过程变量(如、等),借助于“软测量模型”,通过各种计算和估计,实现对待测过程变量(如基质浓度、产物浓度)的软测量。软测量估计值可作为控制系统的被控变量或反映过程特征的工艺参数,为优化控制与决策提供重要信息。建立软测量仪表的步骤包括:辅助变量的选择、数据预处理、软测量模型的建立以及软测量模型的在线校下等五个环节。江苏大学硕士学位论文辅 助 变量的 选择辅助变量的选择对建立一个成熟有效的软测量模型至关重要口。如果变量选择不当,会直接影响到模型的精度与软测量的成败。 辅助变量的选择包括变量类型的选择、变量数量的选择和检
14、测点位置的选择。辅助变量选择范围是工程对象的可测变量集。根据工艺机理分析,在可测变量集中选择对主导变量影响较大的变量作为初始辅助变量。然后根据变量的灵敏性(能对过程输出或不可测扰动做出快速响应)、工程适用性(工程上易于获得并能达到一定的测量精度)、精确性(构成的软仪表能达到的要求精度)和鲁棒性(构成的软仪表对模型误差不敏感)的原则选择最终的辅助变量。变量数目必须满足精简性原则,尽可能用最少变量获得精度足够的模型。这种机理分析指导辅助变量的选择方法,可以使软测量的设计更合理。若软测量对象的工艺激励过于复杂或缺乏机理知识,则可采用主元分析法()、部分最小二乘回归()、遗传算法与贝叶斯给结合、灰关
15、联方法等。目前在实际工业过程中,变量的最优数量的确定尚无统一的结论,可以从系统的自由度出发,确定辅助变量的最小数量,再 结合具体生产过程的特点适当增加,以更好处理动态性质问题。具体采用哪一种 辅助变量选择法要具体问题具体分析,依据问题性质,待分析的目标和数据类型、以及所使用的软测量建模方法而定。如张伟等阽采用一种机理与主元分析相 结合选择纸浆漂白软测量辅助变量的选择方法。李勇等田采用了一种新的灰关联度分析方法,对软测量辅助变量进行选择,并 给出了一种实用的冗余变量剔除方法。数据的采集及预处理从理论上讲,过程数据包含了工业对象的大量信息因此数据采集是多多益善,不仅可以用来建模,还可以校验模型。
16、实际需要采集的数据是与 软测量对象实测值对应时问的辅助变量的过程数据。在进行数据采集时,要要使采集的样本空间尽可能覆盖整个操作范围,同时要本着有代表性、均匀性和精简性的原则进行选择。所谓有代表性和均匀性,是指采集的每一个数在样本空间要有一定的代表性,采集的数据不仅要覆盖整个操作范围,而且每个特征点选取的样本量要均匀,不能在某一个特征点上大量重复选取,而在其余特征点上只有零星数据。所谓精简性是指选取的样本数量不要太大,只要保证模型的训练效果即可,否则这会导致网络结构过于复杂、学习困难、模型泛化性能差。在实际工业过程中,数江苏大学硕士学位论文据一般都是通过现场测量仪表获得,由于受到仪表精度、现场测
17、量环境和测量方法以及人为因素的影响,不可避免地带来各种各样的误差,甚至出现错误数据。具体采集的数据误差分为随机误差和过失误差两类,前者受随机因素的影响,如操作过程微小的波动或测量信号的噪声等,后者来源于仪表的系统误差(如校正不准等)以及不完全或不正确的过程模型等。从而影响过程建模的效果和控制质量,因此必须对原始数据进行预处理,剔除 错误数据。数据的预处理常用的方法有统计假设检验法(如残差分析法、校正量分析法等)、广义似然比法和 贝叶斯法、基于聚 类分析的误差侦破方法【 、多重小波变换阈值去噪法等, 对于特别重要的过程变量还可采用硬件冗余的方法以提高安全性。在对采集的数据进行误差处理之后,还需要
18、对数据进行标准化处理。因为工业过程中的测量数据有着不同的工作单位,变量之间在数值上可能相差几个数量级,直接使用这些数据进行计算时不能反映数据本身的变化情况,由于计算机字长有限也有可能会丢失信息,甚至引起算法的数值不稳定的问题。在测量数据用于软测量建模之前,通常对其进行数据标准化处理,即同时对数据进行中心化处理和无量纲处理。软测量的建模方法软测量模型建立是以软测量技术为核心。软测量模型是人们在深入理解过程机理基础上叫,利用建模、辨 识的方法得到的适于估 计的模型。它不同于一般意义下的数学模型,强调的是通过辅助变量来获得对主变量的最佳估计。总的来说可以归纳为传统的软测量建模方法、基于统计分析的方法
19、、基于统计学习理论的方法、人工智能方法及混合建模方法等。()传统的软测 量建模方法 )机理建模机理建模方法建立在对工艺机理深刻认识的基础上,通过列写宏观或微观的质量平衡、能量平衡、动量平衡方程、相平衡方程以及反应动力学方程等来确定难测的主导变量和易测的辅助变量之间的数学关系。【】等采用机理模型构造观测器的方法对分批发酵过程的生物量参数进行估计和优化。与其它方法建立的软测量模型相比,机理模型的可解释性强、工程背景清晰、便于实际应用,是最理想的软测量模型。但是,建立机理模型必须对工业过程的工艺机理认识得江苏大学硕士学位论文非常清楚,由于化工过程中普遍存在的非线性、复杂性和不确定性的影响,很多过程难
20、以进行完全的机理建模。此外由于机理模型一般是由代数方程组、微分方程组甚至偏微分方程组所组成,当模型复杂时,其求解过程计算量很大,收 敛慢,难以满足在线实时估计的要求。)基于对象数学模型建模由于软测量是控制学中的一个分支,因此在其发展初期,很多人尝试使用控制学中的基于对象数学模型的方法来建立软测量模型。常用的方法有基于状态估计的方法、基于线性模型的方法和基于非线性模型的方法。这些方法一般是建立在滤波器和扩展的滤波器的基础上的。如果描述对象的是稳态模型,则软仪表可采用估计器构造;如果描述对象的是动态模型,则采用自适应估计的方法来建模。其中基于非线性模型的方法主要是采用了非线性的对象数学模型,而在计
21、算过程中做了线性化等简化处理,甚至又将问题变换到了线性的范畴。在过程控制中,要对一个被监控的过程进行建模就必须先采集过程的输入输出数据,这些数据在采集时最基本的条件就是满足采样定理。然而在化工过程中涉及到的软测量问题比较特殊,过程对象的主导变量通常只能通过定时离线人工分析得到,离线人工分析通常需要数小时之久,且采样间隔通常较大,因此得到的主导变量的分析值是离散的,不满足采样定理。由于只有与之相对应的一段时间内的过程辅助变量的值与离散的主导变量之间才有因果关系,因此采集到的与离散的(指大时间间隔)主导变量相对应的过程辅助变量也必然是离散的。动态建模所需的数据应该是满足采样定理的能够反映系统动态特
22、性的输入输出序列,在处理这些问题时, 许多动态系统建模的方法就不再适用了。此外,由于发酵过程通常具有较强的非线性,因此实际上很难用前面提到的机理建模方法和基于控制对象数学模型的方法来建立软测量模型。()基于统计分析的方法建模基于统计分析的方法在软测量中通常指的是化学计量学()中的某些方法,如主元分析(,简称)、部分最小二乘(,简称)等。化学 计量学是分析化学的一个分支,是数学方法和统计分析方法在化工过程数据分析中的应用,近年来被频繁应用到过程控制领域的过程仪器维护和过程建模中。基于化学计量学方法的过程建模是建立在过程丰富的历史记录数据的基础江苏大学硕士学位论文上的。目前由于硬件条件的改进, 过
23、程工业进行数据采集的检测点越来越多,采集的频率也越来越快,一个工业过程对象一般就要监测几百个过程变量,每个变量每天要记录几千个数据,因此采集到的过程数据是海量的。此外,在化工过程中,大部分过 程变量是相互关联的,采集到的 过程数据中包含了大量的冗余信息。因此,如何从这些海量的、互相关联的过程数据中提取出过程信息,是十分重要的。而化学计量学研究的目的正是在采集到的大量过程数据中通过数学或统计学方法提取出过程的状态信息(有时也包括动态信息),即对采集到的大量过程数据进行压缩和信息抽取从而提取出有用的信息,因此,化学计量学方法是一种很好的基于过程历史数据的过程建模策略。而软测量技术从本质上来说可以看
24、作是一种较特殊的过程建模,因此,很多化学 计量学方法也适用于软测量建模的范畴。化学计量学的基本方法有主元分析()、部分最乘法()以及在此基础上的一些变型和应用,如多路、多路、非线性、非线性等。主元分析方法是进行数据压缩和信息抽取的有力工具,它的主要思想是在保证信息损失最小的前提下,将过程数据从高维数据空间投影到低维特征空间,从而消去冗余信息,有利于精简模型结构,提高模型运算速度。在主元分析的基础上,用线性回归方法寻找得到的主元矩阵和因变量问关系的过程称为主元回归()。由于能较好地解决数据相关性的 问题,近年来在过程建模、故障诊断和过程监控中得到了广泛的应用【,】。部分最小二乘回归()是建立在主
25、元分析原理之上的,它不像主元分析那样只能处理同一矩阵内各向量间的相关关系,而是可以在数据压缩和信息抽取的同时建立模型来描述自变量和因变量矩阵之间的关系。在算法下,可以同时实现回归建模、数据结构简化(主元分析)以及自变量和因变量问的相关分析(典型相关分析),这给多维复杂系统的分析带来了极大的便利。它已被证明在大多数情况下优于传统的线性回归方法和主元回归方法,具有更好的鲁棒性(这里鲁棒性是指当有新的训练数据加入或从训练集中剔除数据时,模型的参数不会有太大的改变),因此,部分最小二乘回 归在软测量建模中得到了广泛的应用。()基于人工智能的软测量建模基于人工智能的软测量建模方法有很多,如基于模式识别的
26、方法,基于人工江苏大学硕士学位论文神经网络的方法,以及基于模糊集合理论的方法等。)基于模式识别 的软测量建模方法基于模式识别的软测量建模方法的基本思想是在缺乏系统先验知识的情况下,用模式识别的方法对系统的输入输出数据进行处理,从中提取系统的特征,构成以模式描述分类为基础的模式识别模型。这种方法不需要系统的先验知识,对系统的定性描述还是比较有效的,然而软仪表不仅要求给出定性的分类结果,还要求结果的定量预报,所以此方法仅在软测量技术兴起的早期有过一些研究报道。)基于人工神经网络的软测 量建模方法人工神经网络(,简称舢州)是利用计算机模拟人脑的结构和功能的。新学科,是目前软测量研究中最活跃的领域,有
27、很多综述性报道。它具有并行计算、学习记忆能力及自组织、自适应和容错能力优良等性质,且无需具备对象的先验知识,而是根据 对象的输入输出数据直接建模,即将辅助变量作为的输入,将主 导变量作为输出,通过网络的学习来解决不可测变量的软测量问题,因此在解决高度非线性和严重不确定性系统控制方面具有巨大的潜力。由于多层前向神经网络(,简称州)和径向基函数(,简称)神经网络已被证明具有以任意精度进行非线性函数拟合的能力,因而得到了广泛的应用。多层前向神经网络中应用最广泛的学习算法是()算法,其核心是把一组样本的输入输出问题变为一个非线性优化问题,在优化中使用了最普通的梯度下降法,用迭代运算求解权值。啪详细讨论
28、了软测量应用于化工过程控制的情况,认为软仪表具有安装、 维护费用低,可靠性和预测精度高的优点,并提出了基于的 软测量方案。等【】采用前馈神经网络建立软测量模型根据牛奶脂肪酸对制乳罐中的瘤胃发酵模式进行预测,并将该算法与统计学中多线性回归方法进行比较,仿真结果证明基于砧州的软测量模型具有较好的预测性能。虽然算法得到了广泛的应用,但是算法存在以下几个缺点:一是学习过程收敛速度很慢;二是健忘,即当输入一个新的样本进行权值调整时可能破坏网络权值对已学习样本的匹配情况;三是容易陷入局部极小。目前虽然提出了很多改进算法,但是并没有从根本上解决算法的不足。江苏大学硕士学位论文网络可以看作具有三 层结构的前馈
29、神经网 络,输入变量数目等于所研究问题的独立变量数,隐含层选取基函数作为转移函数,输出层为一个线性组合器。网络能在一定程度上解决多 层前馈神经网络收敛速度慢和存在局部极小的问题,且具有更广泛的非线性适应能力,因而在建模工作中应用的很多。邱 书波等【】提出了一种新的神经网络在线学习算法, 该 算法能在线实时地调整神经网络的隐含层单 元数和网络参数,并使用 计算量小、运算速度快的基于逆分解的递推最小二乘算法调整网络权值,克服了离线训练方法的不足。虽然人工神经网络在建模时无需具备对象的先验知识,并且已被证明了可以任意精度逼近非线性连续函数,但是该证明实质上是一个存在性证明而非构造性证明,网络的性能要
30、受 训练样本的空间分布、 样本的质量和训练算法的影响。此外,在实际建模时,受数据采集、系统的噪声和不确定性等复杂因素的影响,网络结构的确定、网络训练算法的选择等问题是面临的难题,目前尚没有理论方法进行指导,而不同的网络结构、 训练方法和收敛准则会导致网络具有不同的泛化能力。因此基于神经网络建立的软测量模型在鲁棒性和精确性方面还需进一步改善,模糊神经网络的提出就是针对这个问题而提出的一种解决办法。)基于模糊集合理论的软测 量建模模糊集理论模仿人脑逻辑思维特点,以模糊命题表示概念和知识,以模糊逻辑及其推理模拟人类思维并进行知识处理,是处理模型未知或具不确定性的复杂系统的一种有效手段。近年来,模糊集
31、理论大量应用于软测量中,但是通常是与神经网络结合构成模糊神经网络以建立复杂过程的软测量模型。模糊神经网络中保留了常规人工神经网络的结构,但是模糊集理论与神经网络相结合的形式则多种多样,如对 网络的激活函数、权值、输入信号或输出信号等进行模糊化。模糊神经网络结合了模糊集理论与人工神经网络的优点,其既有模糊逻辑那样表达近似于定性知识的能力,又具有神经网络很强的自学习和处理定量数据的能力,因而非常适合处理一些复杂的非线性软测量建模问题。方千山等团】应用模糊控制的逻辑推理性能,借助神经网络的学习能力,提出了一种模糊神经网络预测控制模型。利用该 模型对发酵过程的预测控制,可 获得较高的预测精度和较好的控
32、制效果。】提出一种改进的模糊神经网络,使用小波基改变模糊规则。为了提高系统的收敛性,选择小波基和正交最小二乘算法初始化网络,模型的参江苏大学硕士学位论文数由最陡坡下降法和最小二乘估计法进行训练。用该方法建立的盐酸浓度软测量模型收敛快, 预测精度高。()基于统计学 习理论的方法基于统计学习理论的软测量建模方法主要指的是基于支持向量机(,简称)的方法。传统的机器学习算法都是以经典统计学中的渐进理论为依据,其理论基础为统计学中的大数定理,即统计规律只有在已知样本数无限多的情况下才显露出来,许多算法的结论都是在训练样本趋于无穷的假设下得到的,然而在实际中训练样本总是有限的,因此,以样本数量趋于无穷所得
33、到的经验风险最小化原则为基础的算法,如神经网络等算法,往往会出现过拟合、模型过于复杂等弊端。统计学习理论(,简称)正是一种专门研究有限样本下机器学习规律的理论。搿等人从二十世 纪六、七十年代开始致力于的研究,其基本体系早已建立,然而由于其晦涩的,。数学公式、复杂的理论推导,使得其没有表 现出很大的实际价值。直到二十世 纪九十年代,随着其理论的不断发展和成熟(特别是由于支持向量机的提出),也由于神经网络等学习方法在理论上缺乏实质性的进展,统计学习理论开始受到越来越广泛的重视。与传统统计学相比,统计学习理论是一种专门研究小样本情况下机器学习规律的理论。而支持向量机(,或)是主提出的一种基于统计学习
34、理论的新的通用学习方法。与神经网络的启发式学习方式和实现过程中的经验风险最小化相比,具有更 严格的理论和数学基础,其求解是基于结构风险最小化,因此泛化性能更好,且不存在局部最小问题,以及可以进行小样本学习等优点。因此,一些学者 认为,和正在成为继神经网络之后新的研究热点,并将有力地推动机器学习理论和技术的发展。最初被用于分类器的设计中,后来在定义了不敏感损失函数的基础上提出了支持向量回归(,简称)算法,因此,也可以很好地应用于函数拟合问题中。在支持向量机传统的求解算法二次规划算法(,又称算法)基础上,目前改进的训练的算法主要有块算法()、分解算法()、序贯最小优化算法(,简称)以及这些算法的改
35、进算法。由于采用结构风险最小化准则,在最小化样本点误差的同时, 缩小江苏大学硕士学位论文模型泛化误差的上界,即最小化模型的结构风险,从而提高了模型的泛化能力,同时它特别适用于解决小样本、非线性、高 维数、局部极小点等 问题。由于 发酵过程中大部分过程建模数据属于小样本、不适定问题,因此,近年来支持向量机在过程建模中得到了广泛的应用。()混合建模方法早期的软测量建模都是停留在单一方法的研究上,现在越来越多的研究已经开始热衷于研究基于多种建模方法混合的混合软测量模型。混合模型从结构上可以分为三大类,即串 联型结构、并 联型结构及交叉型结构。如李向阳等人则采用并联结构,神经网络的输入变量为主导变量的
36、人工分析值与简化机理模型的计算值之间的误差,用神 经网络来补偿简化机理模型中的未建模特性,而简化机理模型则可以提高整个模型的外推能力。等【】将遗传 算法与神经网络相结合并用于建立原油分馏塔产品的软测量模型。等将小波分析与砧州相结合建立基于小波神经网络的软测量模型并将其应用于发酵过程的预测控制中。等【】将粗糙集理论与神经网络相结合建立软测量模型并以此来估计催化裂化装置中轻柴油凝点。从采用的建模方法来分,混合建模方法又可分为机理建模方法与基于数据驱动的建模方法(从历史的输入输出数据中提取有用信息,构建主导变量与辅助变量之间的数学关系的方法,人工智能方法、基于化学计量学的方法及基于支持向量机的方法都
37、属于此类建模方法)的混合,神经网络与基于化学计量学的方法(如、等)的混合,基于化学计量学的方法与支持向量机的混合等。软测量模型的在 线校正由于化工生产过程的复杂性,一般难以甚至无法建立严格精确的数学模型来描述实际工业过程,而工业过程软测量技术核心模型一般仅能大致反映实际过程本质的变化趋势,因此模型误差必然存在。另外,软测量模型投入运行后,随着时间的推移,模型的预测精度常常会下降,出现模型老化现象, 这是由于化工过程的时变性以及建模样本的不完备性等因素造成的,因此需要及时的对老化的软测量模型进行在线校正。软测量模型在线校正可以分为模型输出校正和模型参数校正。模型输出校正是以软测量模型的估计值与实
38、际对象主导变量分析值的偏差来修正软测量模型目前的估计值。这种技术比较简单,但只适用于工况变化不大的场合。模型参数江苏大学硕士学位论文在线校正即在线校正软测量模型的参数,通常采用具有自适应的软测量模型,随着时间的推移,根据更新样本不断修正模型参数。 对软测量模型的校正有短期学习和长期学习两种思想【】。为了解决模型结构修正耗时长和在线校正的矛盾,研究人员提出了短期校正和长期校下。短期校正是在不改变模型结构的情况下,根据新采集的数据对模型的有关系数进行更新。长期校下是在工况发生较大变化时,利用新采集的大量数据重新建立模型。虽然软仪表的校正相当重要,但目前真正简便、实用软仪表校正方法还是不多,今后仍需
39、在这方面加强研究以适应实际工业过程的需要。软测量的应用情况多年来,对软测量技术的研究主要包括软测量建模方法、软测量数据预处理方法、辅助变量的选择(包括类型、数目等)及 软测量模型的在线校正几个方面,目的是为了提高软测量的精度和可靠性;软测量技术的研究经历了从线性到非线性、静态到动态、无校正功能到有校正功能 过程。 经过多年的 发展,目前已提出了不少构造软仪表的方法,并对影响软仪表性能的因素以及软仪表的在线校正等方面进行了较为深入的研究。关于软测量技术的应用,目前主要用于推断控制。在推断控制中,软测量作为控制系统的反馈环节或估计器,与各种控制器或控制策略结合,为系统提供快速而准确的状态信息,构成基于软测量的控制系统;由于软仪表可以像常规过程检测仪表一样为控制系统提供过程信息,解决有关影响产品质量、生产效益等关键性参数