1、水利工程智慧之路探讨从通用 IT到知识自动化到数据智能 刘辉 水利部水利水电规划设计总院 摘 要: 水利工程作为典型的工程学科, 理论和实践经验丰富。鉴于目前人们对工程安全的认知等原因, 基于数据的人工智能在水利工程上还没有实际应用点。水利行业通常采用知识自动化的方法来“获得”智慧, 即通过对信息的数字化和碎片化, 用数据可视化的方法找到规律, 提供决策。文章通过对通用 IT 技术、工程 IT 技术、传统工程信息化和数据智能工程的分析对比, 提出从通用 IT 到知识自动化再到数据智能的水利工程智慧之路。关键词: 水利工程; 数据; 智能; 自动化; 作者简介:刘辉 (1971 年) , 男,
2、高级工程师。收稿日期:2017-11-07Received: 2017-11-071 概述水利工程信息化和国家信息化战略一样, 经历了“十一五”的“以信息化带动工业化”, “十二五”的“信息化与工业化深度融合”。面对今天的“没有信息化就没有现代化”, 仍然需要思考最初的问题, 水利工程智慧和现代化需要什么样的信息化。10 多年来, 水利工程信息化以采集、传输和存储为信息化的核心, 打造了基于通用 IT 技术的水利工程信息化基础设施, 同时也培养了用信息化解决问题的基本理念。今天的水利工程现代化则更需要智慧。如何让水利工程具备智慧, 是需要认真思考的问题。当前, 基于通用 IT 技术的水利工程信
3、息化已触碰天花板, 这成为基本共识。水利工程智能面临两条路, 一是以“可在线复用的水利专业经验和知识管理”为手段, 以工程全生命周期管控为核心的知识自动化之路。二是以“可分析和训练的水利大数据”为核心的数据智能之路。两条智慧水利之路都值得不断研究和探索。2 以知识自动化和工程全生命周期管控为核心的水利工程信息化2.1 水利工程知识特点水利工程作为一种典型的工程学科, 其特点是理论与实践相结合。某些工况十分复杂, 涉及人员、机械、材料、方法和环境, 以及岩土学、水力学、工程学、动力学等众多学科, 多种因素关联偶合在一起, 纯理论逻辑推导不能找出原因或得出结论, 需要在实验室环境下将各种因素综合分
4、析, 研究主要因素对结果的影响。更多的时候需要在实践中不断积累和总结经验得出结论。即, 水利工程的大部分理论知识来自于实践和实验的研究。由于水利的复杂性, 有些实际现象表现出与实验室模型不同的特性甚至在实验室无法观察到的现象, 即所谓的“放大效应”, 其本质是对某些因素考察不清导致无法正确预测。此时, 我们是从实际工程的反馈, 来扩展水利工程知识。同时, 从水利工程运行中还得到大量的操作、维护、安全方面的、超出实验室研究范围的经验性知识。2.2 知识自动化将经验转化为数据, 将数据转化为知识, 将知识融入到自动化系统中, 即知识自动化, 是智慧水利工程的核心。对于水利工程, 知识基本已融入到工
5、程设计和运行的自动化控制中, 70%以上实现了知识自动化;流域联合调度的知识, 防汛抗旱, 水资源调配等知识, 主要涉及资源利用、灾害预警、人员管理的知识还是存在于各种应急预案中, 和作为经验存在于人脑中, 这方面与知识自动化尚有一定距离。智能化的核心是“数字化、可视化、模型化、自动化、集成化”, 要让计算机来解决问题, 将问题数字化并抽象为数学模型。水利工程的信息可以分为经验型、问题型、建议型、反馈型、管理型、措施型、突发型、动态型、预测型、综合型等 10 类。这些信息、经验和知识可以通过信息技术使之数字化和碎片化;通过数据可视化分析找到规律;将规律转化为数学模型;通过计算机对数学模型自动求
6、解、自动决策;将决策或结论自动传输给上一层或者下一层, 从而达到集成化。这个完整的过程就是知识自动化。知识自动化将人从重复性工作中解脱出来, 专注于创新和高附加值的活动, 显然它对人才的要求变得更高。因此, 知识自动化是今后水利工程信息化、智能化的重点方向之一。2.3 以工程全生命周期管控为核心的信息化与传统基于通用 IT 技术的水利工程信息化不同, 以知识自动化和工程全生命周期管控为核心的水利工程信息化, 必须基于专业 IT 技术才能实现。从通用 IT与工程 IT 对比的图 1 可以看出, 通用 IT 技术和工程 IT 在很多方面存在差异。首先是主导人员不同。通用 IT 是以信息中心为主导,
7、 IT 人员主导全过程;工程IT 则是以工程技术人员+工程 IT 工程师主导。第二, 通用 IT 的信息采集以智能为核心, 工程 IT 以工程为核心。第三, 通用 IT 注重流程控制, 工程 IT 注重过程控制。第四, 通用 IT 强调网络安全在边界防护和数据备份, 工程 IT 的网络安全更注重运行安全、稳定和可靠。由此可以看出, 建立工程 IT 的基础和必备条件是“信息记录”“工程管控”形成智能反馈闭环的物联网平台, 建立以工程为核心的 IT 架构。图 1 通用 IT 与工程 IT 对比图 下载原图3 水利工程数据智能有很长的路要走3.1 数据智能的本质是数据1986 年, 杰弗里辛顿 (G
8、eoffrey Hinton) 与同事大卫鲁姆哈特 (David Rumelhart) 和罗纳德威廉姆斯 (Ronald Williams) , 联合发表了一篇突破性的论文, 详细介绍了“反向传播” (backpropagation) 技术。普林斯顿计算心理学家乔恩科恩 (Jon Cohen) 将反向传播定义为“所有深度学习技术的基础。”在近 30 年里, 深度学习一直沉寂, 直到神经网络在互联网时代得到了海量数据, 激活了深度学习的强大生命力。过去, 训练一个神经网络的最大问题是没有足够的数据量, 几百个数据样本就算是大手笔, 而今天凭借海量数据, 人工智能的精准度大大提高。大数据让深度学习
9、突破了其它方法的天花板, 成了时代宠儿。这种人工智能是否适合水利工程, 或者说对水利工程的建设和管理能够产生多大作用, 水利工程能否借助这一波人工智能而获得智慧, 成为“智慧水利工程”, 是需要认真研究的问题。3.2 水利工程的数据智能有三方面问题(1) 水利工程作为较严格的受控系统, 数据虽多但单调。由于工程运行过程被各种控制系统严格控制, 运行平稳, 所以产生的数据虽多但分布窄, 无法采用人工智能从这种信息量少的大数据中提取出规律或知识。1 千个、1 万个相同数据所含的信息量和 1 个数据一样。较低的信息量以致无法挖掘知识。(2) 水利工程作为人工设计系统, 设计者已经掌握工程的内在特性和
10、机理, 并成功建立工程的数学模型。无需再使用人工智能去挖掘、发现知识。即使在机理不清或边界不定时, 一些常规的、传统的数据分析方法已经足以应对工程中的问题。(3) 水利工程对系统的可靠性、安全性要求不接受人工智能系统产生的黑箱知识。水利工程对安全性和可靠性的要求极其严格, 一旦发生事故都是灾难性的, 对环境和人员生命带来不可挽回的损失。人工智能完全依靠系统的输入输出数据产生一个黑箱模型, 这种黑箱模型应用时, 一是无法根据模型找到故障或者问题的原因, 二是难以对模型的可靠性作评估。3.3 数据智能与传统信息化数据人工智能相对更适合系统极其复杂以致难以研究机理、对系统因果性和可靠性没有严格要求的
11、人类智力活动, 人工智能正在金融、商业、医学三大领域产生革命性变革。而工程技术领域由于本质上就是对因果性和可靠性的追求, 科技工作者和工程师长期对数据的重视和应用, 人工智能从知识发现和提取的角度还十分有限。虽然基于数据的人工智能概念现在非常热, 吸引了无数投资, 但是短期对水利工程的影响尚十分有限。今天, 基于数据智能技术最大的成就是声音、图像的处理识别。因此, 工程的监测、预警、预维护是大数据技术在水利工程领域少许的几个可行应用之一。这种应用一方面需要新型传感技术将位移、渗流、水质、水量、温度、振动、声音、图像、电流等信息融入监测模型中, 一个关键特征信号可以代替几十个关联较弱的信息。另一
12、方面需要相应的信息处理方法和算法, 高级模式识别技术, 将信息同问题和决策关联起来。传统工程信息化与数据智能工程的对比模型见图 2。图 2 传统工程信息化与数据智能工程的数据模型对比图 下载原图从传统信息化与数据智能工程对比图可以看出, 传统 IT 技术和数据智能工程在很多方面存在不同。首先是主导人员不同, 传统工程信息化是以信息中心为主导, IT 人员主导全过程;数据智能工程则是以工程技术人员+数据分析工程师主导。第二, 传统 IT 采用的是信息采集技术, 采集的是重要信息;数据智能工程将采集变为记录, 记录了所有信息。第三, 传统 IT 采用统计分析的方法建立算法, 以结构化数据为基础进行
13、分析;数据智能工程采用的是大数据为基础, 建立数据模型后进行机器学习。第四, 传统 IT 形成的产品是以表格方式, 地图方式展示, 服务对象是人, 作为辅助决策来使用, 具有一定的延时;数据智能工程形成的产品是数学模型, 同时对人和机器形成适应各自的“可视化”, 为机器直接决策服务, 即时反馈结果。对机器的可视化, 人是无法理解和看懂的。由此可以看出, 建立数据智能 (智慧) 工程的基础和必备条件是“记录信息”“建立算法 (模型) ”形成智能反馈闭环的物联网平台。只有建立这三步基础, 水利工程才能有智慧的可能。以上模型是针对水利工程的信息化和智能化的分析对比, 可以看出智能水利工程 (基于大数
14、据的机器学习方法的弱人工智能) 是以大数据为基础, 这个大数据在水利方面还要同时打通水文、水资源、水利工程三大水利数据, 以及其他外部数据。在数据的基础上建立模型, 最后形成智能反馈闭环的物联网平台, 4 结语今天, 基于大数据的人工智能还缺少在水利工程上的应用基础, 但是依靠知识、经验的数字化、自动化已经相对成熟。水利工程需要围绕水文、水资源、水生态和水工程的知识自动化来实现“智能”。工程调度是水利工程的核心之一, 水利工程的调度运行基本已经实现无人值班, 少人值守, 但是中央控制室还必须有人, 通过电脑屏幕观察和监测运行过程, 随时准备人工远程干预直至去现场处理。实际上, 工程运行并不是非
15、常稳定一成不变, 生产效率也并非达到最佳。水利工程并非是做到自动化、无人化就算实现了智能化的目标。新目标已经不是满足工程稳定在一个状态, 而是让工程自动运行安全且效率最优的状态。工程更具备柔性以快速应对需求。水利行业“智慧”架构早已确定, 即在基础设施、数据中心、应用决策三个层次实现知识自动化和智能化。我们应脚踏实地, 用知识自动化不断完善框架, 并在数据智能领域不断积极探索。参考文献1The Open Group 著, 张新国, 等译.TOGAF 标准 9.1 版M.北京:机械工业出版社, 2016. 2佩德罗.多明戈斯著.黄芳萍, 译.终极算法-机器学习和人工智能如何重塑世界M.北京:中信出版集团, 2017. 3吴军.智能时代-大数据与智能革命重新定义未来M.北京:中信出版集团, 2016. 4徐子沛.数据之巅-大数据革命, 历史、现实与未来M.北京:中信出版集团, 2014. 5爱德华.克劳利布鲁斯.卡梅隆丹尼尔.塞尔瓦.爱飞翔译系统架构-复杂系统的产品设计与开发M.北京:机械工业出版社, 2017. 6罗伯特.S.韦甘特著, 张其林, 吴杰, 译.BIM 开发-标准、策略和最佳方法M.北京:中国建筑工业出版社, 2016.