1、农业大数据技术前沿与应用,许世卫 研究员,农业部农业信息服务技术重点实验室 主任 中国农业科学院农业信息研究所 所长,2014 年 10 月 南京,内 容,一、农业进入大数据时代 二、前沿技术 三、主要应用 四、未来展望,一、农业进入大数据时代,“大数据”,主要是来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。互联网行业是大数据应用的领跑者,目前,大数据正在加速向农业领域拓展。,基础架构,关键分析,主要应用,开源的项目,随着传感器、智能移动设备、互联网等的发展,数据呈现爆炸式增长。,农业的新变化,数据无处不在 数据无时不有 数据无物不生 数据无人不感,地域性 季节性 多
2、样性 周期性,农 业,农业大数据(Big data)是指在现代农业生产、经营、管理等各种活动中形成的,具有潜在价值的、海量的、活的数据。 是现代农业建设、发展、管理的“基准线”。,目前,中国每年产生并被存储的数据总量超过800EB(1018字节),相当于全人类讲过的话160倍。,KB (103字节) MB (兆,106字节) GB (吉,109KB ) TB (太,1012字节) PB (拍,1015字节) EB (艾,1018字节) ZB (泽,1021字节),农业每年产生的数据量约为8000PB (1015字节),农业数据每年将以50%-80%的速度增长,农业生产数据2500PB,农业管理
3、数据1200PB,农业自然资源数据3500PB,农业市场数据800PB,(数据来源:ZDNET数据中心2013:硬件重构与软件定义年度技术报告),农业进入大数据时代,全球气候观测系统(Global Climate Observing System),2012年每天新增超过250GB,政府间气候变化专门委员会(IPCC)第四次评估报告中采用了超过了29,000个观测资料序列,第五次报告中使用的数据量达到了2.3PB。,(1)气象数据,1.农业大数据的类型,1984年,由NIH创办的基因数据库(GenBank); 截止2011年4月,在传统数据存储区,共有1.35亿条序列记录,包含1265亿个碱基
4、对;在WGS(Whole Genome Shotgun)分区内包含1914亿个碱基对,6272万个基因组序列。 全部数据若是装订成册,将载满700多辆卡车。,(2)生物信息数据,对地观测(遥感)技术农业资源研究提供空间数据,而且,遥感监测一直向高时空分辨率、高光谱、多频段方向发展,数据生产能力越来越强; 美国NASA和USGS研究生产的包括GLS1975、1990、2000、2005和2005(EO-1)五个子集的一套Landsat卫星影像,总数据量超过5TB;,(3)资源环境数据,实时监测仪器、设备全天候监测,随着设备种类的增长、价格的降低,监测点将成指数级增长,所产生的数据,将快速增长。
5、仪器监测每10分钟采集1次数据(60多个指标*5万次/年)+市场监测数据+统计监测数据+视频监测数据 15G/年,(4)作物生长监测数据,(5)农业统计数据,农业部统计报表农业综合调查制度 农村经营管理情况统计报表制度 全国乡镇企业统计报表制度 农业资源环境信息统计报表制度 全国土壤肥料专业统计报表 全国植保专业统计报表 农业机械化管理统计报表制度 种子管理机构报表 种子企业报表 ,953个品种,全国1000家市场,每日价格等11个指标的信息,每天超过1000万个数据,大数据最大的作用在于给人们带来了思维上的转变,农业大数据思维,数据文化:尊重事实、强调精准推崇理性,万物皆比特,一切皆数据!,
6、数据制度:数据立法、用数机制尚数环境,数据治理:事前管理、科学决策数据创新,资源配置:精准化、智能化、高效化,二、前沿技术,农业大数据的发展对传统的数据处理技术体系提出了巨大的挑战,需要我们在数据采集、数据标准、数据处理、数据分析、数据展现等方面做全新的技术升级。,1.数据精准获取技术,15,可穿戴式的信息获取技术 可植入、可嵌入式数据获取技术 微型移动信息获取技术 生物传感、微纳米传感器、便携式传感器等新型设备。,2.数据标准化技术,农业领域数据标准化变得极为迫切,信息采集、传输、存储、汇交的标准规范亟需大量出台。农业基准数据库亟需建立。,大数据数据标准化标准体系框架,传输速率 编码标准 传
7、输方式 传输冗余 ,汇交方法 汇交内容 汇交分类 汇交范围 ,采集内容 采集方式 采集时间 采集地点 ,存储格式 存储方式 存储安全 数据结构 ,农 业 基 准 数 据 库,数据增值的关键在于整合,但整合的前提是数据标准的统一。,建模技术:农作物生长与产量形成机理建模; 农产品消费行为与消费量变化动态建模; 基于多代理系统进行农业智能仿真模拟;关联分析: 专家会商系统结合; 专家智慧动态引入; 仿真模拟智能化和自适应;,3.农业大数据分析处理技术,仿真过程介入; 仿真结果反馈; 生产与市场决策流程优化。,4.数据分析模拟技术,模拟育种 = 大数据+超级计算,种子基因数据+环境因子数据+遗传模型
8、+超级计算 通过计算机动态模拟种子的生产过程、产量形成过程,5.农业大数据交互式可视化技术,农信采监测数据可视化,大数据背景下,在交互式数据可视化技术的支撑下,通过对高频变农产品市场数据的处理,实现多品种、多地域、多类型农产品市场变动的内在机理、波动周期、市场走势的可视化呈现。,农信采监测数据可视化,三、主要应用,大数据应用在于从流程优化、知识发现、辅助决策的过程中发现大价值。大数据技术与农业领域的深入耦合,将对我国的农业市场监测预警、智慧农业生产管理、和农业国家宏观管理决策带来前所未有的变化!,农业监测预警是现代农业稳定发展的最重要基础之一,信息流揭示 过程模拟 预警与调控,物联网,现代农业
9、,大数据,1.农产品市场监测预警-发现市场风险,移动采集技术,“农信采”(便携式农产品全息市场信息采集器),是一款新型的农产品市场信息采集设备。“农信采”的推广应用,将为我国农产品市场信息标准化、即时性采集带来革命性的变化,可广泛应用于田头市场、批发市场、零售市场的农产品全息信息采集。,Windows mobile版本,安卓版本,农信采在全国广泛应用,在北京、天津、河北、福建、湖南、广东、海南等省市几百个田头、批发、零售市场进行推广应用,共采集数据59万余条。,从2014年9月1日将由发改委、农业部在新疆、黑龙江、吉林、内蒙古4省区用于大豆和棉花的目标价格采集。,该设备的定位功能、数据纠错、信
10、息分析功能,可用于审定品种、种业专利数、种子企业、种子价格、种植面积、供需状况等种业信息的采集。,数据标准化技术,制定了农业部行业标准2项 积极推进农业信息标准化科研工作,在建立农产品全息市场信息框架体系 起草、制定了农产品全息市场信息采集规范(NY/T 2138-2012)与农产品市场信息分类和计算机编码(NY/T 2137-2012)2项行业标准 农业部于2012年2月21日颁布,并于2012年5月1日起正式实施。,模型分析处理技术,美国农业部: 多国商品联接模型(Baseline模型) 食物与农业政策模拟模型(Fapsim模型),FAO-OECD: Aglink-Cosim模型 FAO全
11、球粮食信息预警系统,平衡表技术: 美农部平衡表 FAO-OECD平衡表,平衡表,中国农产品监测预警模型(CAMES)整体模型框架已经形成。总体上来讲,CAMES要等同于甚至优于ERS/USDA的大型系统。其特点是,监测预警的农产品种类多、品种全,涵盖11大类953个农产品品种;监测预警的空间分布广、区域性强;监测预警时期包含短期、中期和长期;监测预警模型涵盖气象、投入和管理等影响因子。,中国农产品监测预警模型,搭建农业监测预警研究空间,是中国农科院信息所农业信息学科建设和发展的集中体现。是在线协商 的良好平台,也是农业信息分析等学科研究的重要载体。农业监测预警空间 建有中国农产品监测预警系统、
12、中国农业监测预警数据库系统、在线会商系 统等多套应用系统及先进硬件支撑环境。,具有4大功能:,实时监测,大数据处理,智能仿真模拟,信息发布,农业展望会议-现代农业的高端管理工具,美国的农业展望大会 第 90 届 澳大利亚的农业展望大会 第 44 届 墨西哥的农业展望大会 第 1 届 FAO-OECD的农业展望大会 第 8 届,至2014年:,NASS发布了461篇报告,FAS发布了119篇报告。,ERS发布了229篇报告,美国靠什么引领世界农业?-数据支撑,释放市场信号 发布产品报告 显示权威预期,实时、全面、准确的数据,首届中国农业展望大会,2014年4月20-21日,首届中国农业展望大会在
13、京召开。标志着中国特色农业信息监测预警体系建设取得成效,开启了提前发布市场信号、有效引导市场、主动应对国际变化的新篇章。,参会者涉及全国各地农业生产经营者、科研工作者、政府管理者以及来自OECD、美国、澳大利亚等国际专家。,全体大会+18场专题会 54位国内外专家演讲 500多人参加了大会,会议发布了中国农业展望报告(2014-2023) 分品种展望报告(粮食、棉花、油料、糖料、肉类、禽蛋、奶类、蔬菜、水果等) 农产品围绕农业资源环境、农业支持政策、农业科技创新等热点专题进行了研讨。,发布了中国农业展望报告(2014-2023),首届中国农业展望大会受到了国内外社会各界的广泛关注!,据不完全统
14、计,截至2014年4月22日会议结束后第二天,1300多家国内外网站对2014中国农业展望大会进行了报道。,2.智慧农业精准生产、智慧管理,对大田生产的农作物长势长相监测 农情监测系统:农作物苗情、墒情、病虫情、灾情 实现信息采集、监测、预警、决策、调度的闭环应用 对农作物生产、管理和抗灾救灾进行快捷高效的调度指挥,实现精细化农业生产与宏观监管,对畜牧养殖的智能应用,合理优化养殖环境:实时监测空气温湿度以及二氧化碳、氨气等数据,智能分析、判断、调控养殖环境。,O2 CO2,O2 CO2 NH3 CO2,精确确定猪的日粮比:通过大数据技术获取符合营养目标的日粮搭配比例。,数字果园就是以果园系统为
15、研究对象,以现代信息技术和通讯技术为工具,优化果园系统中的信息流程,实现果园优质、高产、高效、安全的生产和管理。 主要用途: 果树长势监测。 果园病虫害的监测和实时识别。 实时提供病虫害防治方案。 实现果树生产的专业化指导。 实现果品溯源 。,数字果园现场信息采集系统 (采集果园土壤、空气及果园视频等其它环境信息),针对数字果园的应用-为果农管理田园提供了新的方式,3.国家农业宏观管理科学决策,优化统计数据、实现产销精准匹配。针对农产品时常出现的区域性、季节性、结构性“卖难”和“买贵”问题,加强农产品产销信息平台建设,通过农产品产销数据的收集、分析实现产销的精准匹配,促进了农产品供需平衡。,利
16、用互联网大数据,辅助决策。国家统计局与BAT(百度、阿里巴巴和腾讯)签署了大数据战略合作框架协议。进一步发挥大数据对于常规渠道统计决策的参考、补充作用。,对内部优化决策,对外跟踪国际贸易,合理引导国际市场预期 当前,国际农产品价格联动性增强,为了适应世界农业格局的变化,利用大数据技术,跟踪、监测、分析、应对国际市场变化已成为现代农业发展迫切要求。 数据开发已经成为全球发展的重要趋势 加快农业信息开放步伐,改善中国数据质量,提升数据国际公信力,正确引导国际市场对中国农产品市场变化的预期,增加我国在国际市场上的影响力和话语权。,四、未来展望,一切围绕“数据”这一核心运行,未来农业监测预警将围绕“数
17、据”核心,开展采集、标准化、存储、分析处理、公开发布、展望预测,影响预期,管理未来。,使用、利用开发才会产生大价值,数据能力将成为现代农业发展的新型力量!,数据资源将成为国家新型战略资源!,数据能力将成为推动国家进步的新型竞争力!,农产品市场信息流监测技术,市场信息获取、传输、处理的标准化技术,市场信息移动监测设备,市场交易混沌场景下的信息识别技术,市场信息流的定量测度技术,“信息流”监测、分析、模拟技术将成为重点,多品种市场关联预测技术,高频变农产品市场数据处理关键技术,多品种、多地域、多类型农产品市场预测模型系统,智能预警基础算法,农产品市场预警多维模拟技术,基于大数据的农业行业分析预警将
18、成为热点,将领域数据(如农业部、发改委、商务部、海关等政府部门)链接起来,形成关联数据集,用大数据的方法把这些数据作为整体进行研究和分析,发现或预测其中蕴藏的规律。,基于智能数据处理的农业生产管理系统将会大量出现,多学科综合应用,通过计算机建模与实现,用于农业生产管理过程控制,实现农业资源的按需分配与自动调度,最大限度地降低农业生产资料损失,提高农业投入效率。,大数据与农业的融合将进一步加深,数据开放力度将进一步增强,内开放,外开放,摸清家底,建立共享目录,整合资源、建立共享平台,部门协作、建立数据会商制度,加强合作,参与国际数据交流,形成对外农业展望制度,明分类、确顺序,制定数据公开路线图,中国农科院农业信息研究所将致力于建成全国农业信息技术创新中心、农业科学数据中心、全国农产品信息分析预警中心。 作为农业信息化工作的主要技术团队之一,信息所将时刻以国家需求为第一要务,在技术支撑和决策咨询方面做好全方位服务,共同为我国现代农业发展做出更大贡献。,在全球大数据蓬勃发展的大背景下,如何抓住农业大数据时代发展的机遇,实现传统农业向现代农业的快速转型,是摆在政府、学术界和产业界面前的紧迫性课题!倡议:组建农业监测预警大联盟,共谋发展,创造未来!,谢谢大家!,E-mail: Telephone: 0086-10-82109902,