收藏 分享(赏)

大数据与互联网思维概述.docx

上传人:拉拉链 文档编号:13505118 上传时间:2022-09-03 格式:DOCX 页数:3 大小:50.97KB
下载 相关 举报
大数据与互联网思维概述.docx_第1页
第1页 / 共3页
大数据与互联网思维概述.docx_第2页
第2页 / 共3页
大数据与互联网思维概述.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、邬贺铨:大数据驱动与互联网思维2016-12-08 09:27宣讲家网邬贺铨 中国工程院院士字号:核心提示:大数据、智能化、移动互联网和云计算相结合的“大智移云”,代表了信息技术发展新阶段的时代特征。“互联网+”开拓了信息技术应用空间,凸显了作为经济增长新引擎的作用。在核心信息技术方面,我们还没有摆脱受制于人的局面,宽带提速降费压力很大,信息安全形势严峻,频谱资源面临挑战。下一步应当努力的方向则是:狠抓改革攻坚,突出创新驱动,强化企业主体,建设网络强国。邬贺铨 中国工程院院士点此进入视频专辑点此查看完整报告今天,要讲到三个方面的问题,一是信息化进入“大智移云”新时代;二是大数据营造智慧城市新理

2、念;三是互联网激发创新发展新思维。一、信息化进入“大智移云”新时代2013年3月4日,习近平总书记出席全国政协十二届一次会议的科协、科技界委员联组会,并发表重要讲话。他强调,移动互联网、智能终端、大数据、云计算、高端芯片等新一代信息技术发展将带动众多产业变革和创新。77年前有了电视机、70年前有了计算机、57年前有了集成电路、50年前有了光纤、47年前有了互联网、42年前有了PC机、37年前有了手机,27年前有了年前有了3G,而现在则有了4G,这些都是半个多世纪以来信息技术的发展历程。我们走过了以计算机为中心的PC时代,来到了一个以软件为中心的网络时代、以服务为中心的云计算时代、以应用为中心的

3、物联网时代,现在又轮到了以用户价值为中心的大数据时代。互联网的发展趋势也从网络共享到信息共享、资源共享、感知共享再到知识共享。信息技术经历了几十年的巨大发展,现在又面临新一轮的换代。早在几年前,电视机时代就已变成了数字化、平板化电视时代,现在我们进入了移动互联网时代、后PC时代和后WEB时代,不出几年我们还会进入云计算时代、后摩尔时代、物联网时代和大数据应用时代。集成电路发展十年百倍信息技术发展的基础是集成电路。每台计算机、手机上都有CPU,而每一个CPU芯片上又有很多的晶体管。自1959年集成电路发明以来,一个集成电路单位面积上的晶体管数量,基本上每隔18-24个月便会增加一倍。从早期的80

4、86、286、386、486,发展到后来的奔腾、酷睿系列,截至2015年,一个CPU芯片已拥有80亿个晶体管。在过去的30年,CPU运行速度提高了100万倍,而内存价格下降了45000倍,硬盘价格下降了360万倍。如果汽车价格以与硬盘同等的速率下降,那么今天我们买一辆新车只需要0.01美元。如果汽油性能以同样的速度发展,那么现在1升汽油能够使飞行器环绕地球飞行573圈。到目前为止,没有任何一种技术能像信息技术这样高速发展。2015年,英特尔、台积电和三星的CPU芯片产品已做到14纳米,未来还会进一步做细。而我国中芯国际目前的产品水平为28纳米,与国外相比落后了两代。现在,集成电路发展面临代工线

5、成本高昂、芯片发热严重等严峻挑战,所以,未来亟待新一轮的材料和工艺技术革命-后摩尔时代!软件定义一切软件从互联网环境发展到普适计算环境,用户数量和复杂度剧增,软件的应用无所不至。一般来讲,软件是用其程序的代码行数来表现其复杂性的。1972年阿波罗登月飞行器软件仅有4000行代码,如今华为传感器有10000行代码,日本高铁的列控软件有数百万行代码,雪佛兰、奔驰等汽车的内置软件规模有1000万到1亿行代码,空客飞机软件有10亿行代码,PC的 Windows7操作系统有3000万行代码、Windows10操作系统有5000万行代码,苹果手机和安卓手机的操作系统也有上百万行代码。现在,智能手机操作系统

6、的复杂度是当年阿波罗登月飞行器软件的好几百倍。软件从面向模块到面向数据、面向事件、面向用户、面向对象、面向认证的设计,向着构件化、语义化、智能化、服务化方向发展。软件编程的难度较大。现在美国已经做到,你只要提出任务目标和需求,Dropsource自动代码编写平台就可以自动编写APP程序。计算无所不在计算能力的演进经历了从20世纪50年代的大型计算机到60年代的小型计算机、80年代的个人计算机、90年代的笔记本电脑,再到现在的移动智能终端(手机、平板电脑)。世界上第一台电子数字计算机发明于1946年,占地170平方米,性能不及现在的计算器。1975年美国航空航天局用500万美元购买了一台超级计算

7、机Cray-1,其性能不如IPhone4。1985年美国国防部买来一台当时最好的超级计算机Cray-2,现在来看其性能不及iPad 2。1980年1GB闪存卡的价格100万美元,1997年将近8000美元,而现在只需25美分,这就说明信息技术的进步,带来功能的提升和成本的下降。超级计算机能力十年千倍从全球TOP500超级计算机能力看,超级计算机的能力是每10年提高1000倍,PC机的能力是每20年提高1000倍,而计算成本和存储器成本分别是每10年下降10000倍和20000倍。我国天河二号超级计算机连续三年六次排名第一。但是,它所用的1.6万个芯片,主要来自美国英特尔公司。2015年,美国商

8、务部禁止英特尔公司向天河二号供应芯片。当然,我国早已开始研发自己的芯片,并用于神威太湖之光超级计算机。2016年6月,神威太湖之光在德国通过测试,在世界超级计算机500强中排名第一。更为重要的是神威太湖之光有4.1万个芯片,每个含260个核,全部为自主研发。那么,美国在干什么?美国计划在2020年开发出计算能力是天河二号100倍,而功耗和天河二号一样的超级计算机。就在美国宣布这个计划之后,2016年7月中国也启动百亿亿次超级计算机的研制工作。云计算现在,大部分企业用的不是超级计算机,而是云计算。从80年代的数据库、90年代的互联网数据中心(IDC),发展到现在的云计算、云服务。随着信息化的发展

9、,每个单位自建信息化系统是不经济的,不如把自己的数据放在第三方云计算公司的服务器、存储器上。第三方云计算公司把它的基础设施当成服务来出租,这也可简单地理解成数字房地产,无非就是租用一些空间。云计算公司不会停留在这一步,还可提供一些软件工具、中间件、数据库供租用单位开发自己所需的软件。对于大多数中小企业来讲,有了工具也未必具备软件开发能力,不如直接租用云计算公司的软件,这就是软件即服务。云计算公司还可以提供各种各样的数据以及数据挖掘工具以供租用。云计算的出现跟当年爱迪生发明电的时候相类似。爱迪生发明了电以后,每个工厂都自建发电机,每个政府部门都自己安装发电机,现在还有吗?都是用第三方发电公司的发

10、电机。随着信息化的发展,对信息化的集约式利用越来越普遍,云计算也发展成为集约式的信息化服务。比如,阿里巴巴、亚马逊等电商,现在也已变成云计算服务公司。中国电信联合华为推出天翼云3.0,他们以国有企业的身份来提供云计算服务,在信息安全上更有可信性。光纤传输技术的发展20世纪80年代,中国的有线传输线路使用同轴电缆,当时每3公里一个增音机,使用频分复用方式传输模拟信号,一个频段一个话路,可做到4380路容量。美籍华人高锟先生发明光纤以后,光纤很快进入应用。90年代初,一根光纤可以存2.5G,3万电话电路,采用时分复用(TDM)方式传输数字信号。实际上,一根光纤不仅可以一个波长传送,还可以采用多个波

11、长,所以,出现了波分复用。这样将每个波长都利用起来,一根光纤可以存1.6Tbps,即2000万电话电路。另外,光纤还可以利用更多技术提升容量,目前实验室已经做到一根光纤可以存16T,即2亿电话电路。这样,单纤传输容量4年提高10倍,20年提高1万倍,截至目前的最高纪录是单波长存400G,单纤传输100T,而光纤成本10年下降了50倍。中国的光纤光缆产业发展越来越大,每年生产全球一半的光纤光缆,而中国市场也消耗掉全球一半的光纤光缆。10年前,购买一根光缆平均到一芯公里光纤的价钱是2000块人民币,而2015年的报价是40块钱。可见,现在光纤做得已经很便宜了。互联网的演进互联网从20世纪70年代美

12、国国防部的ARPANET,到90年代的公众互联网,再到21世纪初的全球互联网,发展到现在的下一代互联网。互联网技术从TCP/IP到P2P/WEB2.0,再到Cyber-Physical System系统。互联网地址从NCP发展到IPv4、IPv6。互联网从一个收发邮件的联系平台,到可以上网查阅文件、观看视频的浏览平台,而微博、博客的出现又使互联网成为一个交互平台。实际上,互联网也是一个工作平台。例如美国有一个网站名为第二人生(Second Life)。网民在这里可以付费租用游戏设计软件自己设计游戏,当然也可设计服装、汽车和房子等,后来专业公司发现网民的设计有的更适合市场需要,便出资收购,于是就

13、形成了交易。同时,也出现了洗钱、贩毒和黑客。美国国防部在这里发现网络精英,中国安全部也注意到这里。另外,美国有一个神经外科医生,将大量病人的脑部CT扫描图放到网上,许诺奖励来鼓励网民帮助自己找出个别有与众不同黑点的CT扫描图,从中发现肿瘤病灶,这一做法吸引了大量网民参与。所以经常说,互联网是一个廉价的劳动平台。互联网从传数据,到传话音、传视频、传M2M(机器到机器信息);从有线接入到无线接入、宽带接入、移动接入;从拨号接入到永远在线;从网络业务到电信业务、媒体业务、物联业务;从研究网络到商业网络、泛在网络。互联网的发展有40多年的历史,进入我国也才22年。现在,我国网民规模达6.88亿,互联网

14、普及率也已过半。早年,我们到人民网、新浪网等网站上浏览专业编辑人员采写的信息,这称为WEB1.0。现在,很多年轻人更多的是浏览大V、网红等网民产生的信息。未来,我们希望互联网更加智能化。比如,我们搜索一个关键词会出来上万条信息,要逐一点开查看才知道里面的信息是否有用。相当于互联网只为我们提供了参考书,并未直接给出答案。而未来,希望互联网能做到这一点,我们给出一个关键词,它自己便能检索、查阅所有资料并写出综述。未来的互联网要向宽带化、移动化、泛在化、智能化以及安全性、可用性、可信性方向发展。5G扩展移动互联网的应用移动互联网的发展,早在80年代,我国第一代移动通信的基站利用频率区分用户,即频分多

15、址(FDMA);第二代移动通信GSM,用不同时隙区分用户,即时分多址(TDMA);第三代移动通信3G,用不同码道区分用户,即码分多址(CDMA);现在的4G采用正交频分多址技术(OFDMA),把频率、空间和时间的复用因素都利用起来,使得4G峰值数据可达百兆量级。当我国还在发展4G的时候,国际上关于5G的研究就已开始。从1G到4G主要面向的是个人通信,而从5G开始扩展到面向产业应用。一是支持4K电视、虚拟现实和增强现实等移动宽带应用;二是提供高可靠低时延通信,例如在高速公路上车速在200公里时要防止汽车发生碰撞,就要反应很快,至少延时不能超过1毫秒。还要适应高铁进一步提速,5G的设计目标是高铁时

16、速将来可达500公里/小时。三是5G对物联网和大规模产业互联网的支持,支持一平方公里上百万个传感器能连上网络,等等。5G相较于4G,其用户体验速率提高10倍,频谱效率提高3倍,移动性提高1倍,无线接口延时减少90%,连接密度提高10倍,能效提高100倍,流量密度提高100倍,峰值速率提高30倍。到5G普及时,5G的平均速率可达100兆,峰值速率20G。过去,我国3G、4G牌照的发放得比发达国家要晚,现在,我国提出要引领5G发展。2015年,日本计划于2020年东京奥运会上实现5G技术的商用,韩国也表示要在2018年平昌冬奥会试用5G技术,中国宣布将在2020年启动5G商用。也就是说,不到四年的

17、时间,大家就要换手机了。有人问5G资费如何?单位流量资费会比现在要便宜得多,但大家要小心的是如果一秒钟下载20G,那总资费还会比较多。移动智能终端的发展早年,我们的手机只能听和讲,现在不仅可以看和写,还可以触摸和感知,人机接口发生了很大变化。手机的功能也越来越强大,从2000年可以听歌、2001年有了彩屏、2002年有了照相机、2003年有了手写功能、2004年可以录音、2005年能看电视、2006年有了GPS、2007年能上WIFI、2008年有了触摸屏,2009年有了传感器,到现在,手机处理器为多核,还配有重力感应器和陀螺仪。如果你不慎摔了一跤,手机会自动发短信给医院和家人。医院则会根据数

18、据分析机主的年龄、病史,之后还没等你站起来,医院的救护车就通过手机定位找到了你。另外,手机的光线感应器等功能,可以使屏幕白天不亮,晚上亮。一个人老花眼,看短信要靠近,手机就能检测到,随后自动将字变大,并重新排版,以适应屏幕大小。苹果公司发明了手机触摸翻屏技术,现在有的公司为了不侵犯苹果公司专利,发明了只要对着手机摄像头挥一下手就能翻屏的功能。还有的公司称不用挥手这么大动作,只需眨一下左眼翻左页,眨一下右眼翻右页,点一下下巴双击即可。另外,美国有一个APP,花2.99美元下载装到手机上,之后把手机往肚皮上一扫,就可以知道身体什么地方有炎症。微软收购诺基亚后开发了一个语音搜索、语音翻译功能,借助云

19、端能力的支持可以翻译26种语言。按一下语音键选择英文,你就可以和英国的朋友沟通,你讲中文他听英文,他讲英文你听中文。另外,你到国外旅游,只要对着指示牌拍照,就能把外语翻译成中文。2014年年底,在乌镇召开的世界互联网大会上,日本首富孙正义发言说,30年后,假设苹果公司还存在,那么苹果要卖Iphone32了,价格可能还是300美元,可是CPU的性能和存储器的容量将会是现在的100万倍,通信速度是现在的300万倍,可以存5000亿首歌曲,3万部电影。也就是说,现在的智能手机比美国国防部10多年前的超级计算机还要厉害。现在,我国的智能手机产量占全世界的70%以上。手机不再是一个简单的通信工具,而已成

20、为人们的个人生活助理。物联网及窄带物联网互联网发展的另一种趋势是物联网。物联网的底层借助无线射频识别技术(RFID)和传感器等实现对物件的信息采集与控制,通过通信网络汇集信息。搜集信息的目的是为了分析和决策。所以,物联网是互联网从连接人到连接物的应用拓展。物联网自2008年金融危机之后广受关注,但其的发展和普及并不令人满意。其原因在于,没有合适的传输手段。智慧城市等应用需要低功耗广域物联网,而WIFI、蓝牙技术、光纤和移动通讯网络虽可用,但难以满足可靠性和低功耗、低成本的要求,因此,目前接入到运营商网络的物联网终端仅有6%。2016年6月,在韩国釜山召开的3GPP物联网标准会上通过了一个窄带物

21、联网标准NB-IOT。它是在运营商的频率上挤出一个频段200kHz,用正交频分多址技术划分为多个子载波,支持多个物联网连接,采用一些先进技术,每个信道容量能达到几十到几百kb。它有四大特点:一是广覆盖,在同样的频段下比现有的网络增益高20dB,覆盖面积扩大100倍。二是大连接,一个扇区能支持10万个连接,比现网高出50-100倍。三是低功耗,终端模块功耗为2G的1/10,待机时间可长达10年。四是低成本,单个接连模块目标1美元。未来,窄带物联网将为低功耗广域物联网应用开辟一个很好的前景。可穿戴设备的应用谷歌研发出一个眼镜,摸一下镜框,就能翻页。挂在胸前的手机可投影到手臂上,那么在手臂上就可以浏

22、览手机信息。还有的公司研制出蓝牙钢笔,它可使记录在纸上的信息同步传送到手机上。另外,百度也开发了一个眼镜,一边是摄像头,一边是送受话器,它将你看到的东西送到云端,搜索之后,给以解释,实现了所见即所知。习近平总书记曾说,要让互联网发展成果惠及13亿中国人民。那么,我国13亿人中有残疾人,他们怎么上网呢?盲人阅读的书本是凹凸不平的,而屏幕不可能凹凸不平,怎么办?手指阅读器。手指上戴上一个装有摄像头的指环,手指指到哪个词,指环就自动读取,甚至还可以翻译出来。盲人不知道手指指到哪里?不要紧,有震动功能,每翻一页,指环会把手指挪到第一个词上,读完一个词再引导到下一个词。增强现实和虚拟现实的应用。比如,你

23、在商场试穿一条红裙子时,还想试试蓝色的,不一定要换,只需要对着镜子说我要换成蓝色的,那你想换成什么颜色就会换成什么颜色,甚至还可以修改这条裙子的款式。这就是虚拟现实与增强现实的结合。另外,还可以利用虚拟现实培训工人。不会修汽车的工人戴上眼镜,跟着眼镜的指示,一步一步完成汽车修理的工序。阿里公司还希望将虚拟现实用在购物上,把手机当成眼镜,进行日常消费。总之,现在各种各样的视频宽带化促进了大数据的出现。大数据、大数据技术及其应用2008年世界上平均每个网民每个月下载1G,2014年平均下载10G。现在,全球新产生的数据量年增40%,全球信息总量每两年就可以翻一番。2015年全球新产生的数据量是8.

24、2ZB,可以装满2600亿个32GB存储容量的iPad,这些iPad可以堆砌起9座中国长城。到2020年,全世界新产生数据量将达到40ZB,如果把它们全部存入蓝光光盘,那么这些光盘的重量相当于424艘10万吨以上的尼米兹号航母的重量。什么是大数据?大数据没有权威的定义。可以说,大数据代表了由大容量、快速增长和多样性表征的、需要特定技术和分析方法将其转换为有价值的信息资产。大数据首先是量很大,其次是变化很快,再有变种很多。Word、Excel表达的数据是结构化数据,视频、照片就是典型的非结构化数据。仅是大、快、变不足以说明大数据有用,关键是价值。严格来讲,大数据价值密度低,也就是说,大数据中的大

25、部分都是垃圾,要通过沙里淘金、海里捞针,把有价值的数据挖掘出来,正因为有一定难度,所以才珍贵。大数据挖掘,首先要有数据资源,以便技术采集。其次,根据需要处理的数据的不同,使用不同的数据库。然后在后台,还需要一些大数据挖掘软件和方法来支撑。在这一过程中,建模是比较难的,不过目前美国MIT大学提出了自动建模方法。人工智能与深度学习。举个例子。2012年10月,微软研究院院长里克雷斯特博士在天津的演讲中,介绍语音机器翻译技术。这种技术基于上百万网页素材和大数据及深度神经网络技术,将演讲者所说的英文实时翻译成中文,并用演讲者的声音和文字展示出来。谷歌人工智能阿尔法狗(AlphaGo)在与李世石进行人机

26、围棋大战中,用的是同样的技术。这是大数据技术的应用。信息融合和信息抽取。举个例子,我们可以将拍摄、搜集的大量古罗马遗址照片,通过信息融合技术拼接起来,这样就可以还原一个古罗马。另外,为突出视频或图片中我们所感兴趣的东西,可以屏蔽其他无关内容。大数据利用信息融合技术,从时空分布的信息中综合出一个全局的观念,它利用信息抽取技术,从复杂的信息中突出我们所感兴趣的部分,这就是大数据分析。它使我们有全局的观念,也能让我们感受到所关注的东西。大数据的虚拟化和可视化。为了确诊患者的肺部病症,医生可能要看几百张、几千张CT扫描图,工作量、难度都很大。现在通过大数据技术把这些CT扫描图合成一个虚拟肺,之后医生就

27、可以综合观察患者的肺部问题。大家知道,在乳腺癌活检中最难的是如何真正找出有癌细胞的位置,这非常考验医生检测的准确率。美国一个高中生,与一家医院合作,以机器学习算法分析760万乳腺癌患者的数据,设计了定位活检乳腺癌细胞的算法,位置准确率达96%。大数据,不是我们收集了大量的数据,将一大摞文件、图表交到领导手上,而是必须要通过大数据挖掘,最后得出一张图、一张表、一个视频、一句话,成为最简明的决策数据。人工智能的发展大数据离不开人工智能。20世纪50年代,美国学者提出人工智能概念,认为依靠计算机能力,就可以谱写被认可的乐曲,写小说等。但是,这些都没有实现。后来,又提出专家系统,它是把多个专家的经验输

28、入计算机,就好比把很多名医的处方结合在一起。专家系统的出现,把人工智能向前推进了一步,但它永远只是模仿,无法超越专家。现在,人工智能可以学习。人类跟其他动物的区别就在于人类会学习。专家系统只显示出专家曾经做过什么,不会比专家更好,但现在它能学习,就会比专家更好。比如刚才提到的阿尔法狗,它利用现存于人类数据库中的围棋棋谱,通过自我对局3000万盘的方式学习、训练,得到了完整的围棋程序,最终战胜了围棋大师李世石。这就是因为人工智能会学习。随着“大智移云”时代的到来,人工智能从高大上走向接地气。人工智能的应用范围很广,目前包括机器人、语言识别、图像识别、自然语言处理和专家系统等。现在,信息技术发展走

29、到了一个新时代“大智移云”时代。何谓“大智移云”?具体说来,“大”是指大数据,“智”是指智能化、物联网,“移”是指移动互联网,“云”是指云计算。知名市场调研机构IDC公司曾经发布的一份报告显示,创新平台分为三个阶段:1985年以前,全世界以计算机为创新平台;2005年以前,全世界以互联网为创新平台;到2020年以前,移动宽带、云服务、社交应用和大数据将成为新的创新平台。预测“大智移云”将支撑2020年全球信息产业收入的40%和增长份额的98%。二、大数据营造智慧城市新理念2016年4月19日,习近平总书记在网络安全和信息化工作座谈会上指出,要综合运用各方面掌握的数据资源,加强大数据挖掘分析,更

30、好感知网络安全态势,做好风险防范。城市数据是智慧城市的重要资产我们在政务云、行业云、公共云上部署人口库、法人库、地理库、宏观经济库等各种各样的数据库,并通过数据融合、数据挖掘、数据共享等支撑智慧城市的运行。什么是智慧城市?感知城市、无线城市、数字城市、宽带城市是智慧城市的基础。创新城市、人文城市、平安城市、幸福城市、海绵城市、宜居城市、健康城市、绿色城市是智慧城市应有之义。通州作为北京城市副中心,其定位中的绿色城市、海绵城市、创新城市、智慧城市,也都在这一范畴内。大数据与政府公共服务美国政府规定,信息技术预算的25%将用于云计算应用上,也就是利用云来管理。我国各级政府可以自建或与阿里等企业合建

31、政务云。地方政府的数据逐步迁移至阿里云,或在政府的数据库系统中安装阿里的数据分析设备,为政务部门提供数据共享、分析、开发和应用的平台。一些地方还利用淘宝网为市民免费提供政府服务。腾讯将一些政府机关、企事业单位的微信公众号整合接入微信“城市服务”中,全面记录权力运行过程,防范公权力的私用、滥用。实际上,阿里和腾讯也希望借此获得政府的一些数据。大数据在交通上的应用北京有2000多万的常住人口,948条公交线路,28343辆公交车,每年运送乘客将近50亿人次。对比北京公交路线图、北京居民活动热力图、新浪微博签到图、北京公交一卡通刷卡分布图中可以看出,大部分的北京居民主要在三环、四环以内活动。由此可见

32、,这与北京公交路线分布是不完全对应的。有些地方尽管人少,但也要开通公交线路,这是一种城市服务。在全国大城市上班距离排行榜中,北京以18.9公里排名第一。这一数字到北京城市副中心建成时可能还会增加。从北京居民的手机位置信息统计分析出,北京是全国加班最严重的地方,在19点前下班的白领人数比例不到四成。在金融街上班的白领下班最早,基本上能在17点下班,而在软件园工作的白领往往会加班到21点。据智联招聘统计数据表明,全国信息技术和互联网行业的白领,平均每周加班9.3小时。高德公司采集了5亿多高德地图用户的出行数据,分析得出全国城市拥堵排名。从这一排名看,北京在2014年第一季度位列第四,第二季度位列第

33、三,之后便逐渐位居第一。在2015年第四季度高峰时段,北京的拥堵指数2.06,这意味着在路上拥堵的时间比不拥堵的时间多一倍。平时非早晚高峰,平均车速比较快,但在拥堵时段,平均车速就慢了下来,为22.6公里/小时,每10公里需时27.3分钟,其中延时14.4分钟。那么,为什么北京在2015年第三季度排名中退居第二?因为“93”大阅兵,北京实行单双号限行。在此期间,北京高峰时段的拥堵指数下降了36%,车速提升了60%。有数据分析,北京每年因交通拥堵导致的人均成本将近8000元。2016年第二季度,北京的拥堵指数2.16,人均月拥堵成本952.5元。可见,2016年北京的拥堵情况比上一年更严峻了。北

34、京加快城市副中心建设,也是为了更好的解决大城市病问题。大数据应用于交通疏导。据不完全统计,北京有80万个摄像头。这些摄像头拍摄的影像及时传送到北京交管中心的显示屏上,有专人负责盯看。以色列首都特拉维夫也有很多摄像头,它将所有摄像头拍到的数据,综合反映到一张动态图上,实时发布交通事故、临时交通管制、交通状况信息,给驾驶员和行人提供出行参考。这方面我们做得还不够好,在北京当司机看到交通显示牌的时候,基本上已经到了“前进不了,后退不得”的窘境。这是通过大数据应用可以完善的领域。大数据在环保中的应用美国用无线传感器在密西西比河的水底和水面取样,随后将水质监测结果用卫星回传至后台,利用大数据挖掘等技术分

35、析得出河流的污染状况,并建立了一个数字化河流的模型。这样,点击数字化河流模型的任一点,即可得知其污染情况。实际上,我国上海、无锡等地也做了类似监测。比如,无锡在太湖上也固定放置了一些传感器,监测不同位置的水质污染状况,并将这些数据传到网上,供有关方面了解该处水质污染情况。从2007年至2012年我国大气污染状况看,京津冀地区的人口密度是世界平均值的10倍,煤耗空间密度(单位国土面积上消耗的煤炭)是世界平均值的30倍,汽车空间密度也超过了美国。2015年北京空气质量达标天数186天,占全年天数的51%。根据现在的污染治理情况估计,北京的空气质量要全年达标需到2030年。现在,北京市委市政府加大了

36、大气污染的治理力度。大数据在医疗上的应用大数据在流行病预测中的应用。谷歌比美国疾控中心还早一周发布了某一时段、某一城市的流感状况数据,相似度达到97%。那么,谷歌是根据什么来发布的呢?就是根据搜索词的突发性来判断这个地方所出现的问题。一个地方出现流感,很多人都会上网搜索,了解流感的症状,到哪个医院去看病更好?吃什么药能够缓解症状?一时之间,关于“流感”这个关键词的搜索频率比其他地方、其他时间会高出很多。谷歌就是根据这一点通过大数据分析判断这个地方的流感状况。百度也是采用这一方法统计分析我国艾滋病感染人群的分布状况。一些人感染了艾滋病或是怀疑自己感染了艾滋病,不愿意去医院,偷偷地上网咨询艾滋病的

37、症状、治疗方法等。百度通过数据挖掘、分析得到了卫生部门都无法掌握的信息。从百度发布的数据看,我国艾滋病感染人群最密集的地方是云南和河南。大数据与个性化医疗。我们每个人的基因、代谢以及对药物的反应都是不一样的。即使医生的诊断、治疗方法都正确,也未必会有效。同样的治疗对一些病人来说基本上是无效的,如75%的癌症患者、70%的老年痴呆患者、50%的关节炎患者、43%的糖尿病患者、40%的哮喘病患者、38%的抑郁症患者。大家知道,苹果公司总裁乔布斯在发现患上胰腺癌之后,到医院花费几十万美元做了DNA检测,获得自身全部DNA数据。他说,我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个用这种方式但

38、仍然死于癌症的人。虽然他没有战胜癌症,但这个方法将他的生命延长了8年。2015年,美国奥巴马政府启动了基于基因的“精准医疗计划”。也就是说要对应你的基因开展精准医疗。当年,乔布斯花费几十万美元做DNA检测,2014年美国的报价是1000美元,到2016年可能就只有100美元。GE公司通过统计分析全球不同人群、不同部位、不同扫描方式的CT效果,给出建议剂量。在比利时的CT实验室发现可将全年的CT的扫描剂量降低41%,从而避免可能发生的CT剂量不当的致癌风险。2015年,百度宣布了一项与北京协和医院联合发起的食管癌研究项目,将提供食管癌从预测到诊断、从诊断到治疗的整个医疗闭环的数据支持。大数据在商

39、业上的应用我们在商业网站上的很多数据都被商家利用了。淘宝统计分析用户的IP地址、浏览和购买记录等数据,不仅自用,还出售给有关商家。无论你上哪个网站,即使这个网站与淘宝没有关系,但跟某商家有广告合作,就会弹出与你在淘宝、京东等上所浏览、购买商品有关的广告信息。美国第二大超市Target分析认为,女性是最好的顾客,而怀孕的女性最舍得花钱买东西。因此,Target超市根据孕妇的购买习惯和偏好,选出孕妇经常购买的典型商品,建立怀孕预测指数,针对性地派送孕妇用品的优惠广告。有一天,一位老人气冲冲地来到Target超市某分店,跟总经理说,我家里只有一个上初中的女孩,你们却把孕妇及婴幼儿商品的样品送到家里。

40、总经理就跟他解释说,我们的大数据分析也有搞错的时候。但不到一个星期,这位老人便在纽约时报上登报道歉,说我错怪这个公司了,我忽然发现我女儿意外怀孕了。这个例子说明日常的购物行为产生的大数据也是可以分析利用的。大数据提供机器翻译服务原来,计算机通过学语法、查字典完成翻译,但这并不是好办法。谷歌凭借其海量数据库,找出相关的文章及对应译本,建立多语言数据间的语法和文字对应规律,将语言视为能判别可能性的数据,将语义挑战变成数学问题。比如,你要写一篇关于三亚旅游的文章,我给你找一篇关于腾冲旅游的文章,改一下就行了。你要是想写成英文的,那我就找类似的英文文章再改一下。小孩子学说话,就是模仿,根本不学语法。另

41、外,Facebook也开发了相关技术“多语言作曲家”工具,如果用户使用中文发布帖子,并选择将内容翻译成日语,那么将默认语言设置为日语的用户就可以看到该帖子。现在,百度也可以。“百度翻译”能够提供24种语言的翻译,但整个百度翻译团队却无人能懂其中的12种语言。我们每天都会收到很多邮件,有些邮件并不重要,但不回复的话就显得不礼貌。现在,谷歌邮箱应用Inbox能够自动分析来信内容,并起草三封回信,而我们只需要选择其中一封,按一下发送键就行了。大数据在热点监测中的应用利用短信、微博、微信和搜索引擎可以收集热点事件与舆情挖掘。通过对微博用户建立档案,提前关注可能引起社会不稳定的因素。腾讯通过微博、微信用

42、户的IP地址、所发帖子分析得出他们的性别、年龄、职业和所在地址等信息,并以此为用户建立档案。根据网上一些信息的大数据分析,可以掌握一个人的背景和行为,这对于政府的维稳管理是十分有帮助的。长假来临前,很多人都会上网搜索旅游景点、酒店、火车、飞机、自驾游路线等信息,由此可预知哪些旅游景点会人满为患,哪些交通路线会拥堵不堪。2012年国庆长假前一周,百度发现“华山”搜索量激增,认为华山景区在应对大量游客中可能会出现问题,果然发生了华山拥堵事件。2013年国庆长假前4天,百度发现搜索“九寨沟”的人非常多,于是预测九寨沟要出事,结果九寨沟景区也发生了拥堵事件。2013年5月,昆明市民上街抗议“PX化工项

43、目”上马,而百度提前一周便从当地市民对该项目搜索关注程度的剧增,判断出该项目的推进会出问题。现在,一些地方政府找到百度,希望百度能为自己提供长假旅游、社会治安等方面的大数据预警。大数据与治安管理2013年8月,美国大西洋月刊报道了一个事件。纽约一对夫妇分别在谷歌上曾搜索“高压锅”和“背包”,一天后联合反恐部队6人上门盘问是否拿高压锅做炸弹。为什么?因为波士顿马拉松爆炸事件的犯罪嫌疑人就是将装有爆炸装置的高压锅藏在背包中,在袭击地点引爆的。所以,同一IP地址,尽管在不同时间搜索“高压锅”和“背包”,美国安全部门都会把这两个关键词与恐怖袭击联系起来。2012年美国加州大学帮助洛杉矶警察局分析洛杉矶

44、市过去发生的1300万起案件,找到了各街区案件发生与时间、天气、交通状况及其他相关事件的关系,建立犯罪活动预测平台,使当地财产犯罪率和盗窃案件分别下降了12%和26%。另外,美国还利用大数据技术来缉毒。为了避免被警察发现,美国的毒品种植由露天转为豪宅之内盆栽大麻,利用LED灯进行光合作用,一年就能赚回或买或租豪宅的费用。由于一般家庭用电是白天用得少,晚上用得多,而毒品种植是白天晚上都要大量用电。据此,美国警察利用供电公司提供的每户智能电表统计用电量与用电模式的数据,判断这个建筑物是否有问题,从而一举捣毁毒窝。大数据在反恐中的应用在反恐应用中,一般都是利用关键词搜索分析,但这也不是很管用,主要是

45、因为计算机没有人的思维,在分析文字中常常出现问题。某企业不能做到给每位员工配备一台电脑,于是一个员工就给老板发了条信息说:“我申请一台独立电脑”,后台的计算机因“台独”二字而把信息拦截。未来的大数据分析需要人机结合,需要更多的人工智能,需要人的感情。计算机通过关键词分析文字都有困难,那分析照片、视频就更难了。暴恐音视频是反恐应用中难度最大的,也是政府有关部门最头疼的。以往,甄别暴恐音视频只能靠人,现在谷歌研发出一种机器学习算法,能自动生成图片、视频的题注说明,准确描述图像内容。这将有助于搜索引擎快速找出网上的暴恐图片与视频。大数据与政治回顾四年前的美国大选,当时,奥巴马与共和党总统候选人竞选,

46、在大选还未结束时,网上民调显示,奥巴马的胜算是47.9%,罗姆尼的胜算是47.4%。奥巴马竞选团队的数千名志愿者,向斯坦福大学借了66000台计算机,通过社交网络和微博等收集选民的爱好和信息关注点,用计算机分析数据并建立选民档案。如果某个选民在Facebook或者Twitter上的大部分帖子都是关于环保和医疗的,那奥巴马团队就会以奥巴马的名义给他发电子邮件,专门谈论相关问题,让他感受到奥巴马想我之所想,使他有理由支持总统连任。大数据还可以分析舆情。美国微软纽约研究院的经济学家根据网络舆情,提前一周预测2012年美国总统选举结果,51个州命中50个,准确率达98%。另外,在连续三年的奥斯卡预测中

47、,除了最佳纪录片、最佳动画片,其他奖项均预测准确。大数据与台湾地方选举。2014年11月,台湾地方选举开票前一周, “谷歌指数”基于候选人在谷歌和YouTube的相关搜索量及在谷歌中被讨论的次数计算,以此预测选举情况。“谷歌指数”分析,在台北,连胜文得分88分,柯文哲得分95分,最终开票结果为连胜文60.7万票,柯文哲84.8万票,连胜文输了。“谷歌指数”分析,在新北,朱立伦得分84分,游锡堃得分81分,最终开票结果为朱立伦95.9万票,游锡堃93.4万票,朱立伦险胜游锡堃。由此可见,在投票前一个星期,通过数据分析就已知晓台湾地方选举的结果了。所以,我们完全可以利用大数据分析舆情,知道老百姓的

48、想法。以众包方式优化城市管理近年来,北京鼓励公众参与到城市治理当中来。例如,在北京城市街道环境评价公众参与平台上,市民可对北京的街道环境进行好或差的评价。美国波士顿的街道上有很多坑坑洼洼的地方,但没有足够多的工作人员去管理。当地政府为此开发了一个APP,司机把这个APP装在手机上,之后将手机放在汽车仪表盘上,当汽车遇到坑洼而颠簸时,手机就向指定服务器发送包括所在地GPS位置的信息。同时,当地政府利用众包方式鼓励市民优化该APP,避免了误报。2015年,上海举办以城市交通为主题的开放数据创新应用大赛,开放了城市道路、地铁、一卡通、公交车、出租车等数据,面向全世界征集改善城市交通和市民出行的数据可

49、视化应用和解决方案。2011年,致力于绿色出行的广州民间团体“拜客广州”,依靠微博平台,发起随手拍自行车出行障碍活动,收集市民发现的问题,将其分类、总结后反映给交通规划管理部门,并对问题的解决进行跟进。在佛山,政府招标选定电梯监控公司,由他们对小区中的电梯安全进行实时监控,并允许他们运营楼层广告。这样,政府没有多花一分钱,就实现了全市的电梯监控,保证了电梯的使用安全。现在,各地的智慧城市建设更重要的是要通过数据公开来实现人民城市人民管。在这点上,我认为要以众包方式优化城市管理。北京城市副中心的定位2012年,北京市第十一次党代会上,北京市委、市政府明确提出“聚焦通州战略,打造功能完备的城市副中心”。北京市的定位是全国政治中心、文化中心、国际交往中心和科技创新中心。通州作为北京城市副中心其定位是国际一流和谐宜居之都示范区、新型城镇化示范区、京津冀区域协同发展示范区

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 企业信息化

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报