1、1 高盛人工智能报告中文版 目录 高盛人工智能报告中文版 . 1 高管概述 . 2 人工智能是什么? . 3 什么是神经网络? . 3 为什么现在人工智能加速发展? . 4 价值创造的主要驱动力 . 5 主要影响 . 6 AI和生产力的矛盾:采访Jan Hatzius . 7 生态系统:云服务,AI的下一个投资周期开源的关键受益人 . 9 AI三个方向:自建,咨询服务和AI服务化 . 9 自建:云平台和开源系统正在成为AI的左膀右臂 10 咨询服务 . 11 AI服务化 13 中国人工智能现状 . 15 机器人:用户界面的未来 17 行业应用 . 21 农业 . 21 零售 . 27 能源 .
2、 34 人工智能创新:GOOGL(谷歌), AMZN(亚马逊) . 40 人工智能创新:AAPL(苹果), MSFT(微软) 41 人工智能创新:FB(Facebook), CRM 42 人工智能创新:NVDA(英伟达), INTC(英特尔) 43 人工智能创新:Uber,IBM 44 人工智能创新:百度 . 45 2 高管概述 人工智能是信息时代的尖端科技。计算的飞跃建立在人类告知计算机如何表现的基础上,计算建立在计算机学习如何表现能够对每个行业有意义的基础上。虽然目前可能被视作在下一个AI冬天(图8)之前的最新承诺和失望循环,这些投资和新技术至少将给我们带来机器学习产品的实实在在的经济利益
3、。 与此同时,人工智能、机器人和自动驾驶已成为流行文化的前沿,甚至是政治表述。但是,我们去年的研究让我们相信这不是一个失败的开端,而是一个拐点。我们将在这个报告里看到,宏观(更多更快的计算和更多数据的爆炸式增长)和更加微观方面(在深度学习方面的有益进展,智能硬件和开源方面的增长)的拐点的原因。 关于人工智能拐点的更多令人兴奋的方面之一是真实应用案例的增加。例如深度学习促进计算机视觉的发发展,这些技术做为自然处理语言引人注目地提升了苹果Siri、亚马逊Alexa和谷歌图片识别的质量,人工智能不是为了技术而技术。大数据和强力技术相结合,创造价值,获得竞争优势。 例如,在医疗领域,图像识别技术可以促
4、进癌症诊断的准确性。在农业领域,农民和制种者可以利用深度学习促进产量增长。在制药行业,深度学习被用于发现新药。在能源行业,勘探效率和装备可靠性提升。在金融服务行业,同以前可能的相比,成本降低,新数据应用于更快速的分析,返回结果。人工智能在应用案例发掘的非常早的阶段使用,同时做为基于云服务共享的必要的科技,我们相信一波革新将到来,为每个行业创造新的冬天和失业者。 人工智能广泛的适用性也让我们认识到它是全球经济的针移技术、提升效率和结束美国经济增长停滞的驱动。利用GS首席经济学家Jan Hatzius的研究,我们设计了当前的深度资本不景气指数和它对美国生产力的相关影响。我们相信人工智能技术驱动生产
5、力提升的可能,就像1990年一样,驱动更多的资本合作和人力效率提升项目,促进增长,促进盈利,扩大股票价值。 我们发现人工智能实实地影响着每个公司、行业和经济因素,对投资者有四个方面值得注意。 生产力。人工智能和机器学习有引发生产力增长的潜力,有益于经济增长,公司盈利,资本回收和资产估值。根据GS首席经济学家Jan Hatzius“原则上,人工智能看起来的确比上一波革新在统计学上有表现更好的潜力,人工智能降低成本和人力需求,更高的产品附加值类型。”例如,同iPhone应用的多样性和可靠性相比,统计学家可能更好的建立并获得这些商业部门的费用节减革新。广义的人工智能对商业部门的费用结构有广泛的基础性
6、影响,我由衷相信人工智能将被统计学家采纳,并在整体生产力数字中有所展现。” 优质科技。人工智能和机器学习的速度价值有扭转更便宜的数据中心和网络硬件的趋势的潜力。我们相信这将驱动硬件、软件和服务领域市场费用的大量变化。例如,1条运行在标准数据中心上的AWS工作量,同在人工智能优化后的GPU上运行所需的0.9美元相比,每小时实际计算成本只要0.0065美元。 竞争优势。我们看到人工智能和机器学习在改造各行业竞争订单方面的潜力。那些失败于投资和平衡这些科技风险的管理团队被竞争者超越,这些竞争者受益于他们创建的战略情报、获得的生产力和资本效率。在41页插图中,我们论证了这些竞争优势是如何应用于医疗、能
7、源、零售、金融和农业。 新公司创建。近10年来(图6975)在人工智能和机器学习领域,我们已经识别出有超过150家私营公司.我们相信人工智能的大部分价值将由拥有资源、数据、投资能力的大公司获得。我们希望风险投资家、企业家和技术专家继续驱动新公司的创建,反过来,驱动实质3 性的创新和价值创造,至少是,M 识别异常行为的集群。 预测。基于网络活动和其他元数据预测客户或员工流失的可能性; 基于可穿戴数据预测健康问题。 什么是通用,强大或真实的人工智能? 通用,强大或真实人工智能是,机器智能算法完全复制人类智慧,包括人类的独立学习和决策能力。虽然像全脑模拟这样的技术被用于实4 现通用AI的目标,但是其
8、所需的计算能力数量,仍然远远超出了当前的技术,使得通用的人工智能基本只存在于理论层面。 为什么现在人工智能加速发展? 请记住,我们并不关注于重复独立人类智能且在流行文化中常见的真实、强壮或普遍的人工智能。必然存在潜在突破点,例如谷歌深度思维AlphaGo系统,不仅击败了世界冠军,而且使用了没有人曾经做过的行为,我们关注人工智能即刻可触达的经济发展领域。 深度学习能力方面的主要飞跃成为当前进行中的AI拐点的催化剂。神经网络,深度学习之后潜在的科技架构,已经存在了几十年,但是过去的5到10年,三件事发生了改变。 1.数据。通过分布于全球持续增长无所不在的互相联系的设备、机器和系统产生的非结构化数据
9、的数量呈现巨大的增长。拥有的数据越多,神经网络就变得越有效率,意味着随着数据量的增长,机器语言可以解决的问题的数量也在增长。移动手机、物联网、低耗数据存储的成熟和处理技术(通常在云端)已经在数量、大小、可靠数据结构方面创造了大量的成长。例如,特斯拉至今已经搜集了780mn英里的驾驶数据,并且每10小时通过它连接的汽车增加百万公里的数据。Jasper(2016年2月被思科以14亿美元收购)拥有一个平台驱动机器和机器的沟通,服务于多种汽车制造商和电话公司。Verizon在8月进行了一次类似的投资,宣布收购Fleetmatics,它通过快速增长的无线网络,连接运输工具上的远程传感器到云端软件。5G的
10、首次展示将最适当地加速数据可被获取和转移的机率。根据IDC的数字领域报告,到2020年,每年数据量将达到44ZB(万亿G),5年内年复合增长率达到141%,暗示我们刚开始看到这些科技可以达到的应用场景。 2. 更快的硬件。GPU 的再次使用、低成本计算能力的普遍化,特别是通过云服务,以及建立新的神经网络模型,已经极大的增加了神经网络产生结果的速度与准确率。GPU 和并行架构要比传统的基于数据中心架构的CPU 能更快的训练机器学习系统。通过使用图像芯片,网络能更快的迭代,能在短期内进行更准确的训练。同时,特制硅的发展,比如微软和百度使用的FPGA,能够用训练出的深度学习系统做更快的推断。另外,从
11、1993 年开始超级计算机的原计算能力有了极大发展(图2)。在2016 年,单张英伟达游戏显卡就有了类似于2002 年之前最强大的超级计算机拥有的计算能力。成本也有了极大的降低。英伟达GPU(GTX 1080)有9 TFLOPS 的性能,只要700 美元,意味着每GFLOPS 只要8 美分。在1961 年,要提供1GFLOPS,需要足够多的IBM 1620s串联在一起,计算下来费用要超过9万亿美元(根据通货膨胀调整)。 3. 更好、更普遍可用的算法。更好的输入(计算和数据)使得更多的研发是面向算法,从而支持深度学习的使用。例如伯克利的Caffe、谷歌的TensorFlow 和Torch 这样的
12、开源框架。比如,刚开源一周年的TensorFlow,已经成为最大的开发人员协作网站GitHub上最多分支(或活动)的框架。虽然不是所有的人工智能都发生于普遍可用的开源框架中,但开源确实在加速发展,而且也有更多先进的工具正在开源。 方向 虽然本报告的重点是人工智能的发展方向以及公司如何把握这个方向,但是了解人工智能对我们生活的影响程度也是很重要的。 在线搜索。就在一年多以前,谷歌透露,它们已经开始将大量的搜索工作移植到了RankBrain(一个人工智能系统),使其与链接(links)以及内容(content)成为了谷歌搜索算法的三个最重要的标志。 推荐引擎。Netflix,亚马逊和Pandora
13、 都在使用人工智能来确定推荐什么样的电影和歌曲,突出哪些产品。5 月,亚马逊开源了它们的深度可扩展稀疏传感网络引擎(the Deep Scalable 5 Sparse Tensor Network Engine(DSSTNE),简称Destiny),它被用于产品推荐,同时可以被扩展,以实现超越语言和语言理解的目的。 人脸识别。Google(FaceNet)和Facebook(DeepFace)都投入了大量的技术,来确定照片中的脸和真实的脸是不是完全吻合。1 月,苹果采取了进一步措施,购买了Emotient(一个致力于通过读取人的面部表情来确定其情绪状态的AI 创业公司)显然,这些技术远远不止
14、于对照片进行标记。 虽然个人助理应用产品有无数的用户,比如苹果的Siri,信用贷,保险风险评估,甚至天气预测。在接下来的篇幅中,我们探讨企业该如何使用这些技术来加速增长,降低成本和控制风险。从这些技术及其使用这些技术的应用的发展速度来看,它们充其量不过可以为公司和投资者提供一些方向,以保持他们的竞争力。 价值创造的主要驱动力 经过深入分析,我们认为与AI主题相关的利润创造(和损失)可以分解为四个关键输入:人才,数据,基础设施和硅。这些投入也同时也是进入的壁垒。 人才 AI(特别是深度学习)难度很大。根据我们与领域中的风险投资公司和公司的对话,这种困难造成了人才短缺,以及大型互联网和云计算供应商
15、对这类人才的竞争(见图5)。 对于AI人才的高度需求意味着获取必要的AI人才。随着技术和工具的成熟,人才可能变得不再是瓶颈。然而,我们相信人才会迁移到有趣的,差异化的数据集。因此,我们认为,当我们进入一个以AI为中心的世界时,大的差异化数据集是最可能的提高和增加利润的驱动力。 数据:数据是AI的关键输入。深度学习效果与大数据集紧密相关,因为更大的数据集会阻碍模型过度拟合。例如,来自马萨诸塞州总医院和哈佛医学院放射科的研究人员使用卷积神经网络来识别CT图像,基于训练数据大小来评估神经网络的准确性。随着训练规模的增大,精度将被提高(图6)。 今天的大多数深度学习是监督的或半监督的,意味着用于训练模
16、型的所有或一些数据必须由人标记。无监督的机器学习是AI中当前的“圣杯”,因为可以利用原始未标记的数据来训练模型。广泛采用深度学习可能与大数据集(这是由于移动互联网和物联网产生)的增长以及无人监督的机器学习的发展有关。然而,我们认为大型差异化数据集(电子健康记录,组学数据,地质数据,天气数据等)可能是未来十年企业利润创造的核心驱动力。 参考IDC报告,全世界创造的信息量预计到2020年将以36的复合年增长率增长,达到44泽字节(440亿GB)。连接的设备(消费者和工业领域),机器到机器通信和远程传感器的增加和组合可以创建大型数据集,然后可以挖掘洞察和训练自适应算法。在过去十年中,数据的可用性也大
17、大增加,人口普查,劳动力,天气,甚至基因组数据可大量的免费在线查询。 我们还留意到卫星图像的可用性增加,这需要大量的计算来支撑全方位的分析。美国地质调查局的Landsat 7和Landsat 8卫星每8天对整个地球进行成像,USGS使这些图像可以免费使用 - 即使是在压缩时,超高清图像的文件大小也各为 1GB 左右。其他公司,如Orbital Insights,正在汇总图像数据并在多个行业创建商业解决方案。 基础设施:硬件和基础设施软件是开展AI工作所必需的。我们认为支持AI的基础设施将被迅速商品化。这个观点基于两个现象观察:1)云计算供应商能够将他们的产品扩展到 AI基础设施中,2)开源(T
18、ensorFlow,Caffe,Spark等)已经成为AI中软件创新的主要驱动力。为了促进AI技术的应用,我们认为大型云供应商将继续开放基础架构资源,这将限制利润创造的潜力。 6 硅技术:GPU在深度学习领域的新用途成为我们目前AI春天的核心驱动力之一。在人工智能、机器学习生态系统中,存在二个主要应用来决定神经网络的表现,每个神经网络需要不同的资源。首先是学习算法的构造和使用。学习算法借助大数据(通常更大、更好)发现相互联系,并且创建模型,提供新输入,可以决定输出的可能性。学习是资源密集型,并且大多数现代学习通过GPU驱动的系统来运行。一旦经过学习,模型和算法的使用将被称为推论。推论需要更少的
19、计算资源,经常通过更小增量数量输入进行梳理。一些GPU被优化用于推论(例如英伟达P4系列和M4系列),给出单目标的自然推论。硅谷有针对性地发展用于该应用的专业技术,例如FPGAs(现场可编程门阵列)和ASICs(专用集成电路)。这种类型的集成电路被独创地用于原型机CPU中,但是逐渐地被应用于人工智能推论。谷歌的张量处理单元就是ASIC应用于AI和机器学习的一个例子。微软也在将FPGA应用于推论。英特尔在2015年收购了FPGA制造商Altera,有观点认为,到2020年,三分之一的数据中心将在特殊定制化应用中使用FPGA。赛灵思在1980年开发了可商业化的FPGA,领先提出了云和大数据将做为有
20、价值的增长途径,宣布和百度达成战略协作关系。数据中心业务大概占赛灵思 5%的营业收入。 主要影响 促进未来生产力 在经历了90年代中后期的高速发展和过去十年的平缓增长后,美国的劳动生产力近几年已经进入了增长停滞的阶段。我们相信实用的机器学习和人工智能的蓬勃发展可以将生产力典范作用广泛推广至全球各产业领域。 人工智能和机器学习带来的自动化及效率提升在普遍各领域都缩减了约 0.5%-1.5%的劳动工时,预计到2025年将带来51-154比特/秒的生产力提升。 在期待未来人工智能和机器学习得以同时提升生产效率的分子和分母(标准工时和实际投入工时),最重要的是它带来的早期影响将会体现在低薪工作的自动化
21、层面,用更少的工时驱动同比产出增长。我们基本认为人工智能和机器学习提速97比特/秒意味着在2025年IT将为生产率增长贡献1.16%效能,也即比1995-2004提高11比特/秒. 技术与生产力增长 90年代掀起的科技热潮伴随着生产力、资本深化和多因素生产力被异常放大,并与飞涨的股票估值紧密关联。 资本深化 高盛的经济学家Jan Hazius提供了他近期就资本深化(每工时资本量)反周期性趋势的分析,在扩张时期没有同等水平股本增长的情况下历史劳动工时一般趋于增长(参见Jan的报告:“生产率悖论 2.0版本再探” 2016年2月9日发表)90年代资本深化急剧增长,其中最显著的是非典型资本投资的增长
22、超越了劳动力市场的增长。 多因素生产力 (MFP) 2013 年 3 月,美联储研究的大卫 伯恩等研究后发现,90年代在IT 生产和一般操作流程中同时推广技术有助于促进增长呈三倍激增 (每劳动工时的产出) ,其中从科技热潮前到1995至2004之间,年生产率平均每年增长中不超过49%的部分来自于IT 生产部门。 (展示 10) 千禧年后停滞期 在过去的十年中,有关 IT 应用 (计算机硬件、 软件和电信) 的资本深化增长已经停滞了。IT资本,与更广泛的市场资本类似,带来IT部分整体增长相比科技浪潮甚至其之前的时期内还低。总劳动时间一直在增加,但资本强度对生产力的贡献已经远远落后于上世纪 90
23、7 年代。日益精细且可利用的机器学习和人工智能可能成为一剂催化剂将资本密集度带回最前沿,在我们看来,将会带来类似90年代所看到的周期阶段,极大增加劳动生产率。 对于方程另一侧的MFP,我们更乐观些。高盛经济学家强调 (“生产率悖论 2.0再探” 2016年2月9日发表),ICT价格的正偏差,非货币产出的输入增长 (免费的在线内容、 后端流程等) 也在一定程度上反映了实际 GDP 和生产力增长。Facebook 和谷歌等互联网巨头的发展充分说明了复杂输入的劳动力和资本并不必然将标准生产力指标中的传统消费品转换为货币。 人工智能/机器学习激发的生产力可以影响投资 我们认为人工智能/机器学习所带来日
24、益增长的生产力产生的潜在影响之一可能是公司资本分配方式的转变。自 2011 年中期,股息和股票回购的增长大大超过了资本支出增长,然而管理层对于投资资本项目的冷淡依然保持了经济衰退后期的状态。 生产率的提高有可能恢复管理层的信心,并鼓励公司像上世纪 90 年代一样投资于生产性资本。根据高盛资本支出追踪,90 年代资本支出同比增长,持续性高于耶鲁大学教授罗伯特 希勒的 S 预测请求:每 1k 请求 0.05$到0.10$;另外,基于请求数量,每个节点每小时另收0.40$ Speech API 将语音转换成文本 1分钟之内免费;1分钟以上每15秒收取0.006$ Cloud Natural Lang
25、uage API 无结构化文本数据的分析 0到5k数据免费;超过5k数据,基于特征数量和月使用量,每1k数据收取0.125$到1$ Translate API 超过90种语言的翻译 每1百万字符20$ Prediction API 机器学习及预测分析工具 6mo内免费使用;每个项目每mo收取10美元;若每天免费预测或流式训练超过10000,每1k预测另外收取0.50$,每1k流式数据更新收取 0.05$;训练数据每 M收取0.002$ 微 软(MSFT) Computer Vision API 数据可视化分析工具 根据月使用量,1千调用收取0$到1.50$ Emotion API 图像情感识别
26、 根据使用量,1k 事务收取 0$到0.25$;视频免费 Face API 人脸检测及人脸识别 根据月使用量,1k事务收取0$到1.50$ Text Analytics API 非结构化文本分析 根据使用量,每月0$到2500$ Video API 从视频中进行人脸跟踪、移动检测、图像稳定和创建缩略图的高级算法 每月每种特征300事务免费 Bing Speech API 语音转换成文本及文本转换成语音;可以与用户进行对话 根据类型和用法,每1k事务0$到4$或每小时5.5$到9$ Custom Recognition Intelligence Service 可定制语言识别工具 受邀使用 Sp
27、eaker Recognition API 语言及说话者识别,用于安全验证 基于用法和采用的特征,每1k事务0$到10$ Bing Spell check API 拼写检查 根据月使用量,每月收取 0$到13 45$;使用超量,每100k事务收取50$ Language Understanding Intelligent Service (LUIS) 训练app理解人类命令 根据用法,每 1 事务收取 0$到0.75$ Linguistic Analysis API 用于结构化文本识别的自然语言处理工具 免费;但每月限100k事务,每秒限2个事务 Web Language Model API
28、基于REST的云服务,提供用于自然语言处理的工具 根据用法,每1k事务收取0$到0.05$ Academic Knowledge API 用于学术目的用户请求翻译,从Microsoft Academic Graph检索信息 根据用法,每1k事务收取0$到0.25$ Entity Linking Intelligent Services 情境化语言处理 免费试用;每天1k事务 Recommendations API 个性化产品推荐 根据用法,每月收取0$到5000$ Bing Autosuggest API 向Bing发送部分搜索请求,返回建议列表 根据每月使用情况,收取 0$到270$,超出部
29、分每100k事务30$ Bing News/Image/Video/Web Search API 向Bing发出请求,获取搜索结果 根据每月使用情况,收取 0$到8100$,超出部分每10k事务30$ 来源:企业数据 AI服务化 细化的基础行业AI-aaS情况(客户流失,员工保留等) 在更加细化层面,例如:CRM(商机分析)、HR(人才保留)和制造业(预见性维护),可以看到SaaS供应商已经开始布局,这主要得益于SaaS供应商可以接触到大量的不同种类的数据。Workday, S, Zendesk, Oracle, SAP和IBM是最终能够角逐细化的AI-aaS市场的几家供应商。我们调查过的大部
30、分SaaS供应商都在开发数据分析产品和建立基准数据集,并且我们发现他们的数据长远来讲是一种障碍。(并且我们发现这类供应商已经为长远发展而圈地)。 Salesforce在机器学习能力积累方面步伐最大,其在过去18个月中有过4次AI类型公司的收购(见图5)。 考察的公司包括: IBM, SAP, Oracle, Salesforce, Workday, Zendesk, Hubspot, Shopify, Ultimate Software, ServiceNow 垂直专业行业AI-aaS情况(医学图像处理、欺诈预测、天气预测等) 14 垂直特定领域的“AI 即服务”很可能更多样化地推动。大产业巨
31、人能聚合数据,通过这些数据可以构建机器学习模型,同时可以将这些模型卖给合作方、客户、供应商。初创公司可以在垂直领域的用例中构建独特的数据集,例如医疗影像,可以使整个医院网络有其可访问的接口。各领域的行业协会,例如零售或广告业能混合数据(术语)使其和更大的竞争对手竞争(例如一些零售商能够通过混合数据更好地和亚马逊的推荐引擎竞争) 医疗行业中,IBM在开发垂直特定的 “AI即服务”的能力已经是一个佼佼者。近两年IBM已经花费超过40亿美金来获得大量的医疗技术和收购数据公司。这些收购的结果是大量的医疗数据(IBM在其“健康云”有超过3亿病人的医疗记录)。用这些医疗数据(包括通过合伙企业所采集的其它数
32、据)和他沃森技术的集合,IBM正在向肿瘤学、临床试验、基因组等用例(场景)提供服务。在医疗垂直领域,其它的初创公司也正在遵循类似的方法来解决医疗影像、药物发现、诊断等方面的疑难问题。 医疗行业的垂直“AI即服务”展示: 公司 描述 资产(百万) AiCure 提供基于AI的技术,这种技术是在移动设备上有效地进行可视化药物提取。 $12 Apixio 提供增加“联邦医疗保险优良计划”风控的准确性、生产率和速度的SaaS应用程序 $42 Arterys SaaS化的分析平台,其可以提供大数据量化(管理)和可视化能力。 $14 Atomwise 针对药物发现而开发的AI系统 . BioBeats 创
33、建基于AI/机器学习的健康解决方案 . Butterfly network 开发高性能的带有深度学习算法的超声波机器 . Deep Genomics 基于机器学习的技术来开发精准医疗、基因检测、诊断和治疗(技术) . Enlitic 用深度学习技术从临床案例中产生有用(可执行)的结论 Entopsis 聚焦在肿瘤学、自身免疫性疾病、罕见疾病的诊断方案 Ginger.io 分析从智能电话所产生的行为数据,做心理健康监控。 Healint 慢性疾病管理的解决方案 Lumiata 以AI技术为动力的健康数据分析工具 MedAware 药方错误预防的解决方案 Numerate 基于机器学习技术的药物设
34、计平台 Oncora Medical 通过大数据分析和机器学习方式来解决肿瘤学问题的临床决策支持软件 VisExcell 通过大数据和机器学习算法开发在乳腺X线图像和其它图像形态方面计算机辅助的探测软件 Wellframe 为护理管理者提供的病人管理和分析的解决方案 Welltok 基于机器学习技术的健康管理工具提供方,他们将健康程序、社区、App和跟踪设备连接起来。 Zebra Medical Vision 提供自动化的实时分析和可以追溯的医疗图像服务 Zephyr Health 洞察力即服务的生命科学解决方案公司 来源:数据公司(Crunchbase) 15 中国人工智能现状 根据IRes
35、earch的研究,中国2020的AI市场规模将由2015年的12亿人民币增长到91亿人民币。在2015年,有将近14亿(年同比增长76%)的资金流入AI市场。 在政府政策方面,中国发改委联合相关部门在2016年5月18号发布了互联网+和人工智能三年实施计划。规划确定了在六个具体方面支持人工智能的发展,包括资金、系统标准化、知识产权保护、人力资源发展、国际合作和实施安排。规划确立了在2018年前建立基础设施、创新平台、工业系统、创新服务系统和AI基础工业标准化这一目标。发改委预计中国的AI工业会和国际发展水平接轨,同时在系统级的AI技术和应用方面领先世界市场。 中国已经采取了行动:从提到“深度学
36、习”或者“深度神经网络”的期刊文章数据上看,中国已经超越美国。中国的AI研究实力同样让人印象深刻,其拥有世界领先水平的语音和图像识别技术。百度在2015年11月开发的深度语音2可以达到97%的准确度,并被MIT科技评论评为2016年度十大科技突破。另外,早在2014年中国香港大学开发的DeepID在LFW数据集上达到了99.15%的准确度。 中国互联网巨头BAT引领中国AI的发展,与此同时,数百个初创公司在不同的AI细分和应用领域建立服务模型。当前,中国的AI市场主要分为以下几个领域: 1) 基础服务如数据源和计算平台 2) 硬件产品如工业机器人和服务机器人 3) 智能服务如智能客服和商业智能
37、 4) 技术能力如图像识别和机器学习 根据iResearch的报告,语音和图像识别分别占有当前中国AI市场的60%和12.5%。71%的中国AI公司集中在应用开发上,其他的则聚焦在算法上,其中55%是计算机视觉,13%在自然语言处理,9%在基础机器学习。 图23:提到“深度学习”或“深度神经网络”的文章数量 图24:提到“深度学习”或“深度神经网络”且被至少引用一次的文章数量 16 我们认为,未来AI领域的引领者仍将会在美国和中国。 Baidu 2015/09 DuEr(百度秘书) 语音控制的AI个人助理 2015/11 深度语音2 基于巨大神经网络的语音识别技术 2015/12 无人驾驶部门
38、 无人驾驶车在北京完成上路测试;百度在硅谷设立无人驾驶中心 2016/08 DuSee 整合了百度移动搜索和地图的面向移动服务的AR平台 2016/09 百度大脑 百度的人工智能平台 2016/09 Paddle Paddle 百度开源的深度学习框架 2016/10 百度移动APP8.0 整合了智能搜索和个性化新闻推荐的移动 APP,采用了AI、自然语言处理和深度学习等技术。 阿里巴巴 2015/07 阿里小秘 AI客服,根据2016/10阿里的报告,约80%的问题由AI处理。 2015/08 DT PAI 基于阿里云的机器学习平台,声称是中国第一家AI平台。 2016/06 阿里光学字符识别
39、 ICDAR 鲁棒识别大赛中获得第一名 2016/08 阿里云ET 视频、图像和语音识别的整体解决方案套件 腾讯 2015/06 Youtu 腾讯对外开放了人脸识别等Youtu核心技术 2015/08 TICS实验室 腾讯成立的人工智能实验室,主要研究如下领域:搜索、自然语言处理、数据挖掘和人工智能 2015/09 Dreamwriter 腾讯发布了中国第一个新闻报道机器人 2015/11 What实验室 微信-港科大人工智能联合实验室 17 机器人:用户界面的未来 机器人是非常具有潜力的范式转换。在以机器人为中心的世界,用户体验从基于点击的行为转向会话(文本或者语音)以及互动从网络或面向应用
40、转向消息或语音平台。换句话说,相比之前的打开三个不同的应用程序分别预约旅行,购买衣服以及参与客户服务,而现在用户只需要通过会话提供信息给提供帮助的机器人,从而完成同样的事情。因此,我们能看到这些对电子商务,客户支持,员工工作流程及工作效率的广泛影响。 在最近的12-18个月中,一个关键驱动因素是大型云服务和互联网公司建立并开放了机器学习框架。在2015年年末,Google开源了机器学习算法库TensorFlow,亚马逊和微软在这方面也非常活跃,通过提供云服务支持他们自己的机器学习项目。我们预计这种机器学习平民化的趋势将会持续激发智能机器人的发展,主要领导者(亚马逊,谷歌,苹果,微软)期望整合会
41、话界面(Alexa,GoogleAssistant,Siri,Cortana)到他们的各自的生态系统。继今年三星收购Viv,我们预计将在三星设备和智能手机生态系统中进一步整合基于Viv AI的数字助理。 自然语言处理(NLP).机器人的期望植根于他们智能或处理自然语言的潜力。因此伴随着机器学习、自然语言处理的人工智能技术、计算机理解、以及语义理解兴趣和创新的兴起,对机器人的兴趣也在兴起。相比过去的文字处理方式,与基于硬编码规则集构建的CTRL+F函数操作的处理器相反,NLP利用机器学习算法来基于海量训练数据来学习规则,然后可以将其应用于新的文本集。机器学习的核心原则同样适用于NLP,获取的数据
42、越多,其应用程序就越准确和更广泛。 虽然NLP的早期应用已出现在文本挖掘(例如,法律分析文档,保险单和社交媒体)和自动问答中,但是神经网络和深度学习模型的优势正在使NLP变得越来越智能化,解决人类语言的歧义问题。Google基于人工智能系统Tensorflow的自然语言解析模型分析库SyntaxNet,SyntaxNet将神经网络运用于歧义问题,一个输入句子被从左到右地处理,只有当存在多个得分更高的假设的时候,一个假设才会被抛弃。SyntaxNet模型是谷歌的TensorFlow框架训练过的最复杂的网络结构。 消息平台.机器人的兴起与诸如 FacebookMessenger,WhatsApp以
43、及面向企业的Slack 和HipChat等消息应用的快速增长同步。消息应用程序提供了一种媒介,通过它,机器人可以与iOS,Android和网络上的用户进行交互。此外,更大的消息应用正在发展成支持多种交互类型的平台。在Slack上,企业用户可能与团队合作,监控应用程序,创建待办事项列表或从同一接口监控费用。FacebookMessenger,能够利用同一个界面,用户可以与朋友聊天,提出品牌的支持问题或进行Uber预约。 最近的聊天机器人收购或亚马逊(Angel.aiCEO)和Google(API.ai)的部分收购,每一个都专注于会话界面技术,突出了公司和投资者在聊天和自然语言处理能力的联合中看到
44、的机会。根据Pitchbook的数据,自2013年以来,在AI/ML,电子商务,SaaS和网络安全等方面的私人消息公司累计风险投资约120亿美元,而在8年前则约为20亿美元。 18 事件机器人的广泛应用已经使得一些公司获益良多。第一大类的获益的公司是信息传播平台,例如Facebook,Slack,WeChat等等。机器人帮助推动用户参与度的提升,创造机会驱动平台上的商业活动。第二大类获益的公司是硬件和基础设施提供商,其范围从 GPU 提供商(NVIDIA)到开源提供商,到数据平台提供商,以及像亚马逊,谷歌,微软这样的云服务提供商。其中,亚马逊位置独特,它具有满足电子商务需求的能力。另外一些正在
45、挖掘机器人能力的软件公司包括Zendesk和S,它们把机器人看作是自动化满足企业客户需求的一种潜在方式。 数字个人助理。很多公司一直在使用复杂的算法,机器学习和大数据软件构建推荐引擎,这些推荐引擎的背后是对客户数据以及历史行为的全面分析。这些推荐引擎正在用于影响购买行为,但大部分相同的技术是用于构建数字个人助理,或者能够基于语音命令完成或自动化简单任务的机器人。 通过融合推荐引擎的复杂预测和推断能力,同时结合语音识别软件,很多公司推出了自己的数字个人助理产品,例如苹果的Siri,亚马逊的Alexa,谷歌的Google Assistant,微软的Cortana。利用机器学习和云端基础设施,这些应
46、用程序在收集更多的用户信息的同时不断改进,这些用户信息包括:语音模式,兴趣,人口统计,消费习惯,日程,职业,喜欢和不喜欢。大多数(如果不是全部)这些信息通常可以通过软件监控一个人的智能手机或连接设备(Amazon Echo,Google Home)来收集。随着这些数字个人助理接触到更多的数据,通过深入分析它们能够区分来自不同用户的类似请求,从而越来越个性化。例如,语音指令“给我看最好的相机”对不同的消费者可能意味着不同的东西。与用户数据相结合的强大分析引擎可以帮助确定用户是否喜欢最便宜的摄像机,最高评价的摄像机,或者通过各种特征组合19 筛选出来的对于该用户“最佳”的摄像机。 我们看到数据聚合
47、和分析持续推动了人工智能驱动的数字个人助理的改进。我们也期待像亚马逊,谷歌这样的持续创新者能够继续完善在购物过程中的使用体验(Echo,Echo Dot),从而更加深入到日常生活中的各种任务当中(Google Home)。 人工智能生态 人工智能的关键参与者 运动控制与机器人 人工神经网络及其基础设备 环境传感器(湿度、温度等) Anki、Universal Robotics、Kiva System、Influx、Motion AI、iRobot、Intuition Robotics、DroneDeploy、Imagimob、FocusMotion Alphabet 、 Amazon 、Mic
48、rosoft、Intel、BigML、Vicarious Systems 、Sentenai、Skymind、IBM Sentrian 、 Building Robotics、Moov 语音识别和复制 音频传感及声音处理 Mobvoi、nVoq、AI Speech、PullString、Convirza Deepgram、Augury Systems、NeuronSW、Audio Analytic 地理空间感知 系统检测及资源分配 Civil Maps、Drive Time Metrics、CognitiveScale Sentient Technologies 光学传感器/图像处理 训练及推
49、理 AuCure、Butterfly Network、Event 38 Unmanned Systems、Cortica 、 Bay Labs 、Descartes Labs、Orbital Insight、Abeja、ViSenze、AGERpoint 、 Movidius 、Affectiva、Clarifai Nvidia、Intel、Samsung、Taiwan Semi 、GlobalFoundries、Google 自然语言处理 Inbenta Technologies 、Digital Reasoning Systems、DefinedCrowd 、 Semantic Machines 、 Sentisis Analytics 、 Health Fidelity 、 Parakweet 、Nuance 、 Clinithink 、Maluuba 、DigitalGenius-Artificial Inteligence、Cortical.io 人工智能生态:使用案例与潜在机会 农业:目标时长200亿美元 优化种子种植、施肥、灌溉、喷洒和收获 对水果和蔬菜进行分拣,以降低劳动成本 20 根据声音的变化识别牲畜是否生病 金融业(美国):每年节约和新增收入340-430亿美元 在财务数据冲