百度云与人工智能(百度云首席架构师张发恩).pdf-道客多多

资源描述

1、百度云人工智能首席架构师张发恩百度云与人工智能 2014 2011 大规模DNN最大支持千亿样本/特征 2010 2003 2008 Hadoop 分布式计算系统上线 2009 分布式网页库 Bailing 上线，存储网页规模超过 1000 亿大规模机器学习平台支持凤巢广告CTR 预估上线实时计算系统支持毫秒级时延，准实时计算系统严格不丢不重 2012 新一代分布式计算系统，单集群规模达 10000 2013 业内最大自研万兆交换机全球首个ARM构架服务器规模化应用深度学习实验室成立 2016 百度云计算战略发布会 2015 百度开放云正式对外开放分布

2、式搜索系统历史 2015 ，我们在FDDB检测数据集和LFW 识别数据集上均获得世界第一凭借15.89% 的高研发强度，百度在2016 中企500 强的评选中成为中国研发强度最高的企业 2016 年，麻省理工科技评论评选的“全球最聪明的50 家公司” 百度名列第二 2016 年11 月，世界互联网领先科技成果15项，百度入围百度概况与人工智能布局北京研发中心上海研发中心深圳研发中心日本研发中心新加坡研发中心北京深度学习实验室北京大数据实验室美国研发中心硅谷 AI实验室 43,700 员工人数中国十佳雇主全球

3、最大中文搜索引擎全球最大中文网站 8 0 %90.3% 无线渗透率云计算人工智能大数据 IaaS PaaS 百度机器学习BML 百度深度学习BDL 人工智能API 数据采集标注 ABC 三位一体大数据平台深度学习平台数据采集和标注异构计算知识图谱硬盘快递日志分析关系数据库 RDS 键值数据库 Redis 对象存储 BOS 数据仓库 Palo 机器学习 BML 大数据平台BMR （Hadoop ） MapReduce Spark Zeppelin HBase Hive Hue 物联网服务IoT 日志服务BLS 批量计算 Batch 百度 BigSQ L 百度 El

4、asti c searc h 深度学习 Paddle Paddle TensorFl ow 数据可视化百度Kafka 数据接入数据存储数据分析专项方案行业方案直接上传数据仓储推荐系统舆情分析数字营销生命科学电商零售游戏金融教育娱乐百度云大数据平台数据收集标注大数据平台深度学习平台数据采集和标注异构计算知识图谱 XPU & FPGA 新一代AI 处理架构* - 专用计算单元 - 数百个处理器 - GPU 的通用性基于FPGA 加速的端方案 - 灵活 - 低功耗 GPU BOX 业内首个PCIe Fabric 互联架构全球先进的CPU 和GPU

5、物理解耦架构，国内第一家硬件实现 GPU资源池化按需调度单机实验室最大可支持8- 64 个GPU ，以支持更大的深度学习模型训练业内首个机柜一体化AI 计算机 PCIe Network 100Gb RDMA Network CPU 计算节点-1 GPUBOX-1 CPU 计算节点-n GPUBOX-n PCIe核心交换机 GPUBOX 深度学习一体机机柜配置基于天蝎整机柜架构 2100mm ，42U 高度模块化散热和供电集中管理单机柜2个计算节点 + 1 个GPUBOX 风扇电源与国际AI巨头对比对比项 GPU-BOX Facebook Big Sur Face

6、book Big Basin Microsoft HGX-1 单机箱支持GPU 最大数量 16 8 8 8 CPU 和GPU 配比任意最大1:64 1:8 1:2/4/8/16 1:2/4/8/16 硬件解耦资源池化 GPU 密度 4U16 卡 4U8 卡 4U8 卡 4U8 卡功耗密度 4U 5KW 4U 2.5KW 4U 2.5KW 4U 2.5KW 上线时间 16 年5 月 16 年3 月 17 年3 月 17 年3 月注：Google和亚马逊的GPU 服务器单机最大支持8 个GPU 大数据平台深度学习平台数据采集和标注异构计算知识图谱深度学习框架PaddlePa

7、ddle PArallel Distributed Deep LEarning 特点并行分布式深度学习平台，支持多机多卡并行、数据并行、模型并行。支持CPU/GPU/FPGA 支持序列模型支持大规模稀疏训练支撑了业务系统的有效应用实时高并发系统、稳定性要求极高，毫秒级实时预测特征规模超大（千亿）、数据规模超大（日数十亿迭代处理）深度学习数据流场景深度学习模型预测深度学习模型训练分布式文件系统 BOS/HDFS 模型存储百度数据采集和标注服务分布式文件系统 BOS/HDFS 数据存储在线服务在线服务日志收集百度深度学习平台 G

8、PU GPU GPU 百度深度学习一体化平台( 计算/存储资源池) CPU CPU CPU 分布式文件系统HDFS 百度深度学习框架与调度监控软件深度学习- 训练任务提交深度学习- 预测任务常驻通用深度学习模型人脸识别语音识别 NLP OCR 智能客服营销风控结合百度多年数据经验积累及模型技术沉淀，百度对于如下场景提供标准算法模型套件输出通用深度学习模型 CPU GPU GPU GPU 支持 PaddlePaddle 、 Tensorflow 、 MXNet 、Caffe 等深度学习框架支持多用户共享一个集群支持训练作业管理支持模型版本管理、

9、发布、预测服务支持安装百度大脑的各种预训练模型支持快速建立开发环境最先进的 GPU 加速器 ABC 一体机端到端软硬件经过调优完美兼容性部署简单轻松部署开箱即用扩展性强平滑扩容快速扩展高安全性私有部署安全无忧 64 单服务器最高支持GPU 卡数 5000 单集群并发调度GPU 卡数 1000 单集群并发调度服务器数 10000 单机群用户数 100000 单集群并发调度作业数 ABC 一体机指标一个案例：钢板质量缺陷检测生产环境采集钢板照片 ABC一体机部署的检测模型钢板质量分类结果 conv1 pool1 conv2_x conv3_x co

10、nv4_x conv5_x SSD Layers Original Prediction layer 5X5 convolution 2X2 subsampling 5X5 convolution 2X2 subsampling Feature extraction classification C 1 Feature maps S 1Feature maps C n Feature maps S n Feature maps n 1 n 2 output 0 1 2 4 3 钢板质量检测模型图像处理的更多案例大数据平台深度学习平台数据采集和标注异构计算知识图谱数据采集和标注数

11、据样本机器学习的核心迭代 model 待评 model P 迭代样本 F 评测数据集合 F 上线 P 初始 model 训练 model 训练迭代训练验证评测验证数据集合样本数据有数据就有可能，没有数据一定不可能雏形上路模型训练线上抓取：8000 万条 url/ 天线下采集：1 万人，分布全国 300 个城市采集类型：网页、照片、语音、视频、 POI 标注能力：通过培训的标注专员 5000 人，专职审核人员 200 人质量保证：机器审核 + 人工抽审标注类型：文本、网页、图片（ 2D | 3D ）、语音、视频、地图数据采集数据标注大数据平台

12、深度学习平台数据采集和标注异构计算知识图谱什么是知识图谱世界是由事物组成的，而不是字符串知识图谱用来刻画事物以及事物之间的关系知识图谱可以把所有不同种类的信息（Heterogeneous Information ）连接在一起而得到的一个关系网络。知识图谱提供了从“关系 ”的角度去分析问题的能力知识图谱可以帮助AI 更好的理解世界知识图谱技术架构 4 项发明专利：一种结构化网页正文的装置和方法一种新型问答知识库构建技术一种基于问题意图的答案摘要技术文本核心词识别知识图谱的一个案例智能多轮对话IVR 客服助手用户客服智能

13、推荐语音多轮对话语音评价收集智能话务分流实时话术提示来电原因分类来电诉求提示推荐问题归类用户画像业务模型行为模型用户行为预测多轮对话机器人语义理解语音交互后台知识库自主学习智能检索自然语言处理语音技术深度学习用户画像大数据百度AI 基础技术精准预判客户诉求明确诉求快速应答天津联通智能客服，是百度为天津联通量身定做的一套含智能语音IVR 及客服助手的AI产品，旨在帮助联通客服人员话务分流、降本增效。其底层用的知识库利用知识图谱构建技术，实现了自动抽取增量知识、智能检索及自主学习等功能。目前在小流量期间：知识库解答问题占比16% ；回复准确率86% ，高于人工客服回答准确率1 个百分点。基于知识库在这一项目中的良好效果，联通总公司后续将和百度就统一智能知识库项目继续深度合作。 Thanks 百度云人工智能首席架构师张发恩百度云与人工智能

展开阅读全文