1、 北京捷通华声语音技术有限公司 地址:北京市海淀区中关村软件园 10 号楼 2 层 电话: 86-10-82826886 网址: http:/ 传真: 86-10-82825830 灵云智能客服系统 技术白皮书 灵云科技 源自清华 服务全球 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp. 2014 年 12 月 灵云智能客服系统 技术白皮书 目 录 第 1 章 公司介绍 . 1 第 2 章 灵云智能客服系统概述 . 2 第 3 章 系统总体框架 . 3 3.1 系统总体架构和工作流程 . 3 3.2 逻辑架构
2、和核心 算法 . 6 3.3 物理架构和系统部署 . 7 第 4 章 基本功能介绍 . 8 4.1 智能问答功能 . 8 4.2 后台管理功能 . 13 4.3 知识库管理功能 . 14 第 5 章 技术性能指标 . 15 第 6 章 系统优势特点 . 15 第 7 章 灵云平台简介 . 17 灵云智能客服系统技术白皮书 第 1 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 第 1章 公司介绍 北京捷通华声语音技术有限公司成立于 2000 年,是一家专注发展语音交互、图像识别、自然 语言理解等智能人机交互
3、(简称: HCI)技术的研究与应用,全面发展云计算与移动互联网服务的高新技术企业。 2001 年,捷通华声推出代表国内最高水平的中文语音合成技术,全面开启了中文语音合成技术在中国信息产业发展中的实用化进程,奠定了捷通华声在中国语音产业界的稳固地位。历经十几年的发展,捷通华声拥有自主知识产权的中文语音合成、语音识别、手写识别技术在语音交互、模式识别技术市场占有率达到 50%,并拥有 40 多项智能人机交互技术专利,成为国内第一家倡导发展并实现同时提供语音合成、语音识别、手写识别、光学字符识别、自 然语言理解等技术的全方位 HCI 技术提供商。 捷通华声十多年发展所取得的成就,引起业界的广泛关注,
4、 2011 年,捷通华声荣获“ 2010 中关村高成长企业 TOP100”称号,并被列为北京市重点支持高成长企业。为促进企业实现全面快速发展, 2011 年 10 月,首次引进来自于华软的战略投资, 2013 年,引进百度投资,为企业全面发展提供了技术、市场与资本相融合的强大推动力。 2011 年,伴随 HCI 技术的进步与云计算的高速发展,捷通华声推出了全球第一个全方位人机交互感知云 灵云( )。灵云将语音交互、图 像识别、语义理解、生物特征识别等 HCI 技术完美整合,实现并提供一体化的 HCI 技术解决方案与全方位服务,掀开了中国 HCI 技术发展与应用的新篇章,成为促进中国信息产业发展
5、的重要力量。 2013 年,为支持捷通华声灵云发展,引领清华大学 HCI 最新科技成果为产业服务,推动清华大学产学研一体化科研模式的创新发展,清华大学产业基金入资捷通华声,成为捷通华声第二大股东。在清华大学的支持下,捷通华声联合清华大学电子工程、计算机、自动化、信研院等院系共同创建清华灵云人工智能研究中心,专注于智能人机交互技术的研究与产业化应用, 全面支持基于灵云平台的智能客服、智能语音、智能图像的产业化进程,共同实现“灵云科技 源自清华 服务全球”的战略发展规划。 灵云智能客服系统技术白皮书 第 2 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice
6、Speech Technology Corp 未来发展,捷通华声公司将一如既往地坚持“聚焦 创新 执行 分享”企业核心价值观,“开发有价值的产品,培养有价值的人才,发展有价值的企业”的企业发展理念,努力实现“让人与机器的交流像人与人交流一样简单自然”的企业使命,力争发展成为我国服务内容最广、最有价值、最具竞争力的 HCI 技术云服务与方案提供商。 得益于扎实严谨的技术研究和产品开发战略、对 用户 负责的市场开拓思路,近年来主打的灵云产品系 列 在市场上表现良好,占有率不断扩大,以灵云智能客服系统 为例,目前已经在包括齐商银行、潍坊银行、长安银行等在内的十五家地方商业银行及太平洋保险集团、工银瑞
7、信、广发基金、兰州银行、金华银行、中信银行、包商银行、中国邮政储蓄银行、中国农业银行等项目中得到应用,并受到 用户 的良好评价。 第 2章 灵云智能客服 系统 概述 灵云智能客服系统 是一种能够使用自然语言与用户进行交流的人工智能信息系统。它应用捷通华声公司与清华大学联合开发的包括自然语言理解技术在内的多项智能人机交互技术,能够识别并理解用户以文字或语音形式提出的问题,通过语义 分析理解用户意图,并以人性化的方式与用户沟通,向用户提供信息咨询等相关服务。 本系统 适用于多种 用户 服务场景,提供 用户 服务咨询、业务查询办理、产品营销推广等功能,为用户带来全新的沟通体验。它可以代替人工客服完成
8、大量的重复性的日常工作,为用户 解答常见问题,大幅降低现有 用户 服务人员的劳动强度,削减企业人工成本。 灵云智能客服系统 可以无缝集成到企业的信息系统中,特别是与现有的人工客服座席系统融合,代替或辅助座席代表完成数据查询、订单处理、业务办理等操作,拓展及丰富企业的对外服务渠道,提供更快捷的 用户 服务响应能力。 系统可以 7 24 小时不间断地提供一对多应答服务,因机器服务和人工值守不同,该系统可以不受人的情绪、疲劳程度、工作环境等客观因素影响,能够保障服务质量及服务水平的一致性和可控性。 灵云智能客服系统技术白皮书 第 3 页 北京捷通华声语音技术有限公司 Beijing InfoQuic
9、k SinoVoice Speech Technology Corp 运用灵云智能客服系统 ,不但可以加载各种丰富的知识库内容(如信息咨询、业务办理等),成功实现与第三方知识管理平台的对接,能够主动拉取知识和获取推送知识,实现一点维护多点应用,能通过多种沟通渠道(网页、短信、微信、易信、 APP、 IM 等等)的接入,提升用户和智能平台之间交互的便利性。 可广泛应用于金融、电信、商业企业、教育、物流、交通旅游、 公用事业、政府等各个行业领域,引导 用户 更多地使用自助人机交互的方式满足需求,提升企业的 用户 服务质量和服务效率。 第 3章 系统总体框架 3.1 系统总体 架构 和工作流程 灵云
10、智能客户服务系统(以下简称灵云智能客服系统) 是建立在“灵云智能人机交互平台”上的一项智能应用。灵云平台是集成了语音识别、语音合成、手写识别、图像识别以及自然语言理解等多项智能人机交互技术的云计算框架(私有云)。该框架提供了多种引擎的灵活挂接和调用方式,智能客服系统因此可以向 用户 提供语音、文本、图像等多种交互方式的问答服务,如 用户 用语音方式提出问题,系统调 用语音识别引擎,将语音数据转化为文本信息,自然语言理解引擎处理该文本信息,在知识库中找出准确答案,然后通过语音合成引擎将文本信息转为语音信息返回给 用户 。灵云智能客服系统的设计理念是:系统由多个模块组成,没有刻意地分层,模块之间依
11、靠标准的协议实现松耦合,这样系统的部署、升级,与其它系统的互操作更加灵活便利。 系统的核心模块是自然语言理解引擎,采用了多项自然语言理解核心技术,提供对用户的提问和知识库文本从分词到语义分析的全部处理算法。 渠道接口 模块对接外部各种接入方式,支持文本、语音等交互方式。 渠道接口模块 有不同的具体实现,分别对应不同的接入方式。灵云智能客服系统 特别加强了对微信公众账号接口的支持,已经全面实现了文本、语音的输出输出功能。通过调用“灵云”平台的语音识别能力,完美实现了语音形式的微信智能客服机器人。 灵云智能客服系统技术白皮书 第 4 页 北京捷通华声语音技术有限公司 Beijing InfoQui
12、ck SinoVoice Speech Technology Corp 业务逻辑接口是与 用户 的业务系统进行互操作的模块,如完成实时查询和交易操作等。人工转接接口支持智能客服与人工座席系统之间的相互转接。 后台管理模块提供知识管理、参数管理、机器人管理、系统实时监控以及服务日志管理等运维功能。特别针对服务日志提供了三项数据挖掘功能,支持对用户提问数据的热点分析、新词发现和自动 聚类分析,这些功能能够发现和弥补知识库不完善之处,协助运营人员关注当前用户提问的热点。 外部渠道接口网页 微信 易信短信 QQ I V R业务系统对接营销系统业务系统用户认证内容应用支付系统人工客服后台管理平台知识管理
13、日志报表知识导入接口管理知识同步数据挖掘自然语言理解引擎分词模块句法分析语义推理场景理解搜索模块多轮对话语音识别 语音合成 手写识别O C R 分配层请求分发答案组装保存记录H C I 能力调用声纹识别图 1 系统 技术架构 本 系统支持与 微信、 APP、 短信 、在线客服等系统对接,并可根据业务 需求定制接口,完成其他系统集成对接工作。 系统和微信平台 对接后,用 户用文本方式提出问题,腾讯服务器转发文本信息,通过微信通用消息接口传给自然语言理解服务器。用户用语音方式问题,腾讯服务器保存用户语音信息。腾讯服务器通过微信通用消息接口,提供语音 ID 给语音识别接口,语音识别接口从腾讯服务器下
14、载 AMR 语音格式文件,语音获取并识别接口将文 件通过互联网传给灵云 ASR能力服务器, ASR 能力服务器将语音信息转化为文本信息返还给 语音获取并识别接口,最后将文本信息提供给自然语言理解服务器。当用 户用语音方式提出问题时,系统默认用语音方灵云智能客服系统技术白皮书 第 5 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 式回答用 户。自然语言理解服务器将文本答案提供给语音合成接口,语音合成接口将文本信息通过互联网发给灵云 TTS能力服务器, TTS能力服务器将文本信息转化为语音信息并返回,语音合成
15、接口将语音信息通过微 信客服高级接口返还给腾讯服务器,腾讯服务器存储并返还语音信息给用 户。 系统和短信平台对接后,用 户上行消息到短信平台,短信平台调用自 然语言理解引擎,自然语言理解引擎从 知识库中找到答案后,返回结果到短信平台,短信平台下行文本消息到用 户处。 系统和在线客服系统对接后,用 户通过 Web 渠道提出问题后 ,在线客服系统调用自然语言理解引擎,从知识库中找到答案后返回给用户。用户有较复杂问题需要询问时,用 户可随时转入人工客服模式,由值班座席在线服务。 转入人工客服模式的主要方式:用 户用文字提问“转人工”、“人工服务”、“转人工服务”时,或者点击“人工客服 ”按钮后,系统
16、将进入人工客服模式,同时也支持机器人多次无法理解用 户提问后被动切换到人工服务,人工客服结 束后,由座席人员再将该会话转为智能应答模式。 灵 云自然语 言理解 引擎灵 云语音识别引擎业务 知识库在线客 服接口多渠道 全媒体语音文本文本智能机器人 后台管理模块 业务系统第三方知识库平台文本统一 消息 管理模块文本灵 云图像识别引擎业务知识 / 业务办理灵 云语音合成引擎语音图像文本图 2 系统工作流程 灵云智能客服系统技术白皮书 第 6 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 3.2 逻辑架构和核心算
17、法 灵云 智能客服 系统基于 J2EE 技术开发,架构采用松耦合高内聚方式设计,采用标准的通讯协议,各模块之间采用接口方式调用,数据分表存储。架构设计符合 SOA 规范,包含均衡设计、分层隔离和组件隔离,有清晰的系统边界,支持大集中并发。 系统从逻辑上分为三层结构,第一层是对外服务接口层,提供捷通华声定义的 Web Service 协议接口和符合腾讯微信高级 API 定义的微信网关接口。中间层为消息代理层,负责分发转接协议报:将接口层发来 的请求转换协议后发给自然语言理解引擎同时建立会话;接收引擎的回复,能够准确回答的直接回复接口层;无法回答且满足 规则的转发给人工客服;需要从业务系统获取动态
18、数据的,调用 业务逻辑接口,生成最终回复给 用户 的答案内容。 系统的顶层设计采用了云计算架构,主要模块之间通过 Web Service 协议实现松耦合互操作,与其它系统(如第三方知识管理平台)集成方便。 系统的数据库逻辑设计采用了面向实体的设计理念,没有依赖任何特定的数据库产品的特性。 系统的各模块之间通过应用层标准的消息机制以松耦合的方式互操作,消息格式 由一个消息头和消息体组成,系统内任何两个模块之间的调用均遵守此协议。消息协议有较好的可扩展性和兼容性,可以开放给 用户 或平台开发、集成商,供二次开发或与其它系统集成。 系统完全采用自然语言理解技术处理 用户 的提问,通过对问题的词法、句
19、法和语义分析获取 用户 的意图。系统算法支持智能文本分词、句法分析、文本输入识别、 用户 信息识别、拼音识别、同义词识别、错别字识别、全简称识别、敏感词过滤、语境理解、对话场景识别、知识点语义匹配、上下文语义分析、场景完整度判断、相关问题推荐、关联问题联想、智能菜单导航、多维度答案渲染、多 轮对话,能够以主动反问、提供相关问题等方式澄清 用户 的模糊问题,能够对近似问题进行处理,对模糊询问进行判断,在 用户 条件背景缺失的情况下能够引导 用户 补充缺失信息,能够自动纠正同音字、错别字等。同时为了配合业务流程,还灵云智能客服系统技术白皮书 第 7 页 北京捷通华声语音技术有限公司 Beijing
20、 InfoQuick SinoVoice Speech Technology Corp 支持基于上下文场景的多轮对话、按照知识图谱推导答案、按照话术进行多个关键词组成的模板的匹配。 3.3 物理架构和系统部署 灵云智能客服系统基于标准化、层次化、模块化的理念构造,模块相对独立,通过标准的开放接口实现互联,为保证信息系统的安全,将渠道接口服务器部署在 DMZ 区,在内网防火墙后部署其它服务器,智能 客服系统的网络部署拓扑图和硬件配置见以下说明。 W e b 、微信、短信接口服务器在线客服系统接口服务器后台管理模块数据库服务器自然语言理解引擎(负载均衡)外网防火墙 内网 防火墙图 3 智能客服系统
21、的物理架构 其中: 对外接口服务器: 对不同接入协议的转换。 数据库服务器: 负责存储知识库等数据信息。 自然语言理解引擎服务器: 系统自带负载均衡模块,可以通过负载均衡的方式处理大并发请求,单一引擎实例支持 200 线 /秒并发,建议采用负载均衡方式部署至少两台服务器,满足 400 线 /秒并发要求,并发量增长时引擎服务器可随时进行横向或纵向扩展。 灵云智能客服系统技术白皮书 第 8 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 后台管理服务器: 实现知识管理、系统监控以及数据挖掘。 推荐配置: 根据系
22、统模块的设计要求,使用的软硬件 设备推荐配置如下: 序号 硬件 名称 数量 部署模块 建议配置 备注 1 自然语言理解 服务器 2 台 (负载均衡) 灵云自然语言理解引擎 CPU: 8core 硬盘空间 500GB 可用内存 16GB 操作系统 :RHEL/SUSE 核心引擎处理服务器,需考虑并发量根据实际业务量采购 2 后台管理 服务器 2 台 后台管理模块 WebLogic/ WebSphere CPU: 4core 硬盘空间 156GB 可用内存 8GB 操作系统 : RHEL/SUSE 主备方式 部署 3 数据库服务器 1 台 Oracle/DB2/ Sybase CPU: 8core
23、 硬盘空间 500GB 可用内存 64GB 操作系统 : RHEL/SUSE 甲方提供 4 对外接口 服务器 1 台 IHS/ Apache Web Server 微信网关 WebService 接口 CPU: 4core 硬盘空间 156GB 可用内存 8GB 操作系统: RHEL/SUSE 可与甲方其他 接口服务器 共用 第 4章 基本功能介绍 4.1 智能问答功能 用户 通过自然语言方式 提出业务咨询或查询类问题时,系统通过自然语言理解引擎进行语义分析,通 过词法分析、句法分析、语境理解等自然语言理解技术判断 用户 意图,与原有业务节点的知识进行 语义 相似度 和距离 计算,从知识库业务
24、体系中定位匹配节点,并根据接入渠道的不同回复不同的答案。包括文本,图片或富文本格式的网页,语音,结果匹配度输出、链接推送、营销信息推送、关联消息推送、常用问候语推送等。 灵云智能客服系统技术白皮书 第 9 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 支持智能文本分词、 文本输入识别、 用户 信息识别、拼音识别、全简称识别、敏感词识别、同义词理解、同音字错别字纠错、上下文语义分析、关联问题引导,模糊问题推荐、智能菜单导航等功能并可通过业务系统获得动态的业务知识。 1) 智能文本 分词 系统具有基于互联网海
25、量语料训练出的分词引擎,保证中文文本分词的高准确率,并且用户还可在管理后台自定义添加用户词典,针对特定术语优化分词效果,同时还支持 自学习功能,自动收集用户数据不断优化 。 2) 文本输入识别 系统支持 用户 输入包括文本或富文本格式的内容进行有效识别,包括英文大小写、全半角、中文数字 、繁体中文 等组合。 3) 用户 信息识别 系统支持对不同 用户 属性进行分组,不同属性用户输入相同问题时,系统进行 用户 信息识别后对不同分组用户提供针对性回复。例如 VIP 用户可以得到全面丰富的回复 内容 。 4) 拼音及全简称识别 系统能够对 用户 输入的拼音及全简称进行有效识别,并且可将简称直接映射到
26、相关业务内容,给出准确回复。 5) 同义词理解 系统自带通用同义词词典,并可自定义添加同义词库,针对 用户 相同同义词的不同问法给出同样的回复内容。 6)敏感词屏蔽 系统自带敏感词库,包括涉政、涉黄、粗口等词汇,并且支持用户自行补充。 用户 提问中包含敏感词汇时,系统可进行有效屏蔽并提供委婉答复。 灵云智能客服系统技术白皮书 第 10 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 7) 上下文语义分析 引擎采用的自然语言理解核心算法支持对概念实体的上下文继承和理解。 用户 的提问如果符合设定的场景,问答将
27、进入场景对话模式 ,系统对于符合场景条件但表述不完整的问题将提出反问,请求 用户 补全问题。在同一业务场景下,核心概念可以用指代或无指代省略;跨业务场景时,不同核心概念的同名属性也可以省略。上述上下文交互都支持在多轮对话中继承核心概念,直至跳出相关的业务场景。 8) 多轮对话场景理解 在预设置的业务场景下,系统支持 与 用户 进行多轮对话交互, 用户 可任意改变询问的次序,引擎根据提问中包含的信息点,通过反问请求 用户 在后续对话中补全信息,在多次交互及上下文继承后,形成 用户 提问的完整表示,最终提供符合要求的答案或输出业务系统调用指令。 9)自 动 智能纠错 自然语言理解引擎内置同音字和错
28、别字纠错算法,能够结合具体的业务知识库文本自动建立纠错模型,自动纠正提问中的错别字,无需人工干预。 10) 模糊问题引导 当 用户 提出简短的或较模糊的问题时,引擎将根据其中的核心概念推荐与 用户 问题相关的业务问题, 用户 可通过输入相关问题序号点选或在省略上下文的前提下补充提问。 11) 相关问题推荐 引擎支持在语义分析的过程中不但寻找符合提问内容的答案,同时还找出与提问接近的知识点,因此在回复答案的同时,还可能输出一至多条与提问密切相关的业务问题推荐给 用户 ,从而实现业务引导功 能。 12)动态指令回复 当 用户 进行业务查询时,如提出账户余额、账单等相关问题时,系统可通过回复动态交灵
29、云智能客服系统技术白皮书 第 11 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 易指令,调用业务逻辑接口,回复动态业务信息。 13) 关联营销推广 系统支持主动或被动营销信息推送功能,当 用户 提出业务问题时,系统可在回复的同时,根据提问的内容针对性地补充营销信息,进行业务推广。另外,系统也支持在答案中插入营销代码,每次回复答案时直接附加营销内容。营销活动信息在后台可由市场人员直接维护。 14) 多维度多渠道应答 系统在智能应答时支持多渠道多维度 用户 请求,根据请求的相关属性,调用不同的知识库, 用户
30、 来自不同渠道 、不同地区 的相同问题可针对性回复不同内容,实现差异化应答。 15)智能菜单导航 系统支持用户自定义推荐问题,用户可以将 用户 常问的高频问题设置推荐菜单,给与智能业务导航。 16)逐键联想 当 用户 输入关键词时,系统可通过关键词匹配技术动态推荐常问业务知识,供 用户 直接选择。 17)转人工坐席 用户 提出“人工服务”、“我要投诉”、“ kf”等转人工服务要求或系统自动判断无法理解用户 提问时,通过接口协议转至人工客服系统处理,并将历史会话记录传送给坐席代表。 18)防攻击骚扰 系统对发问频率过于频繁的提问 进行屏蔽,对过于频繁的转人工请求进行屏蔽。引擎自带停用词库,并支持
31、用户自定义添加,当 用户 多次提问无实际意义的词语时,系统自动屏蔽提问信息,防止恶意攻击, 并可自动推荐业务常见问题,引导用户进行业务咨询。 19) 记录客服交互全过程 灵云智能客服系统技术白皮书 第 12 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 系统记录所有 用户 与系统对话的信息,并重点标记智能客服 系统无法回答的问题。在知识管理中利用客服记录进行自主的知识学习,如知识库中没有类似知识时,可提醒知识运维人员弥补知识库的不足。 20)自学习功能 系统具有学习功能,可以在无法应答的对话记录中挖掘热点
32、问题,这是一种无监督的机器学习,主 要采用自动文本聚类算法,无需事先标定,因此还可以对 用 户的舆情趋势进行监控。对提炼出的未解决问题进行 人工简单标注后,引擎采用有监督的机器学习算法,能够自动完善对用户 提问的理解,使得后续类似的提问得到正确的应答。 21)满意度 评价和 调查 问卷 系统支持满意度评价和调查问卷功能,每次用户提问后,可让用 户进行满意度判断或填写调查问卷,记录数据到系统后台,方便运维人员统计。 22)自动留言功能 系统支持用户留言功能,当用户需要人工服务,而人工服务不在工作时间时,系统可弹出留言板供用户填写。 23) 多媒体形式回复 系统针 对不同渠道的特点可以定制回复内容
33、的录入格式,回复的内容包括文本、语音、图片、图文、微网页、指令等格式的答案。提供 HTML5 静态网页编辑功能,并支持在答案中嵌入 Url 以展示静态网页。支持富文本格式内容的回复,并可自定义开关。 24)拟人化聊天 系统自带数万条聊天库,包括表情聊天、笑话推荐、天气查询等日常聊天内容,并支持用户自行维护。如 用户 问及与行业知识无关的内容,系统用聊天方式与 用户 对话,并在多次聊天后提供主动的业务介绍。 灵云智能客服系统技术白皮书 第 13 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 4.2 后台管理
34、功能 1)用户及权限管理 系统的管理平台支持全面的用户权限管理,管理员可对系 统用户进行增加、删除、修改、查询等操作。用户属性包括姓名、工号、部门、手机号码等,能够对用户的分组、角色、权限等进行管理。按照组别的不同,对后台功能的操作权限进行不同的限定,对知识库领域进行划分和组 间隔离。系统对用户进行三级管理:组、用户、角色。系统支持采用 统一的身份认证体系,调用统一接口实现登录验证。 分组:实现用户之间的隔离;其中 admin 所在组为管理组,管理组有特殊的权限,能够看到所有的在自己角色允许范围内的数据; 用户:系统的直接操作者,在所分配的角色内,进行知识维护等具体工作; 角色:角色是对操 作
35、权限的组合,可根据具体需求,对操作权限进行适当的组合,构成角色。 2) 多 机器人管理 灵云智能客服系统支持多维度、多渠道的知识体系,针对不同的用户分组和接入方式提供个性化的回复内容,后台管理员可以灵活地将业务知识库与不同的机器人引擎实例和渠道挂接,做到同一知识库既可以在机器人之间隔离也可以共享。同样,各种词库级的知识(如用户词典、同义词典、敏感词库等)也支持动态的挂接。 系统的单一引擎实例支持多个逻辑上的机器人并行工作,在管理后台,可以对每个机器人分别设置个性化参数,挂接不同知识库内容。不同的机器人执行完全 不同的应答功能。知识库按领域管理,即可复用又可互相隔离,如通用知识库可同时挂接到多个
36、机器人下,这些机器人又可再挂接各自的专用知识库。 3)统计分析报表 后台管理平台提供任意时间段内的访问会话数和提问数统计、问题分布统计和 用户 满意度调查统计,提供实时系统运行状态监控,动态显示每个机器人的状态和流量。功能点包括:知识管理报表、应答率报表、实时访问量、热点问题、 用户 资源等报表,以及对任意 用户 的灵云智能客服系统技术白皮书 第 14 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 消息查询和未解决问题处理报表。 4.3 知识库管理功能 1) 知识 管理 知识的维护编辑在知识管理系统进行,
37、审核完毕后通过发布接口将 各个渠道的知识内容同步给系统引擎。语义理解和应答由系统自身的接口提供对外服务。 知识库管理的具体功能点包括:领域管理、类别管理、维度管理、渠道管理、通用词库管理、专业词库管理、敏感词库管理、知识库管理、句式管理、情景管理、聊天库管理、业务知识管理、营销代码管理、机器人转人工问题管理、知识审核、知识精度配置、机器人测试、知识搜索等。 系统的后台管理支持与第三方知识管理平台的对接,能够与深蓝海域等 KM 系统进行知识点一级的对接,既可以拉取也可以接受新知识版本的推送,实现了知识库内容的一点维护和多渠道的发布的统一。 系统的后台管理平台同时提供自有的知识库维护功能,知识库管
38、理员通过可视化界面进行领域设置,知识类别、知识条目、用户词典的管理,修改各渠道的不同回答内容等。知识库(知识点加各种词表)经过审核后可以“同步”到智能应答系统使知识生效。 2) 数据 分析 挖掘 系统支持对任意时间段内 用户 提问记录的自动聚类分析。知识库管理员根据分析报告,可发现现有知识库的覆盖不足之处,从而有针对性地补充、修订知识点。 引入智能客服系统后,坐席代表减少了与 用户 的直接接触。 运维人员仅通过服务日志很难全面了解客服知识库的覆盖面,是否有盲点, 用户 实际使用情况,以及对客服系统体验满意度和相对集中的反馈意见。灵云智能客服对 用户 的使用行为进行数据挖掘分析,特别对所提问题和
39、反馈意见进行文本挖掘。 灵云智能客服系统技术白皮书 第 15 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 通过文本信息的挖掘,能够发现当前的热点问题及其来源地区和时间段,起到舆情监控作用,为市场营销策略的调整提供支持。 第 5章 技术性能指标 序号 内容 参数 备注 1 系统平均响应时间 99.98% 系统自带主备切换和负载均衡机制,各模块均采用冗余部署,配合 HA 解决方案和类似于 F5 的负载均衡,可有效避免单点故障。智能应答系统平台支持 7 24 小时无故障运行服务,其可用性不低于 99.98%。
40、 4 平均无故障间隔时间 300 天 系统经过 300 小时压力测试, 并且多个实际项目无故障应用时间超过 1 年, 保持稳定性。 第 6章 系统 优势特点 1)融合多种智能人机交互技术 捷通华声推出的灵云智能人机交互云计算平台,除自然语言理解技术外还包括语音识别、语音合成、手写识别和图像识别等多项完全由本公司自主研发 的 HCI 技术,这些智能人机交互技术通过统一计算框架集成于一个解决方案,实现 对文字、语音、图像不同媒体信息的智能理解,用多种交互方式服务于用 户。 捷通华声多年来始终致力于智能人机交互技术的研究和应用,在自然语言理解、智能问答以及语音交互领域拥有多项核心技术的自主知识产权和
41、相关专利。灵云智能客服系统通过多种方式得到了知识产权方面的保护。同时,公司也是信产部语音产业联盟智能客服组的组长单位,其技术实力已经得到业界的充分肯定。 灵云智能客服系统技术白皮书 第 16 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 2)智能语义理解 灵云智能客服系统的核心引擎采用的是基于统计的自然语言理解技术,利用来自 于互联网的大数据训练的概率性的句法和语义分析模 型,分析处理的对象就是自然语言文本本身,如知识的问题和答案以及用 户提问的文字,在知识点覆盖完整的前提下,不需要对标准问题进行复杂的加
42、工就能在应答效果上达到较高的准确率。 3)精准的数据挖掘 灵云智能客服系统对用 户的使用行为进行数据挖掘分析,特别对所提问题和反馈意见进行文本挖掘。能够发现当前的热点问题及其来源地区和时间段,起到舆情监控作用,为市场营销策略的调整提供支持。 4)与第三方知识管理平台对接 系统的后台管理支持与第三方知识管理平台的对接,能够与深蓝海域等 KM 系统进行知识点一级的对接,既可以拉取也可以接受新知识版本的推送,共享知识体系,实现了知识库内容的单点维护和多渠道知识统一发布。统一知识管 理平台解决方案已经在太平洋保险和浙江智慧高速等实际项目中得到了用 户的肯定。 5)多机器人并行管理 智能客服系统可以对多
43、个机器人多个账号同时管理,即集中部署一套,各个业务部门,各个微信账号可分别建立各自的“机器人”,并在后台对每个机器人提供独立的参数设置和流程管理功能。知识库可以与机器人灵活挂接,既可以知识隔离也可以融合,实现了不同机器人的差异化应答。 6)对外开放的标准协 议接口 智能客服语义分析引擎提供标准的二次开发接口,包括 Web Service, JSON, restful, Socket, XMPP 等多种协议的支持,在管理平台提供接口和渠道的统一设置和管理。 7)系统安全稳定 灵云智能客服系统技术白皮书 第 17 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoi
44、ce Speech Technology Corp 灵云智能客服系统采用安全稳定的私有云系统结构,内置多引擎负载均衡机制,做到系统数据实时同步热备。捷通华声在文本数据和语音数据处理技术方面具有核心自主知识产权,因 此在私有云布局下,不需要采用第三方产品,从而可以达到所有数据 本地化,保证系统数据安全。 8)丰富的行业经验 灵云智能客服系统已经在银行、 保险、基金、电子政务、公用事业等多个领域得到了应用,逐渐积累了充足的通用知识库,尤其是在金融业的具体应用过程中积累了大量的金融行业知 识库、专业同义词库、敏感词库、通用聊天库,并形成了较为成熟的金融行业 业务知识框架体系,同时锻炼出 一支业务熟练
45、的实施和知识加工团队、项目工作规范和流程。对于新的用 户的业务要求,能够快速形成系统解决方案,保证项目的高质量和高可靠。 第 7章 灵云平台简介 捷通华声拥有的灵云智能人机交互平台是一套基于云计算和分布式存储技术,将 NLU 、ASR、 TTS、 HWR、 OCR 等 HCI 技术全面整合的综 合智能云服务系统平台。通过移动互联网、互联网,用户使用任何设备,在任何时间、任何地点,随时随地享受灵云提供的全方位智能人机交互服务。 灵云由众多的服务器通过集群组成,使用了负载均衡、分布式计算、分布式存储、 HCI技术等前沿技术,具有灵活的架构和可靠的稳定性。 灵云的架构如下: 灵云智能客服系统技术白皮
46、书 第 18 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 图 4 灵云平台架构 捷通华声依托灵云平台,广泛并深入发展 HCI 人机智能交互技术,目前平台已对接很多智能人机交互技术, HCI 技术的核心部分均来自自然语言理解引擎 : 1)灵云语音合成( TTS)技术 捷通华声是国内最早从事中文语音合成 研究与应用的企业,灵云语音合成技术在国内处于绝对领先地位,市场占有率达 50%以上。 灵云语音合成效果自然、流畅、清晰, MOS 值达 4.6 以上; 支持中文普通话、粤语、维语、英文、日文、德文、法文等多
47、语种; 满足多种音色的应用需求; 支持平台级和嵌入式语音合成。 2)灵云语音识别( ASR)技术 捷通华声凭借在语音产业扎实的技术积淀,灵云语音识别技术已经达到国内一流水准,识别率达 90%以上。 灵云智能客服系统技术白皮书 第 19 页 北京捷通华声语音技术有限公司 Beijing InfoQuick SinoVoice Speech Technology Corp 识别率高:连续语音识别率可以达到 90%; 识别速度快;采用实时识别方式,实现语音数据的传输和识别的同步,实时率可达0.5 以 下。 可定制;定制模型的识别率可达到 94%以上; 支持语法识别 /词表识别和自由说识别; 支持云端
48、识别和本地端识别。 3)灵云手写识别( HWR)技术 捷通华声作为国内最早提供手写识别技术与产品的公司,灵云手写识别技术处于国内绝对领先地位,市场占有率接近 50%。 支持行写 /叠写,全句识别,识别率高达 99%; 单字识别支持 92 种语言,行 /叠写支持中、日、韩、英等多国语言; 中文支持 GBK 字库、香港增补字符集 ; 支持混合输入中文、字母、数字。 4)灵云光学字符识别( OCR)技术 捷通华声具有深厚的图像识别研究基础, 灵云 OCR 技术水平在国内处于领先地位。支持文档识别,票据识别,证照识别,条码识别,车牌识别等多种应用领域。 支持中文简繁体、纯英文识别,识别率达到 99%以上; 支持多语种,多字体,多字号识别; 支