收藏 分享(赏)

科大讯飞语音云发布会PPT.ppt

上传人:精品资料 文档编号:11134906 上传时间:2020-02-09 格式:PPT 页数:42 大小:19.08MB
下载 相关 举报
科大讯飞语音云发布会PPT.ppt_第1页
第1页 / 共42页
科大讯飞语音云发布会PPT.ppt_第2页
第2页 / 共42页
科大讯飞语音云发布会PPT.ppt_第3页
第3页 / 共42页
科大讯飞语音云发布会PPT.ppt_第4页
第4页 / 共42页
科大讯飞语音云发布会PPT.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

1、,内容提要,扑面而来的“语时代”,语音是人类最自然便捷的沟通方式,所有信息设备“能听会说”是必然的趋势。,扑面而来的“语时代”,语音应用爆发需要的条件已经逐步成熟 关键技术持续进步,达到实用门槛,扑面而来的“语时代”,语音应用爆发需要的条件已经逐步成熟 关键技术持续进步,达到实用门槛 智能终端、 无线网络、云计算平台等环境条件基本完备,2011年10月苹果公司发布iPhone4S,Siri成为最大卖点,语音交互的终端和应用不断涌现,语音交互的终端和应用不断涌现,谷歌计划今年上半年发布平板电脑Google Nexus, 并将搭载Majel网络语音识别技术,微软称:新版Tellme将实现人机语音交

2、互, 用于Windows 8及下一代Windows Phone系统中,语音交互的终端和应用不断涌现,2010年10月28日,科大讯飞在业界率先发布“讯飞语音云”,为手机、汽车、智能家电等终端提供高质量语音合成、语音搜索、语音听写等智能语音交互服务能力。,讯飞语音云发布,语音云应用日益丰富,语音输入,微博,短信,搜索,虚拟形象,娱乐,日程管理,生活服务,阅读,地图导航,基于语音云平台的开发伙伴已达3100家!,语音云用户规模加速增长,100万,1000万,3300万,3300万,700万次,语音云用户,每日请求,2012年1-3月,2011年7-12月,2011年1-6月,共同开启“语时代”的时

3、机已经成熟,内容提要,1、语音合成技术进展,在中英文取得国际领先水平的基础上,多语种合成正在逐步实现世界语言覆盖 基于发音模拟技术,就可以实现虚拟主持人和针对任意人员的个性化合成服务,中英文语音合成技术均是业界自然度唯一超过真人发音水平(4.0分)的系统;连续 6 年荣获国际最权威的英文合成大赛 Blizzard Challenge 冠军。,全球领先的中英文合成系统,全球领先的中英文合成系统,自然语音,科大讯飞,唯一自然度大于4分的系统,其他参赛单位 美国 Microsoft、IBM、MIT、CMU 英国 Edinburgh 日本 NITech、ATR 等,Blizzard Challenge

4、 2011 国际英文合成大赛比赛结果,合成样例 英 中,热烈欢迎各位来宾出席今天的发布会, 感谢大家长期以来对科大讯飞的关心和支持, 祝大家身体健康、工作顺利!,He refused to identify governments he suspected, but German press reports said investigations were focusing on North Korea and Pakistan,覆盖全面的多语种合成系统,多语种合成逐步实现世界语言覆盖,法、俄、西、日、韩等语种合成,正在研发德、意、葡、阿拉伯、印地等语种合成,中文合成,英文合成,欢迎参加科大讯

5、飞召开的 新一代语音云发布暨语音开发者大会!,全自动构建的个性化合成系统,基于发音模拟、声纹识别、语音文本转写及韵律自动标注技术,实现全自动构建的个性化语音合成系统,全自动构建的个性化合成系统,基于发音模拟、声纹识别、语音文本转写及韵律自动标注技术,实现全自动构建的个性化语音合成系统,丰富多彩的歌唱合成,基于声学模型自动构建、韵律自动预测和调性匹配的技术, 实现可自编词曲的唱歌语音合成系统,2、语音识别技术进展,在语音云规模运营的基础上,核心效果持续进化,通用识别准确性大幅提升 多项核心技术取得突破,有效解决抗噪、口音适应、个性化词汇等技术难题,语音识别通用准确性大幅提升,面向移动互联应用环境

6、的中文连续语音识别技术性能(识别准确率),备注:该结果根据工信部软件促进中心语音识别测试标准测试得出,语音识别三大技术创新,首次提出PLA、JFA、IVN综合噪声补偿算法,系统抗噪性能达到国际领先水平 率先实现MSDT声学模型训练算法,大幅增强系统口音适应性能 独创LSA语言模型自学习算法,个性化词汇识别准确度首次达到实用,噪声环境识别性能提升30.4%,口音适应性能相对提升50.3%,个性化词汇识别性能提升36.3%,语音识别技术的应用效果,语音识别技术的应用效果,NIST说话人识别评测名列前茅,参赛单位有:CMU、MIT、Stanford、清华大学、中科院自动化所、中科院声学所、Motor

7、ola研究中心、IBM 研究院等国内外50家著名语音研究机构,由NIST(美国国家标准技术研究院)举办,是国际上规模与影响力最大的说话人识别评测 1996年第一次评测,之后每两年评测一次,说话人识别任务难度接近大规模实际应用环境(不同信道、不同环境干扰) 科大讯飞在2008、2010年连续两届评测中均处于国际领先地位,NIST语种识别评测名列前茅,2009/2011年国际NIST语种识别最混淆方言对测试冠军,2011年语种识别测试中,在9个高混淆度方言对中获7个第一名,独家实用的口语评测技术,国家语委组织的机器和人工评分员对比鉴定结果,已累计完成国家普通话等级考试500万人测试 在全国各省50

8、00万中小学生的课堂教学中使用,科大讯飞口语评测技术唯一通过国家语委鉴定达到实用水平,高精准度的音乐评测技术,在语音识别技术体系的基础上,研发出业界唯一可精确反应音准、节奏和歌词演唱准确度的音乐评测技术,率先完成业界首个提供在线音乐评测服务的“爱吼网”系统,爱吼网独家承办 第十届中国少年儿童卡拉OK电视大赛网络赛区,3、语义理解技术进展,基于识别合成的语言处理算法,研发出完善的人机交互语义词典和语义理解算法体系 面向移动互联语音应用,率先完成首个达到实用、覆盖衣食住行的中文语义理解系统,完善的语义理解算法体系,首次提出ISF中文语义框架,具备灵活高效的多业务扩展能力实现集词法分析、文法理解、意

9、图分类及句子语义度量的一体化语义理解算法体系,请问有没有下周一晚上从合肥到北京的航班,实用全面的语义系统和云进化能力,面向移动互联语音应用,率先完成首个达到实用、覆盖衣食住行等应用领域的中文语义理解系统,平均性能 85%,基于语音云平台,形成了持续的语义理解进化能力,语义理解技术的应用成果,讯飞语义理解技术已经在各大运营商的短信营业厅智能化服务中广泛应用,短信营业厅,网上营业厅,掌上营业厅,自然语言理解,智能语音技术,传统电子渠道,智能交互系统,示例 KT 6021 QX 6022,示例 给我个早晚都能看的报纸吧。 有每天能看新闻的业务吗? 我要订个新闻早晚报。 ,语义理解技术的应用成果,科大

10、讯飞承建的安徽移动短信营业厅智能服务系统,在2011年中国移动总部电子渠道专项评测中,各项指标排名第一,成为移动下文各省学习的样板。,语音产业国家队,2011年再次荣获中文语音产业最高荣誉,国家科技进步奖,信息产业重大技术发明奖,语音产业国家队,语音产业国家队,2011年9月27日,语音及语言信息处理国家工程实验室揭牌,新一代语音云平台特性,1、更全面的操作系统和硬件支持,开发者网站:http:/,2、跨终端的个性化平台,手机,PC,电视,Pad,语音 通行证,个性化 语音引擎,数据 优化,云存储,账号管理,通过语音通行证实现用户个人输入习惯(常用词、说法)不同终端共享,保持体验一致 通过个性

11、化训练生成个性化音库,跨终端的语音空间,通知王珩吃饭地点改为京临饭店,3、更加可靠和高效的服务,面向亿级用户、高度可用的语音云平台持续提高的可用性,整体服务可用性已达95% 持续优化的响应速度,2G信道平均响应时间2秒以内,3G信道1秒以内 持续完善的“云+端”方案,保证语音云在恶劣网络环境下的可用性 持续扩容的语音云服务中心,已支持过亿的活跃用户,10000W,95%,1.5s,整体服务可用性,系统平均响应时间,活跃用户容量,4、完善的开发和运营支撑,1,最新最好的语音体验,2,全程一对一的技术服务,3,自动化运维体系,为每个应用开放全自动、全天候的运维体系; 应用服务和语音云的服务端对接,提供高度,4,业务分析平台,提供对每个语音应用的使用情况分析,帮助您快速改进语音应用效果。,平台开放最新最好的语音技术,并提供效果体验。,为每个开发伙伴提供一对一的技术支持服务,保证应用快速开发。,创新 开拓未来 合作 成就梦想,共同开启“语时代”,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报