收藏 分享(赏)

XFS5051CE中英文语音合成芯片用户开发指南V1.3(科达讯飞).pdf

上传人:精品资料 文档编号:11054518 上传时间:2020-02-05 格式:PDF 页数:57 大小:721.50KB
下载 相关 举报
XFS5051CE中英文语音合成芯片用户开发指南V1.3(科达讯飞).pdf_第1页
第1页 / 共57页
XFS5051CE中英文语音合成芯片用户开发指南V1.3(科达讯飞).pdf_第2页
第2页 / 共57页
XFS5051CE中英文语音合成芯片用户开发指南V1.3(科达讯飞).pdf_第3页
第3页 / 共57页
XFS5051CE中英文语音合成芯片用户开发指南V1.3(科达讯飞).pdf_第4页
第4页 / 共57页
XFS5051CE中英文语音合成芯片用户开发指南V1.3(科达讯飞).pdf_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、 XFS5051CE 中英文语音合成芯片 用户开发指南 合肥讯飞数码科技有限公司 安徽省合肥市国家级高新技术产业开发区信息产业基地讯飞语音大厦 0551-5331506 0551- 5331837 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 I 页 版本历史 版 本 日 期 修改记录 V0.1 2012-6-11 非正式发布版本 V0.2 2012-6-25 1、 BAUD1、 BAUD2 管脚定义对调; 2、 增加了提示音列表和播报事件; 3、 替换部分电路图; 4、 增加了天气预报列表和使用方法说明、

2、示例等。 V0.3 2012-7-1 1、 修订了 I2C、 SPI 通讯协议的说明; 2、 增加了语音编解码部分的说明; 3、 增加参数表格。 V1.0 2012-7-6 发布正式版本 V1.1 2012-7-20 1、 补充新增发音人的相关说明; 2、 修订部分细节内容。 V1.2 2012-9-13 1、更改部分参考电路图的器件标号等细节; 2、增加音频编解码的参考程序。 V1.3 2012-10-8 1、 对图表 13 中外扩 SPI flash 电路图的错误连接进行了更正。 声 明 本用户开发指南由合肥讯飞数码科技有限公司版权所有,未经许可,任何单位和个人都不得以电子的、机械的、磁性

3、的、光学的、化学的、手工的等形式复制、传播、转录和保存该出版物,或翻译成其他语言版本。一经发现,将追究其法律责任。 讯飞数码保证本开发指南提供信息的准确性和可靠性,但并不对文本中可能出现的文字错误或疏漏负责。讯飞数码保留更改本开发指南的权利,如有修改,恕不相告。请在订购时联系我们以获得产品最新信息。对任何用户使用我们产品时侵犯第三方版权或其他权利的行为讯飞数码概不负责。另外,在讯飞数码未明确表示产品有该项用途时,对于产品使用在极端条件下导致一些失灵或损毁而造成的损失概不负责。 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.

4、,Ltd. 第 II 页 目 录 1 概述 - 1 - 2 主要应用领域 - 1 - 3 订货信息 - 1 - 4 功能描述 - 2 - 5 引脚定义 - 4 - 6 芯片控制方式 - 6 - 6.1 控制命令 - 6 - 6.2 芯片回传 - 6 - 7 通讯方式 - 7 - 7.1 UART 通讯模式 - 7 - 7.1.1 硬件连接 . - 7 - 7.1.2 通讯传输字节格式 - 7 - 7.1.3 波特率配置方法 - 7 - 7.2 I2C 通讯模式 . - 8 - 7.2.1 硬件连接 . - 8 - 7.2.2 通讯传输字节格式 - 8 - 7.3 SPI 通讯模式 - 9 -

5、7.3.1 硬件连接 . - 9 - 7.3.2 通讯传输字节格式 - 9 - 8 通讯协议 - 10 - 8.1 语音合成功能支持的控制命令 - 10 - 8.1.1 语音合成命令 - 11 - 8.1.2 停止合成命令 - 12 - 8.1.3 暂停合成命令 - 12 - 8.1.4 恢复合成命令 - 12 - 8.1.5 状态查询命令 - 13 - 8.1.6 进入省电模式命令 - 14 - 8.1.7 芯片状态回传 - 14 - 8.2 语音编解码功能支持的控制命令 - 15 - 8.2.1 开始语音编码的命令 - 15 - 8.2.2 开始语音解码的命令 - 16 - 8.2.3 发

6、送数据到芯片进行解码 - 17 - 8.2.4 停止语音编解码的命令 - 18 - 8.2.5 编解码相关的状态回传 - 18 - 8.2.6 编解码延迟时间参数 - 18 - XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 III 页 9 语音合成系统结构图 - 19 - 10 上位机对 XFS5051CE 芯片的调用方式 - 20 - 10.1 简单调用方式 - 20 - 10.2 标准调用方式 - 20 - 10.3 查询芯片工作状态的方法 - 20 - 11 参考电路 - 21 - 11.1 典型应用

7、电路 - 21 - 11.2 电源模块参考电路 - 21 - 11.3 晶振电路 - 22 - 11.4 复位电路 - 22 - 11.5 与上位机通讯的电路连接 - 23 - 11.6 外扩 SPI flash 的电路连接 . - 23 - 11.7 录音模块电路 - 24 - 11.8 音频功放电路 - 24 - 11.8.1 TPA3123D2 - 24 - 11.8.2 TPA3110D1 - 25 - 11.8.3 TPA2005D1 - 25 - 12 示例程序 - 26 - 12.1 发送语音合成文本的示例程序 - 26 - 12.2 语音编解码的示例程序 - 27 - 13 文

8、本控制标记 - 31 - 13.1 文本控制标记列表 - 31 - 13.2 使用示例 - 33 - 13.2.1 f?标记的使用 - 33 - 13.2.2 g? 标记的使用 . - 34 - 13.2.3 h? 标记的使用 . - 34 - 13.2.4 i?标记的使用 - 34 - 13.2.5 k?标记的使用 . - 34 - 13.2.6 m?标记的使用 - 34 - 13.2.7 n?标记的使用 . - 35 - 13.2.8 o?标记的使用 . - 35 - 13.2.9 p?标记的使用 . - 36 - 13.2.10 r?标记的使用 - 36 - 13.2.11 s?标记的使

9、用 . - 36 - 13.2.12 t?标记的使用 - 36 - 13.2.13 v?标记的使用 . - 37 - 13.2.14 x?标记的使用 . - 37 - 13.2.15 y?标记的使用 . - 37 - 13.2.16 z?标记的使用 . - 37 - XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 IV 页 13.2.17 =?标记的使用 . - 38 - 13.2.18 d标记的使用 . - 38 - 14 提示音 - 39 - 14.1 内部集成提示音 - 39 - 14.1.1 信息提示

10、音列表 - 39 - 14.1.2 铃声提示音列表 - 39 - 14.1.3 报警提示音列表 - 40 - 14.1.4 其他类型提示音列表 - 41 - 14.2 添加提示音 - 42 - 14.2.1 添加提示音的操作步骤 - 42 - 14.2.2 添加提示音的示例 - 42 - 14.3 天气预报语音提示音 - 43 - 14.3.1 天气预报提示音列表 - 44 - 14.3.2 天气语音提示音的使用方法 - 46 - 15 产品规格 - 47 - 15.1 封装 - 47 - 15.2 特性参数 - 48 - 15.2.1 极限值 . - 48 - 15.2.2 直流电气特性 -

11、 48 - 15.2.3 音频 DAC 特性 . - 49 - 15.2.4 非文本合成状态下的功耗参数 - 49 - 15.3 接收合成命令到开始播音间隔时间 - 49 - 15.4 焊接工艺要求 - 49 - 15.4.1 烘烤温度及时间 - 49 - 15.4.2 回流焊的峰值温度 - 50 - 16 附录 - 51 - 16.1 GB2312 编码简介 - 51 - 16.2 UNICODE 编码简介 . - 51 - 16.3 GBK 编码简介 - 51 - 16.4 BIG5 编码简介 - 52 - XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digi

12、tal Technology Co.,Ltd. 第 - 1 - 页 1 概述 XFS5051CE 是科大讯飞基于其全球领先的语音合成技术,推出的一款功能集成度最高的语音合成芯片。芯片可实现中文合成、英文合成、中英文混读,还支持粤语、四川话、湖南话等 6种方言的合成;芯片可配置为导航模式,导航模式下,全国的地名路名的专有读法、生僻字的读法更加准确;芯片对特殊格式的天气预报进行了定制,播报的语音更加地亲切自然;同时芯片集成了语音编解码功能,可以进行录音和播放。 2 主要应用领域 车载调度终端 固定电话 信息机 税控机 考勤机 公交车语音报站器 排队机 自动售货机 气象预警机 POS 机 智能仪器

13、智能仪表 3 订货信息 芯片型号 封装信息 封装名称 封装描述 XFS5051CE LQFP100 100 脚,芯片尺寸 14mm14mm1.4mm 表格 1 订货信息 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 2 - 页 4 功能描述 XFS5051CE 语音合成芯片的主要功能特性如下: z 多种风格的中文、英文、方言发音人可选 10 个中英文双语发音人:可以支持中文(普通话)合成、英文合成和中英文混读。 3 个纯英文发音人:为美式英语的发音风格,可用于纯英文文本的合成。 7 个方言发音人:支持

14、6 种方言的合成, 7 个方言发音人分别为是粤语男声、粤语女声、四川女声、东北女声、台湾女声、湖南男声、河南男声。 z 可进行语音的编解码 芯片内部集成了语音编码单元和解码单元,可以进行语音的编码和解码,实现录音和播放功能。芯片的语音编解码具备高压缩率、低失真率、低延时的特点,并且可以支持多种语音编码解码速率。这些特性使它非常适合于数字语音通信、语音存储以及其它需要对语音进行数字处理的场合。如:车载微信、指挥中心等。 z 三种通讯接口可选 芯片通讯接口丰富,可支持 UART、 I2C 、 SPI 三种通讯方式。用户可以依据上位机的接口资源情况选择适合的通讯接口。 z 支持外扩提示音接口 提供用

15、于扩展 SPI flash 的接口 ,可以满足用户添加提示音的需求。用户把自己需要用到的声音文件,通过芯片配套的打包工具打包后烧写到 SPI flash 中,连接到 XFS5051CE 的系统中,即可作为提示音使用,调用方法与芯片内部集成提示音的调用方法相同。 z 地名、路名播报更准确 芯片内部针对各地的地名、路名的语音合成进行了专门优化,地名、路名中常见的多音字、生僻字、专用字等播报更准确。 z 天气预报播报的特殊定制功能 为了达到较好的播音效果,对天气预报中一些频繁使用的固定短语,在芯片中存放了它们的预录音(录音人为晓燕) ,供用户调用,可使得天气预报的播报效果更亲切、自然。 z 四种通讯

16、波特率可选 XFS5051CE芯片的 UART通讯接口支持 4种通讯波特率: 4800 bps、 9600 bps、 57600 bps、115200 bps, 可以通过芯片上的两个管脚 BAUD1、 BAUD2 上的电平来进行硬件配置波特率。 z 文本合成功能 芯片支持任意中文文本的合成,可以采用 GB2312、 GBK、 BIG5 和 UNICODE 四种编码方式。每次合成的文本量最多可达 4K 字节。 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 3 - 页 z 文本分析算法 芯片具有智能的文本分

17、析算法,对常见的数值、电话号码、时间日期、度量衡符号等格式的文本,芯片能够根据内置的 文本匹配规则进行正确的识别和处理。例如: “ 2008-12-21”读作 “二零零八年十二月二十一日” , “ 10:36:28”读作 “十点三十六分二十八秒” , “ 28”读作“二十八摄氏度” ,等等。 芯片可自动地对文本进行分析,判别多音字的读法。例如: “当前工作的重中之重是要在重重困难中保证重庆市的重点工程的顺利进行,坚决拒绝重复建设” ,同一句中出现多个“重”字,芯片都能够正确合成相应的读音 。 有些汉字作为姓氏使用时,会有特定的读法,芯片也可以自动处理。如: “解晓东是解放以后出生的” ,句中两

18、个“解”字,前面一个读作“ xi” ,后面一个读作“ ji” 。 z 集成提示音效 芯片内部集成有 200 首提示音,可用于不同场合的信息提示、铃声、警报等功能。 z 支持多种控制命令 控制命令包括:合成文本、停止合成、暂停合成、恢复合成、状态查询、进入省电模式、唤醒等 7 种控制命令。控制器通过通讯接口发送控制命令可以对芯片进行相应的控制。 芯片的控制命令非常简单易用,例如:芯片可通过统一的“合成命令”接口播放提示音(包括内部集成和外部扩展的提示音)和中文文本,还可以通过标记文本实现对合成的参数设置。 z 支持多种文本控制标记 芯片支持多种文本控制标记。可通 过发送“合成命令”发送控制标记文

19、本,调节语速、语调、音量。还可以使用控制标记提升文本处理的正确率,如:设置汉字的读音、数字的读法等。 z 查询芯片的工作状态 支持多种方式查询芯片的工作状态,包括:查询状态管脚电平、通过读芯片自动返回的工作状态字、发送查询命令获得芯片工作状态的回传数据。 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 4 - 页 5 引脚定义 编号 引脚 说明 编号 引脚 说明 1 NC 51 RXD 串口接收 2 NC 52 A1 接 10K 上拉 3 NC 53 TXD 串口发送 4 SPI_SSEL SPI 片选,

20、 不用时接10K 上拉 54 VCC 3.3V 数字电源 5 NC 55 GND 数字地 6 VCC 3.3V 数字电源 56 M_D0 与 84 脚相连 7 IIC_SCL IIC 时钟输入 57 M_D1 与 83 脚相连 8 IIC_SDA IIC 数据接口 58 M_D2 与 82 脚相连 9 NC 59 M_D3 与 81 脚相连 10 VDD12 1.2V 数字电源 60 GND 数字地 11 VCC 3.3V 数字电源 61 VCC 3.3V 数字电源 12 NC 62 M_D4 与 87 脚相连,加 10K上拉 13 GND 数字地 63 M_D5 与 94 脚相连 14 NC

21、 64 M_D6 与 92 脚相连 15 NC 65 M_D7 与 91 脚相连 16 AVCC 3.3V 模拟电源 66 M_D8 与 90 脚相连 17 HPR 音频输出正 67 M_D9 与 80 脚相连 18 HPL 音频输出负 68 M_D10 与 79 脚相连 19 AGND 模拟地 69 M_D11 与 78 脚相连 20 VCM 模拟参考电压 70 M_D12 与 77 脚相连 21 Mic_Bias 麦克偏置电压 71 A2 接 10K 下拉 22 Mic_M 麦克输入负,不用时悬空 72 M_D13 与 75 脚相连,加 10K上拉 23 Mic_P 麦克输入正,不用时悬空

22、 73 GND 数字地 24 AGND 模拟地 74 VCC 3.3V 数字电源 25 NC 75 N_D13 与 72 脚相连 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 5 - 页 26 NC 76 RDY 低电平芯片处于就绪状态 27 AVCC 3.3V 模拟电源 77 N_D12 与 70 脚相连 28 Vref 参考电压 78 N_D11 与 69 脚相连 29 NC 79 N_D10 与 68 脚相连 30 VCC 3.3V 数字电源 80 N_D9 与 67 脚相连 31 VCC 3.3

23、V 数字电源 81 N_D3 与 59 脚相连 32 VDD12 1.2V 数字电源 82 N_D2 与 58 脚相连 33 AVDD12 1.2V 模拟电源 83 N_D1 与 57 脚相连 34 GND 数字地 84 N_D0 与 56 脚相连 35 XTALI 晶振输入 85 GND 数字地 36 XTALO 晶振输出 86 NC 37 NC 87 N_D4 与 62 脚相连 38 NC 88 SPI_SCK SPI 时钟输入 39 BAUD1 波特率选择引脚 89 SPI_SI SPI 数据输入 40 RST 复位引脚,低有效 90 N_D8 与 66 脚相连 41 BAUD2 波特率

24、选择引脚 91 N_D7 与 65 脚相连 42 NC 92 N_D6 与 64 脚相连 43 FLASH_CS SPI flash 片选 93 SPI_SO SPI 数据输出 44 A0 接 10K 上拉 94 N_D5 与 63 脚相连 45 FLASH_SCK SPI flash 时钟输出95 NC 46 FLASH_SI SPI flash 数据输入96 GND 数字地 47 FLASH_SO SPI flash 数据输出97 NC 48 NC 98 NC 49 NC 99 NC 50 GND 数字地 100 NC 表格 2 XFS5051CE 的引脚定义表 XFS5051CE 中英文

25、语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 6 - 页 6 芯片控制方式 6.1 控制命令 XFS5051CE 支持多种控制命令,列表如下: 命令功能 说明 合成命令 合成本次发送的命令 停止合成命令 停止当前的合成动作 暂停合成命令 暂停正在进行的合成 恢复合成命令 继续合成被暂停的文本 状态查询命令 查询当前芯片的工作状态 进入省电模式 使芯片从正常工作模式进入省电模式 唤醒命令 使芯片从省电模式进入正常工作模式 录音命令 开始录音编码功能 编码播音命令 开始解码播放功能 表格 3 控制命令列表 6.2 芯片回传 上电初始

26、化成功时或者收到上位机的控制命令帧时, XFS5051CE 芯片都会向上位机发送 1个字节的回传,上位机可根据这个回传来判断芯片目前的状态。 名称 回传信息 触发条件 初始化成功回传 0x4A 上电芯片初始化成功后,芯片自动发送回传 收到正确的命令帧回传 0x41 收到正确的命令帧 收到不能识别命令帧回传 0x45 收到错误的命令帧 芯片忙碌状态回传 0x4E 芯片处在正在合成状态,收到状态查询命令帧 芯片空闲状态回传 0x4F 芯片处在空闲状态,收到状态查询命令帧; 或一帧数据合成结束,芯片处于空闲状态 表格 4 芯片回传列表 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei

27、iFly Digital Technology Co.,Ltd. 第 - 7 - 页 7 通讯方式 XFS5051CE 芯片支持 UART 接口、 I2C 接口、 SPI 接口三种通讯方式,可通过 UART 接口、I2C 或 SPI 接口接收上位机发送的命令和数据,允许发送数据的最大长度为 4k 字节。 7.1 UART 通讯模式 7.1.1 硬件连接 图表 1 XFS5051CE 芯片 UART 接口的连接示意图 7.1.2 通讯传输字节格式 图表 2 UART接口通讯传输字节格式 1) 通讯标准: UART 2) 波特率: 4800 bps、 9600 bps、 57600 bps、 11

28、5200 bps 3) 起始位: 1bit 4) 数据位: 8 bits 5) 停止位: 1 bit 6) 校验:无 7.1.3 波特率配置方法 XFS5051CE 芯片的 UART 通讯接口支持 4 种通讯波特率: 4800 bps、 9600 bps、 57600 bps、115200 bps,可以通过 XFS5051CE 芯片上的两个管脚 BAUD1( 39 引脚) 、 BAUD2( 41 引脚)上XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 8 - 页 的电平来进行硬件配置。 波特率 BAUD1

29、 BAUD2 4800 bps 0 0 9600 bps 0 1 57600 bps 1 0 115200 bps 1 1 表格 5 波特率配置表 7.2 I2C 通讯模式 7.2.1 硬件连接 XFS5051CE 采用标准 I2C 总线接口,设置为 Slave 身份。 I2C 总线是一个为简化多个智能设备之间相互传输信息而设计的两线、双向网络。 图表 3 XFS5051CE 芯片 I2C 接口的连接示意图 7.2.2 通讯传输字节格式 图表 4 I2C 总线时序图 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd.

30、 第 - 9 - 页 XFS5051CE 作为 I2C 接口的从设备, 设备地址为 : 0x80。 为保证通讯的稳定性, XFS5051CE 的 I2C 接口通信速度要求不高于 15KHZ。 XFS5051CE 采用的标准 I2C 总线接口,关于 I2C 总线通讯的详细信息, 请参考“ The I2C-bus specification” 。 7.3 SPI 通讯模式 7.3.1 硬件连接 XFS5051CE芯片的 SPI接口是 4线全双工同步串行通讯接口, 上位机作为 SPI通讯中的 Master身份, XFS5051CE 在 SPI 通讯中设为 Slave 身份, SPI 通讯所需的时钟信

31、号由上位机提供。 图表 5 XFS5051CE 芯片 SPI 接口的连接示意图 7.3.2 通讯传输字节格式 SPI 通讯属于同步串行通讯,为保证通讯的稳定性, XFS5051CE 的 SPI 接口通信速度要求不高于 25KHZ。 上位机在和 XFS5051CE 的通讯中,由上位机提供同步时钟信号,在同步时钟的上升沿 XFS5051CE锁存 1bit 数据, 每传输 8bits数据完成一个字节数据的传输。 下图是 XFS5051CE的 SPI 接口的通讯时序图。 图表 6 SPI 通讯时序图 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Techno

32、logy Co.,Ltd. 第 - 10 - 页 注意:在发送一个字节之后,将 SPI_SCK 保持低电平一段时间,每两个字节之间必须插入一段等待 , 时间不少于 105 us。 8 通讯协议 8.1 语音合成功能支持的控制命令 上位机发送给 XFS5051CE 芯片的所有语音合成命令都需要用 “帧” 的方式进行封装后传输。帧结构由帧头标志、数据区长度和数据区三部分组成。 帧头 数据区长度 数据区 0xFD 0xXX, 0xXX Data 表格 6 命令帧封装格式 名称 长度 说明 帧头 1 Byte 定义为十六进制“ 0xFD” 数据区长度 2 Bytes 用两个字节表示,高字节在前,低字节

33、在后 数据区 小于 4k Bytes 命令字和命令参数,长度和“数据区长度”一致 表格 7 命令帧说明 数据区是由命令字和命令参数组成的,上位 机使用命令字来实现语音合成芯片的各种功能。 名称 发送的数据 说明 命令字 0x01 语音合成命令 0x02 停止合成命令,没有参数 0x03 暂停合成命令,没有参数 0x04 恢复合成命令,没有参数 0x21 芯片状态查询命令 0x88 芯片进入省电模式 命令参数 不同命令字有不同参数列表,详见各命令字说明 表格 8 数据区命令字和命令参数 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology

34、 Co.,Ltd. 第 - 11 - 页 8.1.1 语音合成命令 名称 发送的数据 说明 命令字 0x01 带文本编码设置的文本播放命令 参数列表 0Xxx 1Byte 表示文本的编码格式,取值为 0 3 参数取值 文本编码格式 0x00 GB2312 0x01 GBK 0x02 BIG5 0x03 UNICODE Data 待合成文本的二进制内容 命令帧格式结构 帧头 数据区长度 数据区 0xFD 高字节 低字节 命令字 文本编码格式 待合成文本 0xHH 0xLL 0x01 0x000x03 . . 示例 语音合成命令帧示例,发送文本编码格式为“ GB2312”的文本“科大讯飞” 0xF

35、D 0x00 0x0A 0x01 0x00 0xBF 0xC6 0xB4 0xF3 0xD1 0xB6 0xB7 0xC9 语音合成命令帧示例,发送文本编码格式为“ GBK”的文本“科大讯飞” 0xFD 0x00 0x0A 0x01 0x01 0xBF 0xC6 0xB4 0xF3 0xD3 0x8D 0xEF 0x77 语音合成命令帧示例,发送文本编码格式为“ BIG5”的文本“科大讯飞” 0xFD 0x00 0x0A 0x01 0x02 0xAC 0xEC 0xA4 0x6A 0xB0 0x54 0xAD 0xB8 语音合成命令帧示例,发送文本编码格式为“ UNICODE”的文本“科大讯飞

36、” 0xFD 0x00 0x0A 0x01 0x03 0xD1 0x79 0x27 0x59 0xAF 0x8B 0xDE 0x98 特别说明 当 XFS5051CE 芯片正在合成文本的时候,如果又接收到一帧有效的合成命令帧,芯片会立即停止当前正在合成的文本,转而合成新收到的文本。 表格 9 语音合成命令 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 12 - 页 8.1.2 停止合成命令 名称 发送的数据 说明 命令字 0x02 停止当前合成 参数列表 无 命令帧格式结构 帧头 数据区长度 数据区 0

37、xFD 高字节 低字节 命令字 0x00 0x01 0x02 表格 10 停止合成命令 8.1.3 暂停合成命令 名称 发送的数据 说明 命令字 0x03 暂停当前合成 参数列表 无 命令帧格式结构 帧头 数据区长度 数据区 0xFD 高字节 低字节 命令字 0x00 0x01 0x03 表格 11 暂停合成命令 8.1.4 恢复合成命令 名称 发送的数据 说明 命令字 0x04 恢复暂停的合成 参数列表 无 命令帧格式结构 帧头 数据区长度 数据区 0xFD 高字节 低字节 命令字 0x00 0x01 0x04 表格 12 恢复合成命令 XFS5051CE 中英文语音合成芯片用户开发指南 H

38、efei iFly Digital Technology Co.,Ltd. 第 - 13 - 页 8.1.5 状态查询命令 名称 发送的数据 说明 命令字 0x21 通过该命令获取相应参数, 来判断 TTS 芯片是否处在合成状态,返回 0x4E 表明芯片仍在合成中,返回 0x4F 表明芯片处于空闲状态 参数列表 无 命令帧格式结构 帧头 数据区长度 数据区 0xFD 高字节 低字节 命令字 0x00 0x01 0x21 表格 13 状态查询命令 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 14 - 页

39、 8.1.6 进入省电模式命令 名称 发送的数据 说明 命令字 0x88 进入省电模式 参数列表 无 命令帧格式结构 帧头 数据区长度 数据区 0xFD 高字节 低字节 命令字 0x00 0x01 0x88 表格 14 进入省电模式命令 注意 : 芯片进入省电模式后 ,发送任意命令到芯片的通讯接口上 ,都可以把芯片从省电模式中唤醒,进入正常的工作模式(待合成状态) 。 8.1.7 芯片状态回传 XFS5051CE 芯片在上电初始化成功时会向上位机发送一个字节的“初始化成功”回传,初始化不成功时不发送此回传。 XFS5051CE 芯片收到一个命令帧后会判断此命令帧正确与否,如果命令帧正确返回“收

40、到正确命令帧”回传,如果命令帧错误则返回“收到错误命令帧” 回传。 XFS5051CE 芯片收到状态查询命令时,如果芯片正处于合成状态则返回“芯片忙碌”回传,如果芯片处于空闲状态则返回“芯片空闲”回传。 XFS5051CE 芯片在一帧数据合成完毕后,会自动返回一次“芯片空闲”的回传。 回传数据类型 回传数据 触发条件 初始化成功 0x4A 芯片初始化成功 收到正确命令帧 0x41 收到正确的命令帧 收到错误命令帧 0x45 收到错误的命令帧 芯片忙碌 0x4E 收到 “状态查询命令” , 芯片处于合成文本状态回传 0x4E芯片空闲 0x4F 当一帧数据合成完以后,芯片进入空闲状态回传 0x4F

41、;当芯片收到“状态查询命令” ,芯片处于空闲状态回传0x4F 表格 15 芯片回传 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 15 - 页 8.2 语音编解码功能支持的控制命令 上位机通过 UART 接口和 XFS5051CE 芯片连接 ,并且波特率设置为 115200bps 时 ,可以实现语音编解码功能。 上位机发送给 XFS5051CE 芯片的语音编解码命令需要用 “帧” 的方式进行封装。帧结构由帧头标志、数据区长度和数据区三部分组成。数据区由命令字和参数构成。 帧头 数据区长度 数据区 0xF

42、D 0xXX, 0xXX Data 表格 16 语音编解码命令帧封装格式 名称 长度 说明 帧头 1 Byte 定义为十六进制“ 0xFD” 数据区长度 2 Bytes 用两个字节表示,高字节在前,低字节在后 数据区 小于 4k Bytes 命令字和命令参数 表格 17 命令帧说明 数据区是由命令字和命令参数组成的,上位 机使用命令字来实现语音合成芯片的各种功能。 数据区 命令字 命令参数 命令字 说明 0x41 开始语音编码的命令 3 Bytes 的参数。参数 1:采样率;参数 2:设置比特率等级;参数 3:设置音量。 0x42 开始语音解码的命令 3 Bytes 的参数。参数 1:采样率;

43、参数 2:设置比特率等级;参数 3:设置音量。 0x43 解码帧数据发送 上位机根据指定的压缩等级发送一帧数据给语音芯片进行解码 0x44 停止录音或解码命令 无参数 表格 18 数据区命令字和命令参数的说明 8.2.1 开始语音编码的命令 名称 发送的数据 说明 命令字 0x41 开始编码命令 参数列表 ( 3 个参数) 参数 1 ( 1 Byte) 设置采样率 设置为: 00,采样率 8k 设置为: 01,采样率 16k 参数 2 ( 1 Byte) 设置比特率等级 设置为: 00,比特率等级 0 级 设置为: 01,比特率等级 1 级 XFS5051CE 中英文语音合成芯片用户开发指南

44、Hefei iFly Digital Technology Co.,Ltd. 第 - 16 - 页 设置为: 02,比特率等级 2 级 设置为: 03,比特率等级 3 级 设置为: 04,比特率等级 4 级 设置为: 05,比特率等级 5 级 参数 3 ( 1 Byte) 设置音量 设置为: 00,音量 0 级 设置为: 01,音量 1 级 设置为: 02,音量 2 级 设置为: 03,音量 3 级 设置为: 04,音量 4 级 设置为: 05,音量 5 级 设置为: 06,音量 6 级 设置为: 07,音量 7 级 设置为: 08,自动增益控制 命令帧格式结构 帧头 数据区长度 数据区 0x

45、FD 高字节 低字节 命令字 参数 1 参数 2 参数 3 0x00 0x04 0x41 0xXX 0xXX 0x XX 示例 如设置 16k 采样率、 5 级比特率、音量采用自动增益控制,发送的数据帧如下: 0xFD 0x00 0x04 0x41 0x01 0x05 0x 08 表格 19 开始编码的命令说明 8.2.2 开始语音解码的命令 名称 发送的数据 说明 命令字 0x42 开始解码命令 参数列表 ( 3 个参数) 参数 1 ( 1 Byte) 设置采样率 设置为: 00,采样率 8k 设置为: 01,采样率 16k 参数 2 ( 1 Byte) 设置比特率等级 设置为: 00,比特

46、率等级 0 级 设置为: 01,比特率等级 1 级 设置为: 02,比特率等级 2 级 设置为: 03,比特率等级 3 级 设置为: 04,比特率等级 4 级 设置为: 05,比特率等级 5 级 参数 3 ( 1 Byte) 设置音量 设置为: 00,音量 0 级 设置为: 01,音量 1 级 设置为: 02,音量 2 级 设置为: 03,音量 3 级 XFS5051CE 中英文语音合成芯片用户开发指南 Hefei iFly Digital Technology Co.,Ltd. 第 - 17 - 页 设置为: 04,音量 4 级 设置为: 05,音量 5 级 设置为: 06,音量 6 级 设

47、置为: 07,音量 7 级 命令帧格式结构 帧头 数据区长度 数据区 0xFD 高字节 低字节 命令字 参数 1 参数 2 参数 3 0x00 0x04 0x41 0xXX 0xXX 0x XX 示例 如设置 16k 采样率、 5 级比特率、 5 级音量,发送的数据帧如下: 0xFD 0x00 0x04 0x41 0x01 0x05 0x 05 表格 20 开始解码的命令说明 8.2.3 发送数据到芯片进行解码 名称 发送的数据 说明 命令字 0x43 根据指定的压缩等级发送一帧数据给芯片解码;与申请数据帧( 0xFC 0x00 0x01 0x23)配合使用 命令帧格式结构 帧头 数据区长度 数据区 0xFD 高字节 低字节 命令字 待解码数据 0xXX 0xXX 0x43 示例 如 : 发送一帧采样率 8k、比特率等级 05 的数据,字节数对应为 62(16 进制为 3F),发送的数据帧如下: 0xFD 0x00 0x3F 0x43 表格 21 发送解码数据的帧格式 各录采样率和比特率等级,与对字节数的对照表如下: 采样率 8k

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报