1、 SYN6288 中文语音合成芯片数据手册 第 1 页 / 共 39 页 2011年 9 月 6日更新 SYN6288中文语音合成芯片 数据手册 北京宇音天下科技有限公司 地址:北京市海淀区上地高新技术区 010-62986600 010-62988818 SYN6288 中文语音合成芯片数据手册 第 2 页 / 共 39 页 2011年 9 月 6日更新 目 录 目 录 .2 1概述 .4 1.1 产品应用范围 4 1.2 功能特点 4 1.3 产品功能描述 5 1.4 合成效果 6 1.5 系统构成框图 6 1.6 封装信息 7 1.7 IC 引脚结构 .8 1.7.1 纵向引脚视图 8
2、 1.7.2 横向引脚视图 8 1.7.3 引脚定义 9 2芯片控制方式 10 2.1 控制命令 10 2.2 芯片回传 11 3通讯方式. 11 3.1 异步串行通讯(UART)接口 12 3.2 通讯传输字节格式 12 4通信帧定义及通信控制 . 12 4.1 命令帧格式 12 4.2 芯片支持的控制命令 13 4.3 命令帧相关的特别说明 14 4.3.1 休眠与唤醒说明 14 4.3.2 设置波特率说明 14 4.3.3 其它特别说明 14 4.4 命令帧举例 15 4.4.1 语音合成播放命令 15 4.4.2 设置波特率命令 16 4.4.3 停止合成命令 17 4.4.4 暂停合
3、成命令 17 4.4.5 恢复合成命令 17 4.4.6 芯片状态查询命令 18 4.4.7 芯片进入 Power Down 模式命令.18 5. 文本控制标记 18 5.1 文本控制标记列表 18 5.2 文本控制标记使用示例 20 5.2.1 标记v? -前景播放音量 .20 5.2.2 标记m?-背景音乐音量 .20 5.2.3 标记t? -词语语速 .21 SYN6288 中文语音合成芯片数据手册 第 3 页 / 共 39 页 2011年 9 月 6日更新 5.2.4 标记n? -数字处理策略 .21 5.2.5 标记y? -号码 1 的读法 .21 5.2.6 标记x? -提示音策略
4、 .21 5.2.7 标记b? -标点策略 .22 5.2.8 标记o? -文本朗读方式 .22 5.2.9 标记d -恢复默认 .22 5.2.10标记r -按姓氏发音 .22 5.2.11标记2和3-强制组词 .22 5.2.12 初始化综合举例 23 6. 提示音效 23 6.1 声音提示音列表 23 6.2 和弦提示音列表 24 7. 上位机对SYN6288芯片的调用方式. 25 7.1 简单调用方式 25 7.2 标准调用方式 25 7.3 查询芯片工作状态的方法 25 8. 芯片识别的编码体系和范围. 26 8.1 GB2312 编码体系 .26 8.2 GBK编码体系 .26 8
5、.3 BIG5编码体系 .26 8.4 Unicode 编码体系 .26 9. 产品规格 27 9.1 封装数据 27 9.2 极限参数 28 9.3 电气特性 28 9.4 播放合成声音时的功耗 29 9.5 正常工作模式 29 9.5 睡眠(低功耗)工作模式 29 10参考电路. 29 10.1 3V电源供电模块参考电路 .30 10.2 5V电源供电模块参考电路 .31 10.3 复位电路和状态指示电路 .32 10.4 SYN6288的扬声器输出 .32 10.5 SYN6288外接高速晶振 .33 10.6 串口通讯反向电路 .34 10.7 串口通信的参考电路 .34 10.8 R
6、es引脚(即第 5引脚)的正确接法 .35 11发送合成文本的示例程序 . 35 11.1 C 语言范例程序 35 11.2 汇编语言范例程序 37 12附录 39 12.1 参考文献 39 12.2 版本历史 39 SYN6288 中文语音合成芯片数据手册 第 4 页 / 共 39 页 2011年 9 月 6日更新 1概述 SYN6288 中文语音合成芯片是北京宇音天下科技有限公司于 2010 年初推出的一款性/价比更高, 效果 更自然的一款中高端语音合成芯片。SYN6288通过异步串口(UART)通讯方式,接收待合成的文本数据, 实现文本到语音(或 TTS语音)的转换。 宇音天下于 200
7、2 年最早研制出国内首款语音合成芯片 OSYNO6188。公司最新推出的 SYN6288 语音合 成芯片,继承了 OSYNO6188 语音芯片的优秀特点:最小 SSOP28L 贴片封装、硬件接口简单、低功耗、音 色清亮圆润、极高的性/价比;除此之外,SYN6288 在识别文本/数字/字符串更智能、更准确,语音合成 自然度更好、可懂度更高。SYN6288 语音合成效果和智能化程度均得到大幅度提高,是一款真正面向中高 端行业应用领域的中文语音合成芯片。 SYN6288 语音合成芯片的诞生,将推动 TTS 语音合成技术的行业应用走向更深入、更广泛! 1.1 产品应用范围 车载信息终端语音播报,车载调
8、度,车载导航 公交报站器 ,考勤机 手机,固定电话 排队叫号机,收银收费机 自动售货机,信息机,POS机 智能仪器仪表 ,气象预警机,智能变压器 智能玩具,智能手表 电动自行车 语音电子书,彩屏故事书,语音电子词典,语音电子导游 短消息播放 ,新闻播放 电子地图 1.2 功能特点 支持GB2312、GBK、BIG5和UNICODE内码格式的文本; 清晰、自然、准确的中文语音合成效果;可合成任意的中文文本,支持英文字母的合成; 具有智能的文本分析处理算法,可正确识别数值、号码、时间日期及常用的度量衡符号; 具备很强的多音字处理和中文姓氏处理能力; 支持多种文本控制标记,提升文本处理的正确率; S
9、YN6288 中文语音合成芯片数据手册 第 5 页 / 共 39 页 2011年 9 月 6日更新 每次合成的文本量最多可达 200 字节; 支持多种控制命令,包括:合成、停止、暂停合成、继续合成、改变波特率等; 支持休眠功能,在休眠状态下可降低功耗;支持多种方式查询芯片工作状态; 支持串行数据通讯接口,支持三种通讯波特率:9600bps,19200bps、38400bps; 支持 16 级音量调整;播放文本的前景音量和播放背景音乐的背景音量可分开控制; 可通过发送控制标记调节词语语速,支持 6 级词语语速调整; 芯片内固化有多首和弦音乐、提示音效和针对某些行业领域的常见语音提示音; 内部集成
10、19首声音提示音,23首和弦提示音,15首背景音乐; 内置10-bit推挽式(push-pull)、可独立供电的功放,进行数模DAC输出; 最终产品提供SSOP贴片封装形式;体积业内最小; 芯片各项指标均满足室外严酷环境下的应用; 1.3 产品功能描述 文本合成功能 芯片支持任意中文文本的合成,可以采用GB2312、GBK、BIG5 和Unicode 四种编码方式。芯片支持英文 字母的合成,遇到英文单词时按字母方式发音。每次合成的文本量可达200个字节。 文本智能分析处理 芯片具有文本智能分析处理功能,对常见的数值、电话号码、时间日期、度量衡符号等格式的文本,芯 片能够根据内置的文本匹配规则进
11、行正确的识别和处理。 例如:“2008-12-21”读作 “二零零八年十二月二十一日”,“10:36:28”读作 “十点三十六分二十 八秒”,“28”读作“二十八摄氏度”,等等。 多音字处理和中文姓氏处理能力 对存在多音字的文本,例如:“当前工作的重中之重是要在重重困难中保证重庆市的重点工程的顺利进 行,坚决拒绝重复建设”,芯片可以自动对文本进行分析,判别文本中多音字的读法并合成正确的读音。 数字音量16级控制和6级词语语速控制 芯片可实现16级数字音量控制,音量更大,更广。播放文本的前景音量和播放背景音乐的背景音量可分 开控制,更加自由。 文本播音时可选择背景音乐 芯片内集成了15 首背景音
12、乐,在任何播音时均可以选择背景音乐。 提示音 芯片内集成了19 首声音提示音,可用于不同场合的信息提醒、报警等功能。 SYN6288 中文语音合成芯片数据手册 第 6 页 / 共 39 页 2011年 9 月 6日更新 芯片内集成了23 首和弦音乐,可用作和弦短信提示音或者和弦铃声。 支持多种控制命令 控制命令包括:合成文本、停止合成、暂停合成、恢复合成、状态查询、进入Power Down模式、改通讯 波特率等控制命令。控制器通过通讯接口发送控制命令实现对芯片的控制。 支持多种文本控制标记 芯片支持多种文本控制标记。可通过发送“合成命令”发送文本控制标记,调节音量、设置数字读法、 设置词语语速
13、、设置标点是否读出等。 查询芯片的工作状态 支持多种方式查询芯片的工作状态,包括:查询状态管脚电平、通过读芯片自动返回的回传、发送查询 命令获得芯片工作状态的回传。 支持低功耗模式 芯片支持Power Down 模式。使用控制命令可以使芯片进入Power Down 模式。复位芯片可以使芯片从Power Down 模式恢复到正常工作模式。 支持三种通讯波特率 芯片支持的通讯波特率:9600bps,19200bps、38400bps 。 1.4 合成效果 自然度 清晰度 正确率 可懂度 3.5 98 96 99 1.5 系统构成框图 最小系统包括:控制器模块、SYN6288语音合成芯片、功放模块和
14、喇叭。 主控制器和SYN6288语音合成芯片之间通过UART 接口连接,控制器可通过通讯接口向SYN6288语音合成芯 片发送控制命令和文本,SYN6288语音合成芯片把接收到的文本合成为语音信号输出,输出的信号经功率放大 器进行放大后连接到喇叭进行播放。 SYN6288 中文语音合成芯片数据手册 第 7 页 / 共 39 页 2011年 9 月 6日更新 1.6 封装信息 语音 合成 串口 收发 语音线 路输出 控制器 功率 放大器 喇叭 AUDIO RXD TXD AUDIO SYN6288芯片 SYN6288 中文语音合成芯片数据手册 第 8 页 / 共 39 页 2011年 9 月 6
15、日更新 1.7 IC引脚结构 1.7.1 纵向引脚视图 1.7.2 横向引脚视图 SYN6288 中文语音合成芯片数据手册 第 9 页 / 共 39 页 2011年 9 月 6日更新 1.7.3 引脚定义 引脚序号 引脚名称 I/O 说 明 1,3 VSSIO0 I 总线模块 0 电源负极 2 VDDIO0 I 总线模块 0 电源正极 4 Ready/Busy- STATUS 引脚 O 低电平表示 CHIP 空闲, 可接收上位机发送的命令和数据 高电平表示 CHIP 忙,正在进行语音合成并播音 5 Res. - Res 引脚 6 VDDIO1 I 总线模块 1 电源正极 7 VSSIO1 I
16、总线模块 1 电源负极 8,12 VSSPP I 语音输出模块电源负极 10 VDDPP I 语音输出模块电源正极 9 BP0 O 推送 DAC语音输出 1 SYN6288 中文语音合成芯片数据手册 第 10 页 / 共 39 页 2011年 9 月 6日更新 11 BN0 O 推送 DAC语音输出 2 28 RxD I 串口数据接收,初始波特率为 9600bps 27 TxD O 串口数据发送,初始波特率为 9600bps 26 VDDA I 内部稳压电源正极 23 VSSA I 内部稳压电源负极 25 XOUT O 高速晶振输出 24 XIN I 高速晶振输入 22 REGOUT O 电压
17、自动调节输出 21 CVDD I 处理器电源正极 18 CVSS I 处理器电源负极 20 VDDIO2 I 总线模块 2 电源正极 17 VSSIO2 I 总线模块 2 电源负极 19 RST I 芯片复位,低电平触发有效 16 VSS I 电源负极与语音合成芯片基板一体,必须与 PCB 布线 的地(GND)或负板(VSS)相连结。 2芯片控制方式 2.1 控制命令 上位机以命令帧的格式向 SYN6288 芯片发送命令。SYN6288 芯片根据命令帧进行相应操作,并向上位机返 回命令操作结果。 SYN6288芯片提供了多种控制命令,列表如下: 命令功能 说明 语音合成播放命令 合成本次发送的
18、文本 改通讯波特率命令 改变之后的通讯波特率 SYN6288 中文语音合成芯片数据手册 第 11 页 / 共 39 页 2 011年 9 月 6日更新 停止合成命令 停止当前的合成动作 暂停合成命令 暂停正在进行的合成 恢复合成命令 继续合成被暂停的文本 芯片状态查询命令 查询当前芯片的工作状态:上位机可通过“芯片状态查 询命令” 来判断TTS 模块是否正常工作,以及获取相 应参数,返回0x4E 表明芯片仍在合成中,返回0x4F 表 明芯片处于空闲状态。 进入 Power Down 模式的命令 使芯片从正常工作模式进入 Power Down 模式,复位后 恢复 2.2 芯片回传 接收到控制命令
19、帧,芯片会向上位机发送1 个字节的状态回传,上位机可根据这个回传来判断芯片目前 的工作状态。 SYN6288 芯片在初始化成功时会发送一个字节的“初始化成功”回传。 SYN6288 芯片收到命令帧后会判断此命令帧正确与否,如果命令帧正确返回“接收成功”回传,如果命 令帧错误则返回“接收失败” 回传。 SYN6288 芯片收到状态查询命令时,如果芯片正处于播音的工作状态则返回“正在播音”回传,如果芯 片处于空闲状态则返回“芯片空闲”回传。在一帧数据合成完毕后,芯片会自动返回一次“芯片空闲”的回 传。 回传类型名称 回传数据 触发条件 初始化成功回传 0x4A 芯片初始化成功 收到正确的命令帧回传
20、 0x41 接收成功 收到不能识别命令帧回传 0x45 接收失败 芯片播音状态回传 0x4E 收到“状态查询命令帧”,芯片处在正在播音状态 芯片空闲状态回传 0x4F 当一帧数据合成完以后,芯片进入空闲状态回传0x4F;或 者收到“状态查询命令帧”,芯片处于空闲状态回传0x4F 3通讯方式 SYN6288 中文语音合成芯片数据手册 第 12 页 / 共 39 页 2011年 9 月 6日更新 3.1 异步串行通讯(UART)接口 SYN 6288 提供一组全双工的异步串行通讯(UART)接口,实现与微处理器或 PC 的数据传输。SYN 6288 利用 TxD和 RxD 以及 GND 实现串口通
21、信。其中 GND 作为地信号。SYN 6288 芯片支持 UART 接口通讯方式, 通过 UART 接口接收上位机发送的命令和数据,允许发送数据的最大长度为 206 字节。 3.2 通讯传输字节格式 1、 初始波特率:9600 bps 2、 起始位: 1 3、 数据位:8 4、 校验位:无 5、 停止位:1 6、 流控制:无 起始位 D0 D1 D2 D3 D4 D5 D6 D7 停止位 4通信帧定义及通信控制 4.1 命令帧格式 芯片支持以下命令帧格式:“帧头FD + 数据区长度+数据区”格式。(最大206个字节) 上位机发送给 SYN6288 芯片的所有命令和数据都需要用“帧”的方式进行封
22、装后传输。 R X D TXD TXD RXD SYN 6288 上位机 具体电路须参见 10.7串 口通信的参考电路说明 SYN6288 中文语音合成芯片数据手册 第 13 页 / 共 39 页 2011年 9 月 6日更新 数据区 (小于等于203字节) 帧结构 帧头 (1字节) 数据区长度 (2字节) 命令字 (1字节) 命令参数 (1字节) 待发送文本 (小于等于200字节) 异或校验 (1字节) 数据 0xFD 0xXX 0xXX 0xXX 0xXX 0xXX 。 0xXX 说明 定义为十六 进制“0xFD” 高字节在前 低字节在后 长度必须和前面的“数据区长度”一致 注意:数据区(
23、含命令字,命令参数,待发送文本,异或校验)的实际长度必须与帧头后定义的数据区长度 严格一致,否则芯片会报接收失败。 4.2 芯片支持的控制命令 数据区 ( 小于等于 203 字节) 命 令 字 1字节 命令参数 1字节 待发送文本 =200字节 异或校验 1字节 取值 对应功能 字节 高5位 对应功能 字节 低3位 对应功能 0 设置文本为: GB2312编码格式 1 设置文本为: GBK编码格式 2 设置文本为: BIG5 编码格式 0x01 语音合成播放命令 值:0 值:1 值:2 值:3 值:14 值:15 1.值 0: 表示不加 背景音乐 2.其它值: 表示所选 背景音乐 的编号 3
24、设置文本为: UNICODE编码格式 待合成文本的二 进制内容 0 设置通讯波特率: 9600bps 1 设置通讯波特率: 19200bps 0x31 设置通讯波特率命令 (初始波特率为 9600bps) 0 无功能 2 设置通讯波特率: 38400bps 0x02 停止合成命令 0x03 暂停合成命令 0x04 恢复合成命令 无参数 无文本 之前所有字 节(包括帧 头, 数据区长 度字节) 做的 异或校验得 出的字节 SYN6288 中文语音合成芯片数据手册 第 14 页 / 共 39 页 2011年 9 月 6日更新 0x21 芯片状态查询命令 0x88 芯片进入 Power Down 模
25、式命令 上位机可使用数据区中的命令字和命令参数来实现语音合成芯片的各种功能。 4.3 命令帧相关的特别说明 4.3.1 休眠与唤醒说明 芯片不会主动休眠,只有接收到上位机发送的休眠命令帧后才会休眠。 芯片进入休眠之后,上位机首先需要唤醒芯片,然后再向芯片发送命令帧数据; (注意:唤醒后需间隔 16 毫秒再发送命令数据) 休眠被若唤醒后(例如硬件唤醒或软件唤醒) ,10秒钟(待机时间)内未接收到上位机发送的有效命令帧 数据(语音合成播放命令,设置波特率命令,停止合成命令,暂停合成命令,恢复合成命令,状态查询 命令) ,则芯片会重新进入休眠(会认为是干扰唤醒不去理睬) 。 (注意:芯片只有在已经进
26、入休眠之后, 才会有 10 秒钟唤醒待机再次休眠) 4.3.2 设置波特率说明 默认初始波特率为 9600bps;上位机若需改变波特率,在发送完设置波特率命令帧后需间隔 16 毫秒再发 送其它命令帧。 若要改波特率,每次系统重置时都得重发改波特率的命令帧。 发送完改波特率命令帧后,要暂停几百毫秒,再改主机的波特率。 9600bps,19200bps两种波特率通讯传输都非常稳定(不管芯片在合成播音还是空闲) 因系统时间片与传输时间片接近的原因:38400bps 波特率通讯传输芯片空闲空闲时非常稳定;但在芯片 合成播音时上位机再次发送数据时不是很稳定,接收成功和接收失败的概率各为 50%左右。提醒
27、用户:在 芯片正在合成播音时,若使用 38400bps波特率再次发送新的数据(中断当前播放),可以先重复发送“停 止”命令,确保收到“接收成功”信号后,再发送新的数据。 4.3.3 其它特别说明 1. 同一帧数据中,每个字节之间的发送间隔不能超过8ms;帧与帧之间的发送间隔必须超过8ms。 SYN6288 中文语音合成芯片数据手册 第 15 页 / 共 39 页 2011年 9 月 6日更新 2. 当 SYN6288 芯片正在合成文本的时候,如果又接收到一帧有效的合成命令帧,芯片会立即停止当前 正在合成的文本,转而合成新收到的文本。 3. 待发送文本长度必须小于等于200个字节。实际发送的长度
28、大于200字节,芯片会报接收失败。 4. 用户在连续播放文本内容时,在收到前一帧数据播放完毕的“芯片空闲”字节(即0x4F)后,最好延 时1ms左右再发送下一帧数据。 5. 用户在连续播放文本内容时(即播完前一帧数据就马上发送播放下一帧数据),建议用户在逗号,句 号,问号,感叹号,分号等标点符号处进行数据分帧。因数据传输需要时间,在标点符号处分帧,连贯 性更好,且可避免词组被硬性切断的现象(例如“银行”一词,“银”在前一帧数据,“行”在后一帧 数据)。 4.4 命令帧举例 4.4.1 语音合成播放命令 数据区 帧结构 帧头 数据区 长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD
29、0x00 0x0B 0x01 0x00 宇音天下 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2 0xC1 数据帧 0xFD 0x00 0x0B 0x01 0x00 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2 0xC1 说明 播放文本编码格式为“GB2312”的文本“宇音天下”,不带背景音乐 数据区 帧结构 帧头 数据区 长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x0B 0x01 0x01 宇音天下 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2 0xC0 数据帧
30、 0xFD 0x00 0x0B 0x01 0x01 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2 0xC0 说明 播放文本编码格式为“GBK”的文本“宇音天下” ,不带背景音乐 数据区 帧结构 帧头 数据区 长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x0B 0x01 0x02 宇音天下 0XA6 0x74 0xAD 0XB5 0Xa4 0XD1 0XA4 0x55 0xBB 数据帧 0xFD 0x00 0x0B 0x01 0x02 0XA6 0x74 0xAD 0XB5 0XA4 0XD1 0XA4 0x55 0xBB 说明 播
31、放文本编码格式为“BIG5”的文本“宇音天下” ,不带背景音乐 帧结构 帧头 数据区 数据区 SYN6288 中文语音合成芯片数据手册 第 16 页 / 共 39 页 2011年 9 月 6日更新 长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x0B 0x01 0x03 宇音天下 0x8b 0xed 0x97 0xf3 0x59 0x29 0x4e 0x0b 0Xc3 数据帧 0xFD 0x00 0x0B 0x01 0x03 0x8b 0xed 0x97 0xf3 0x59 0x29 0x4e 0x0b 0xC3 说明 播放文本编码格式为“Unicode”的文本“宇
32、音天下” ,不带背景音乐 数据区 帧结构 帧头 数据区 长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x0B 0x01 0x09 宇音天下 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2 0xC8 数据帧 0xFD 0x00 0x0B 0x01 0x09 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2 0xC8 说明 播放文本编码格式为“GBK”的文本“宇音天下”时,同时播放背景音乐1 数据区 帧结构 帧头 数据区 长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x0B 0x0
33、1 0x79 宇音天下 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2 0xB8 数据帧 0xFD 0x00 0x0B 0x01 0x79 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2 0xB8 说明 播放文本编码格式为“GBK”的文本“宇音天下”时,同时播放背景音乐15 数据区 帧结构 帧头 数据区 长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x08 0x01 0x01 v11 0x5B 0x76 0x31 0x31 0x5D 0x85 数据帧 0xFD 0x00 0x08 0x01 0x01 0
34、x5B 0x76 0x31 0x31 0x5D 0x85 说明 播放文本“v11”,芯片会识别成:设置音量为11级 4.4.2 设置波特率命令 数据区 帧结构 帧头 数据区长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x03 0x31 0x00 0xCF 数据帧 0xFD 0x00 0x03 0x31 0x00 0xCF 说明 设置波特率为:9600bps 数据区 帧结构 帧头 数据区长度 命令字 命令参数 待发送文本 异或校验 SYN6288 中文语音合成芯片数据手册 第 17 页 / 共 39 页 2011年 9 月 6日更新 数据 0xFD 0x00 0x03
35、 0x31 0x01 0xCE 数据帧 0xFD 0x00 0x03 0x31 0x01 0xCE 说明 设置波特率为:19200bps 数据区 帧结构 帧头 数据区长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x03 0x31 0x02 0xCD 数据帧 0xFD 0x00 0x03 0x31 0x02 0xCD 说明 设置波特率为:38400bps 4.4.3 停止合成命令 数据区 帧结构 帧头 数据区长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x02 0x02 0xFD 数据帧 0xFD 0x00 0x02 0x02 0xFD 说
36、明 停止合成命令 4.4.4 暂停合成命令 数据区 帧结构 帧头 数据区长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x02 0x03 0xFC 数据帧 0xFD 0x00 0x02 0x03 0xFC 说明 暂停合成命令 4.4.5 恢复合成命令 数据区 帧结构 帧头 数据区长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x02 0x04 0xFB SYN6288 中文语音合成芯片数据手册 第 18 页 / 共 39 页 2011年 9 月 6日更新 数据帧 0xFD 0x00 0x02 0x04 0xFB 说明 恢复合成命令 4.4.6
37、 芯片状态查询命令 数据区 帧结构 帧头 数据区长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x02 0x21 0xDE 数据帧 0xFD 0x00 0x02 0x21 0xDE 说明 通过该命令来判断TTS 模块是否正常工作,以及获取相应返回参数,返回0x4E 表明芯片仍在合成 播音中,返回0x4F 表明芯片处于空闲状态 4.4.7 芯片进入 Power Down 模式命令 数据区 帧结构 帧头 数据区长度 命令字 命令参数 待发送文本 异或校验 数据 0xFD 0x00 0x02 0x88 0x77 数据帧 0xFD 0x00 0x02 0x88 0x77 说明
38、 进入POWER DOWN 状态命令,复位后恢复 5. 文本控制标记 5.1 文本控制标记列表 作用 标识 类型 控制 标识 详细说明 芯片 默认 设置前景文本播放音量 (含提 示音效) 全局 v? ? 为音量值,取值:016 (其中0为静音) ? 为其它无符号整数时,将视为最大音量值16处理 v10 设置背景音乐音量 全局 m? ? 为音量值,取值:016 (其中0为静音) m4 SYN6288 中文语音合成芯片数据手册 第 19 页 / 共 39 页 2011年 9 月 6日更新 ? 为其它无符号整数时,将视为最大音量值16处理 设置词语语速 (针对自然朗读方式) 全局 t? ? 为词语语
39、速值,取值:05 ? 为其它无符号整数时,将视为最高词语语速值5处理 0级为最慢词语语速,5级为最快词语语速。注意:对于 Word-by-Word朗读方式不支持词语语速调节 t4 设置数字处理策略 全局 n? ? 为0,自动判断 ? 为1,数字作号码处理 ? 为2,数字作数值处理 ? 为其它无符号整数时,将视为整数0处理 n0 设置号码中“1”的读法 全局 y? ? 为0,合成号码时“1”读成“幺” ? 为1,合成号码时“1”读成“一” ? 为其它无符号整数时,将视为整数0处理 y0 设置提示音处理策略 全局 x? ? 为0,不使用提示音 ? 为1,默认使用提示音 ? 为其它无符号整数时,将视
40、为整数0处理 x1 设置标点是否读出 全局 b? ? 为0,不读标点 ? 为1,读标点 ? 为其它无符号整数时,将视为整数0处理 b0 设置文本朗读方式 全局 o? ? 为0,设置为自然朗读方式 ? 为1,设置为Word-By-Word方式 ? 为其它无符号整数时,将视为整数0处理 o0 恢复默认的全局合成参数 d 所有以下全局标识恢复为默认值 强制后一个汉字按姓氏发音 临时 r 此控制标记后的1个汉字强制读成姓氏(主要用于多音 字姓氏的处理),若没有紧跟1个汉字,则此控制无效强制后两个汉字组成两字词 临时 2 此控制标记后的2个汉字强制读成“两字词”,若没有 紧跟2个汉字,则此控制无效 强制
41、后三个汉字组成三字词 临时 3 此控制标记后的3个汉字强制读成“三字词”,若没有 紧跟3个汉字,则此控制无效 注意: 1) 所有的控制标识均为半角字符。 2) 控制标识需要按照语音合成命令的格式发送, 特殊控制标记作为文本进行合成, 即合成命令是 “帧头 + 数 据区长度 + 合成命令字 + 文本编码格式 + 特殊控制标记文本”的格式。 3) 控制标识为全局控制标识,也就是只要用了一次,在不对芯片复位或者断电的条件下,其后发送给芯片 的所有文本都会处于它的控制之下,除非用相应的 d恢复默认设置。 4) 当芯片掉电或是复位后,芯片将恢复到所有的默认值,原来的设置过的标识失去了作用,需要重新设置。
42、 5) 不符合以上可识别的“控制标识”的或者格式不对的,一律按普通的字符和数字处理 注意: SYN6288 中文语音合成芯片数据手册 第 20 页 / 共 39 页 2011年 9 月 6日更新 d v? m?这3个控制标记不能随意在播放文本中出现(容易发生理解歧义),只能有以下应用(其它控 制标记没有此约束) 单独作为一帧数据发送,此时对下一帧开始的数据发生作用 - 适合单独改变 第1帧: v5 解释:设置前景音量为5级 第1帧: 欢迎光临 解释:按5级前景音量播放“欢迎光临” 和其它控制标记一起作为一帧数据发送,此时对下一帧开始的数据发生作用。注意:在后的控制标 记的优先权高于在先的控制标
43、记 - 适合上位机初始化调用 第1帧: dv5m2o0 解释:先恢复默认全局变量,再设置前景音量为5级,背景音 量为2级,按自然方式朗读 第2帧: 欢迎光临 解释:按5级前景音量2级背景音量播放“欢迎光临” 放在播放文本的开头和播放文本一起发送,此时对本帧开始的数据发生作用。- 适合和播放文本一 起发送和改变 第1帧: v6m2欢迎使用语音合成芯片 解释:从本帧数据开始按6级前景音量2 级背景音量播放:即按6级前景音量2级背景音量播放“欢迎使用语音合成芯片”。 5.2 文本控制标记使用示例 5.2.1 标记v? -前景播放音量 示例文本 芯片解释 v6欢迎使用语音合成芯片 从本帧数据开始按6级
44、前景音量播放:即按6级前景音 量播放“欢迎使用语音合成芯片”,以后的数据帧也 按6级前景音量播放。 5.2.2 标记m?-背景音乐音量 示例文本 芯片解释 m2欢迎使用语音合成芯片 从本帧数据开始按2级背景音量播放:即按2级背景音 量播放“欢迎使用语音合成芯片”,以后的数据帧也 按2级背景音量播放。 SYN6288 中文语音合成芯片数据手册 第 21 页 / 共 39 页 2011年 9 月 6日更新 5.2.3 标记t? -词语语速 示例文本 芯片解释 欢迎使用t0北京宇音天下t5语音合成芯片 按默认4级正常词语语速播放“欢迎使用”,再按0级 最慢词语语速播放“北京宇音天下”,再按5级最快词
45、 语语速播放“语音合成芯片” 5.2.4 标记n? -数字处理策略 示例文本 芯片解释 n0234343545 芯片自动判断。 读作:两亿三千四百三十四万三千五百四十五 n1234343545 芯片强制按照号码的方式合成数字串。 读作:二三四三四三五四五 n2234343545 芯片强制按照数值的方式合成数字串。 读作:两亿三千四百三十四万三千五百四十五 5.2.5 标记y? -号码1的读法 示例文本 芯片解释 y0010-62986600 芯片按照“幺”的读法合成号码文本中的“1”。读作: 零幺零,六二九八六六零零 y1010-62986600 芯片按照“一”的读法合成号码文本中的“1”。读
46、作: 零一零,六二九八六六零零 注:此标记必须是在合成号码类型文本的时候才有效。 5.2.6 标记x? -提示音策略 示例文本 芯片解释 x0ringa sounda 不按提示音处理,直接读成英文字母: r-i-n-g-a s-o-u-n-d-a x1ringa sounda 按提示音处理:播放和弦ringa,再播放信息提示音 sounda SYN6288 中文语音合成芯片数据手册 第 22 页 / 共 39 页 2011年 9 月 6日更新 5.2.7 标记b? -标点策略 示例文本 芯片解释 b0 欢迎光临,请进! 标点符号不读出,读成:“欢迎光临 请进” b1 欢迎光临,请进! 读出标点
47、符号, 读成:“欢迎光临 逗号 请进 感叹 号” 5.2.8 标记o? -文本朗读方式 示例文本 芯片解释 o0 欢迎使用宇音天下研制的中文语音合成芯片 按比较自然的方式朗读 o1 欢迎使用宇音天下研制的中文语音合成芯片 按 Word By Word 方式朗读 5.2.9 标记d -恢复默认 示例文本 芯片解释 v11n1123, y1010-62986600, r1曲田芳 按11级音量读成:一二三,零一零,六二九八六六零 零,曲(qu3)田芳 d123, 010-62986600, 曲田芳 所有全局控制标记全部恢复成默认! 按默认8级音量读成:一百二十三,零幺零,六二九八 六六零零,曲(qu1)田芳 5.2.10标记r -按姓氏发音 示例文本 芯片解释 单位的单小虎走过来了 单小虎:读作:dan1 xiao2 hu3 单位的r单小虎走过来了 单小虎:读作:shan4 xiao2 hu3 5.2.11标记2和3-强制组词 注:本芯片能正确切分词组达到 98%以上,由于汉语语义的复杂性,任何产品不可