几种TTS软件的安装.doc-道客多多

资源描述

1、IVONA 的安装此程序的安装默认语言为 polskj，安装时选择 ednglish。按屏幕提示正常安装即可。在安装时要注意安装路径，之后安装语音库时默认路径即可。安装完毕后，系统会提示安装语音库，此时的安装是在线安装，语音库我们已经全部下载，在此我们直接点击完成。语音库的安装：下载的语音库共有 8 种（以后还会陆续增加），分美式英语和英式英语。安装过程基本按默认提示即可，需要注意的是语音库的安装要跟主程序在同一目录下。操作说明：双击 IVONA Render 启动程序：此项可以直接调用网页或 DOC 文档，进行阅读。：此项可以将阅读内容保存为 mp3 格式。：这个按钮的作用跟上面的保存成

2、mp3 格式一样的功能。可以选择不同的文件格式及声音采样质量。：打开一个新窗口：音量控制钮：语速控制钮：播放控制按钮：语音库，根据需要选择不同的声音。中科大讯飞 Interphonic.5.0 语音合成系统的安装能说会道 XP在软件功能介面，中文 TTS 语音组件一定要安装（默认选项），不要作修改能说会道 XP 支持中音混读，同时也支持多家公司的语音库。ScanSoft-MeiLing-ChineseMandarinVoice 汉语普通话女声的安装：安装目录可以自行修改，建议选用默认。能说会道 XP 的制作过程很简单的，这里按照大致步骤总结一下。第 1 步，准备工作首先是安装好喜欢的语音库，

3、以便提高语音质量。第 1 步，选择合适的音频格式和 MP3 编码质量打开“设置”窗口，翻至“ 音频编码 ”页面媒体格式可以选择 MP3，表示此次会将文本内容转换为 MP3 输出，软件另外还支持 WAV的波形格式，音频质量中的音频格式选项是指采样率，位数，立体声或单声道等，一般选择 22kHz 16 Bit Mono 即可，有些语音包在 16kHz 16 Bit Mono 时效果最好，可以试听一下根据需要选择合适的格式。这里顺便介绍一下“朗读时总使用最优质量”选项的作用。当需要试听上述“音频格式”的具体效果时，要把此选项的打勾去掉，表示在朗读时也使用这里选定的音频格式。当选项打勾时，则“能说会道

4、 XP”在平时朗读时会忽略这里的 “音频格式” 设置，而会使用语音包默认的最优质量。MP3 编码质量是设置进行 MP3 压缩时的采样比特率，采用可变的采样比特率能够在输出文件大小适中的前提下，获得更好的压缩质量。第 2 步，设置是否生成 LRC 歌词文件点击“歌词生成” 页面制作对应的歌词文件能够在播放 MP3 时，同时看到具体的朗读内容，简单的说就是有字幕了，这在进行语言学习等场合下是十分有用的。如果希望同时生成字幕文件，那么就在“为 MP3 生成 LRC 歌词文件”选项前打勾即可“能说会道 XP”默认会根据句子来生成歌词文件，这里可以设置 “限制每行歌词的文字数量”，这样生成的每句歌词就不

5、会特别长了。另外，一般情况下，中文会占用 2 个英文字母的位置，可以选中“中文占用 2 个字符位置”，这样，当设置的文字数量是 36 时，实际生成的每句歌词要么包含有 36 个英文（和空格），或者 18 个中文（和空格），当中文和英文混合时，会自动确定能够容纳的文字数。第 3 步，开始转换做好上面的设置后，就直接按“确定”按钮保存设置，然后在主窗口的“工具”菜单下选择“ 导出为媒体文件”菜单项，然后会弹出“保存为” 的文件保存对话框，选择希望的保存位置即可开始转换了。句子停顿设置是一个“能说会道 XP”非常古老的功能，早在 2000 年推出的第一个版本时就带有该功能，但该项设置带来的效果并

6、非只是让文章在朗读时语音上有所停顿那么简单，因此有必要重新熟悉一下这个“古老的”功能，让我们一起来看吧。首先来看看，进行这项设置以后，除了朗读时的停顿以外，其他方面还有什么变化，我们做个实验：1，首先使用上图所示的默认设置，此时进行朗读时：2，随后修改停顿符设置，选中逗号3，再进行朗读时很明显，指示的当前朗读内容也按照逗号进行分开了那么有什么用呢，最简单的，使用“能说会道 XP”重复朗读功能时，所重复朗读的内容就是高亮指示的内容，因此，这样就变化了重复朗读的范围。实例一：用“能说会道 XP”背单词举一个实际的例子，譬如我们想要通过单词表来学习英语单词，希望对每个单词进行重复朗读来加深印象：ab

7、andon丢弃；放弃，抛弃ability能力；能耐，本领abnormal不正常的；变态的aboard在船(车) 上；上船我们希望能够按行来朗读这些内容，这样就可以先听到单词的读音，再听到单词的中文意思，很适合单词学习。那么“能说会道 XP”能够进行按行朗读吗，这时候 “停顿符设置” 就派上用场了，其实“按行朗读”就是在换行的时候进行停顿，其他都不停顿，这样一想就好办了，在“英文停顿符” 页面选中“ 回车/换行符”，其他打勾统统去掉，也就是不停顿，如下图，另外也记得把“中文停顿符”设置页面的所有打勾也去掉哦，这样中文解释中间就不会分开了然后再朗读背单词的文件，就可以看到是根据单词来停顿了：配合自

8、动重复朗读功能，就可以反复听每个单词的读音了，很适合学单词、背单词哦实例二：制作背单词的 MP3 和 LRC 文件“停顿符设置”同样对生成的 LRC 歌词文件有效，你所看到的朗读分句方式也就是 LRC 歌词文件的分句方式，很直观方便吧。之前有用户反馈说“能说会道 XP”生成的 LRC 歌词每句都太长了，有没有什么办法解决，其实这种情况下就可以使用“句子停顿”设置，把“逗号”设置成停顿符后，就可以把句子分的更短了。我们再来看一个实例，还是用上面的单词表来做例子，如果我们希望制作一个背单词的MP3，并且同时希望输出一个 LRC 的歌词，以便在手机上播放时也能看到单词本身，这样眼睛耳朵同时用，肯定事

9、半功倍哦我们用“能说会道 XP”的 MP3 输出功能后，果然发现 LRC 歌词文件也是按行来生成的了：ti大学英语四级单词by能说会道 XP 2.8500:00.00abandon 00:05.73丢弃；放弃，抛弃00:08.44ability00:09.28能力；能耐，本领00:11.92abnormal00:12.85不正常的；变态的00:15.22aboard00:16.00在船( 车)上；上船00:19.18今天收到一个用户的来信，希望制作一段男女声的对话，用男女声依次朗读，作为英语听力材料。对于“能说会道 XP”而言，中英文是可以采用两个朗读者来朗读的，如果同样是英文时，就不会切换，

10、因此直接得到男女生的英文对话看上去是不可能的。但是，我们还有另外一个武器，那就是“分句输出”功能，通过“ 分句输出 ”可以灵活的解决这个问题。具体怎么做呢，先说说大致的想法， “分句输出”能够将每个句子转换成一个 MP3 文件，那么如果第一次用男声来读得到所有的句子（例如得到的文件为：对话_句 1.mp3、对话_句2.mp3、对话_句 3.mp3），第二次用女生来读又得到一遍所有的句子（对话 _句 1.mp3、对话_句 2.mp3、对话_句 3.mp3），这样如果我们想要男女生对话，其实就是挑出男声的 “对话_句 1.mp3”，挑出女声的“ 对话_句 2.mp3”，再挑出男声的 “对话_句

11、 3.mp3”，以此类推，这样就算再复杂的对话内容，总也可以通过这种方法完美的组合成一个对话。当然最后挑的过程需要人来参与。具体制作步骤：1，打开设置界面，在“输出方式”页面将“ 输出方式”选择为“ 分句输出”2，在“英文语音属性” 页面选择一个英文男声朗读角色作为“英文朗读者”3，在“音频编码” 页面选择“ 媒体格式 ”为 MP3，并按动最下方的 “确定”4，打开你希望转换的英语文章5，选择“工具”菜单下的“ 转换为媒体文件 ”，建议创建一个新目录，命名为“ 男声”，然后填写一个文件名，例如“对话_句”后“ 保存”，这样就在“男声”这个文件夹中得到（对话_句1.mp3、对话_句 2.mp3、

12、对话_句 3.mp3。。。）6，等待转换完成，转换根据文章的大小，需要大量的磁盘空间，如果空闲的磁盘空间太小会转换失败7，再回到第 2 步，这次选择一个英文女声朗读角色作为“英文朗读者”8，转到第 5 步重新转换一次，这次新建一个“女声”的文件夹，填写的文件名一样，然后“保存”，这样就在“ 女声”这个文件夹中得到（对话_句 1.mp3、对话_句 2.mp3、对话_句3.mp3。。。）9，这样你就得到了所有用男声朗读的句子和所有用女声朗读的句子，你可以在这两个目录中挑选需要的内容最后形成男女声对话，可以再创建一个目录，命名为“对话”，将挑出来的文件复制到这个目录下，例如挑出“男声”目

13、录下的“ 对话 _句 1.mp3”，挑出“ 女声”目录下的“对话_句 2.mp3”，再挑出“男声”目录下的“对话_句 3.mp3”，以此类推10，需要播放这个对话的时候，就把“对话”目录中所有 MP3 文件在支持播放列表的媒体播放器中打开，只要播放列表的顺序正确，就能得到完美的对话了1，实际效果演示“百见不如一闻” ，我们用新概念英语中的一篇短文来实际感受一下使用“能说会道 XP”制作中英文资料的具体效果：Last week I went to the theatre.上星期我去看戏。I had a very good seat.The play was very interesting.I

14、did not enjoy it.我的座位很好，戏很有意思，但我却无法欣赏。A young man and a young woman were sitting behind me.They were talking loudly.一青年男子与一青年女子坐在我的身后，大声地说着话。I got very angry.I could not hear the actors.我非常生气，因为我听不见演员在说什么。I turned round.I looked at the man and the woman angrily.They did not pay any attention.我回过头去怒视

15、着那一男一女，他们却毫不理会。In the end, I could not bear it.I turned round again.I cant hear a word! I said angrily.最后，我忍不住了，又一次回过头去，生气地说：“我一个字也听不见了！”Its none of your business, the young man said rudely. This is a private conversation!.“不关你的事， ”那男的毫不客气地说， “这是私人间的谈话！ ”使用如下语音包时的效果：英文语音角色：Microsoft Mary中文语音角色：ScanS

16、oft Mei-Ling_Full_22kHz音频格式：22kHz 16Bit Mono制作的 MP3 下载： http:/www.iarts- Julie中文语音角色：VM Hui音频格式：16kHz 16Bit Mono制作的 MP3 下载： http:/www.iarts- VM（即 NeoSpeech）语音角色的效果相对更好。因此，要使制作的语音资料更完美，譬如用于制作“真人播音片段”或者“语音广告” 等，那么选择一个专业的语音角色是王道。我们这里推荐专业用户选择NeoSpeech 的语音角色包。2，安装质量更好的语音包如果希望获得专业级的语音质量，我们推荐您使用 NeoSpeech

17、的语音包，具体请参考：NeoSpeech 语音合成引擎3，选用合适的音频格式设置每个语音角色都有它的“本征分辨率”，就好像上文中讲到，使用 NeoSpeech 的语音包时，需要将“音频格式” 设置为 16kHz 16Bit 时才有最好的效果，而其他语音包这需要设置为“22kHz 16bit”，这就是语音角色默认的音频格式，采用语音角色的默认音频格式时不需要额外的转换与处理，因此能保证最佳效果。那么具体如何确定每个语音角色的默认音频格式呢，当然首先是看该语音角色的使用说明，可能包含了这些基本信息。如果没有默认格式的说明，那么您可以通过试听的方法来获知哪种“音频格式” 设置下具备最好的效果。具体方

18、法是：首先将“朗读时总使用最优质量”的打钩去掉，这样在平时朗读时就能获得与转换 MP3 相同的效果。然后换用不同的“音频格式”设置，用软件播放一下，听听哪个设置下具备最好的效果即可。另外，尽量不要让两种具备不同最佳音频格式的语音包同时使用（即某个作为英文朗读角色，另一个作为中文朗读角色），因为这样会顾此失彼，导致某种语言的朗读效果较好时，另一种却不行，当然这仅在制作 MP3 时会出现，在使用软件直接播放时，只需要选中“朗读时总使用最优质量”就可以分别使用各自的最佳音质。4，启用“可变比特率”MP3 编码如果您希望直接制作出最终使用的音频文件，并且希望便于携带等，那么建议您使用“可变比特率”的

19、 MP3 编码方式，这可以让你生成的 MP3 文件大小适中，又能保持最佳音质。如果您希望制作出的语音资料能够进一步加工，譬如增加背景音乐等，那么建议您直接保存为 Wav 文件，这将方便后期合成与进一步处理。最近收到多位用户来信和留言，均提及“复读”功能：用户一：自从购买了贵公司的能说会道 xp 后，为我的教学工作提供了极大的帮助。我最关注的就是能将文本转换成声音并同时制成 MP3 文件。但在使用过程中，非常需要在转成 MP3 后，每句之间增加一定时间的停顿（就象在“能说会道 xp”软件中那样），不知能加上这个功能否？再者，在软件中播放文本，现在已经能实现手工复读，如果能指定复读次数后，按句子

20、自动实现复读，那就更实用了。请问我这两个愿望能在今后升级中实现否？谢谢！用户二：我想说说我在使用能说会道中遇到的问题：在导出 MP3 的时候，原来设置的句间停顿的时间，无法体现，比如说，我设置的句间停顿时间为 3 秒时，在软件直接朗读时会停顿 3 秒钟，但在导出的 MP3 文件时，发现就没有停顿时间了，我希望能改进这个缺点，同时，我也提点改进意见：最好软件设置得除了中英文的句间都可以停顿外，还有就是中英文句子朗读的次数最好能增加上去于是，在接下来的 V2.73 版中，将会提供如下功能：1，自动按句重复朗读功能：参考如下设置界面，此设置表示的意义是在每个句子正常朗读一次的情况下，额外重复朗读的次数，也就是说，如果设置重复朗读次数是 1 次，那么加上原本就会朗读的 1 次，实际上会将每个句子朗读 2 次。2， “所听即所得” ：句子间停顿设置、上述自动按句重复朗读设置，均同时在导出 MP3 时生效，可谓“所听即所得”，即 MP3 导出的效果与软件朗读时完全一致。（输出方式请选择“全文输出”，在“分句输出”时停顿设置有效，但重复设置无效，原因是完全生成几个一样的 MP3 文件没有必要）界面一览下载：请访问下载页面：http:/www.iarts-

展开阅读全文