收藏 分享(赏)

《语音信号处理》上机实验指导书.doc

上传人:dzzj200808 文档编号:2265057 上传时间:2018-09-08 格式:DOC 页数:7 大小:68KB
下载 相关 举报
《语音信号处理》上机实验指导书.doc_第1页
第1页 / 共7页
《语音信号处理》上机实验指导书.doc_第2页
第2页 / 共7页
《语音信号处理》上机实验指导书.doc_第3页
第3页 / 共7页
《语音信号处理》上机实验指导书.doc_第4页
第4页 / 共7页
《语音信号处理》上机实验指导书.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

1、北京信息科技大学语音信号处理实 验 指 导 书李红莲 编光电信息与通信工程学院二九年二月 目 录实验一 语音信号的时域特征与频域特征.3一、实验目的. 3二、实验内容. 3三、实验原理. 3四、实验方法与实验步骤. 3 五、思考题.4六、实验报告要求.4实验二 语音信号的基本参数提取与矢量量化.5一、实验目的. 5二、实验内容. 5三、实验原理. 5四、实验方法与实验步骤. 5 五、思考题 .6六、实验报告要求.7实验一:语音信号的时域特征与频域特征实验项目:语音信号的时域特征与频域特征实验项目性质:验证性实验课程:语音信号处理计划学时:4 学时一、实验目的使学生通过本实验观察语音信号在时域和

2、频域的基本特征(语音波形、基音频率、过零数、共振峰) ,验证教材中关于语音信号在时域和频域的基本特征的概念与论述;通过采集语音数据与在实验中记录每个元音的基音周期、过零数、共振峰等环节熟悉这些语音的基本特征,为今后深入学习语音信号处理奠定基础。二、实验内容学习音频编辑软件 Cool Edit 的使用方法及语音文件的建立;采集语音数据;观察语音波形;记录每个元音的基音周期(其倒数为基音频率) 、过零数、共振峰;观察语音频域特征;分析不同元音的共振峰模式的特点(频率、相对振幅) 。三、实验原理元音与辅音在发音方法有如下基本区别:发元音时气流顺利通过声腔,声带颤动,形成的声波是周期性的;发辅音时气流

3、暂时被阻不能通过或只能勉强挤出去。元音具有基音与共振峰结构,辅音则不具有这两者。 基音由声带振动频率产生,决定语音的音高、音调。在语音波形中表现为准周期峰值。共振峰是语音频谱上的强频区,表现为频谱上呈峰状。共振峰由声腔形状的变化决定,不同的声腔形状有不同的固有频率,产生不同的共振峰模式。每个元音有特定的共振峰模式。四、实验方法与实验步骤(一)音频编辑软件 Cool Edit 的使用方法及语音文件的建立 点击桌面上“cool edit”图标,选不同项可激活 cool edit 菜单中不同功能。 点击“file”菜单中的“new” ,设抽样频率为 8KHz,单声道“mono” , “8 bit”。

4、 点击“Record”录音,将录音存成“.wav”文件。 点击菜单中“View”中的“Spectral View”可观看语谱图。 点击菜单中“Analyze”中的“Frequence Analysis”可分析频谱。 点击菜单中“Effects”中的“Amplitude”可改变幅度。其它菜单功能可通过点击试验熟悉。(二)观察语音时域特征在 E 盘或 D 盘建立实验者本人的文件夹,然后做以下实验。 发【a】 、 【i】 、 【e】 、 【u】这四个元音,由麦克风采集语音数据,分别存成“a.wav”、“i.wav”、 “e.wav”、 “u.wav”文件,存在本人的文件夹中。 利用 Cool Edi

5、t 打开并观察以上语音数据的波形。元音波形中的准周期结构与声带振动频率对应,其周期称为“基音周期” (其倒数为基音频率) ,利用 Cool Edit 观察元音的波形,记录每个元音的前部、中部和后部的各一个基音周期。记录每个元音的任意一个基音周期中的过零数。 共振峰是语音频谱的峰状区域,利用 Cool Edit 观察上述每个元音的频谱,记录每个元音的前三个共振峰的数值。(三)观察语音频域特征对你发的【a】 、 【i】 、 【e】 、 【u】这四个元音中每一个元音,分别选取稳定段的 256 个抽样,利用 Matlab 的 FFT 计算其频谱,并利用 subplot 命令以波形和频谱对应的形式画出图

6、形。部分参考程序如下y = wavread(e.wav);t=1:length(y)y2 = wavread(e.wav,4000 4512);y2F=fft(y2);subplot(3,1,1)plot(t,y,-b,4000,0.2:0.005:0.4,-r,4512,0.2:0.005:0.4,-r)subplot(3,1,2)plot(y2);grid onsubplot(3,1,3)plot(log(abs(y2F);grid on五、思考题(1)共振峰与语音波形有什么相关之处? (2)基音周期与音调的高低有什么对应关系?六、实验报告要求(1)简述实验目的、实验原理和实验任务;(2)

7、逐个说明本人所发的【a】 、 【i】 、 【e】 、 【u】这四个元音的基音频率、稳定段的 256 个抽样的过零数及共振峰。设计适当的表格,包括发音人姓名、发的哪一个元音,将记录下来的基音频率、过零数、共振峰以表格的形式列出。(3)分析不同元音的共振峰模式的特点(频率、相对振幅) 。(4)对你发的【a】 、 【i】 、 【e】 、 【u】这四个元音中每一个元音,分别选取稳定段的 256 个抽样,利用 Matlab 的 FFT 计算其频谱。画出每一个元音的波形图与频谱图。(5)收获与体会。实验二:语音信号的基本参数提取与矢量量化实验项目:语音信号的基本参数提取与矢量量化实验项目性质:综合性实验课

8、程:语音信号处理计划学时:4 学时一、实验目的使学生通过本实验掌握提取并观察线性预测系数(lpc) 、倒频谱(cep) 、反射系数(k)等几种常用的语音参数;熟悉特征矢量、矢量形成、矢量空间、区域边界、距离测度、码本、聚类等概念,加深理解矢量量化(VQ)的原理;掌握基本的 VQ 实现方法,为进一步掌握语音识别等实际应用技术奠定基础。二、实验内容(1) 利用 Matlab 对元音提取并观察线性预测系数(lpc) 、倒频谱(cep) 、反射系数(k)等几种常用的语音参数。对比不同元音之间的参数。(2) 比较标量量化与矢量量化的异同点,熟悉特征矢量、矢量形成、矢量空间、区域边界、距离测度、码本、聚类

9、等概念,加深理解矢量量化(VQ)的原理。(3) 通过编程实现简单的 VQ 过程,掌握基本的 VQ 实现方法。三、实验原理 (1) 线性预测系数(lpc) 、倒频谱(cep) 、反射系数(k)是几种常用的语音参数,可以形成特征矢量,矢量量化的码本中的码字就是由特征矢量构成的;(2) 矢量量化是将若干个标量数据构成一个矢量,然后在矢量空间中给以整体量化;(3) 矢量量化的方法:确定包含 M 个码字的码本,每个码字是由 P 个参数构成一个特征矢量;将语音信号的每一帧提取与码本中的码字相同形式的由 P 个参数构成的特征矢量;将输入信号的特征矢量与码本中的每一个码字相比较并被量化为距离最小的码字的矢量值

10、,将该码字的下标(标号)作为输出。(4) 在本实验中码本是给定的。(5) 矢量量化的原理框图:图 1 矢量量化的原理框图四、实验方法与实验步骤(1) 语音参数提取参考如下程序,利用 Matlab 编程对每个元音提取并观察线性预测系数(lpc) 、倒频谱(cep) 、反射系数(k)等几种常用的语音参数,以适当的表格将数据记录下来。画出便于观察与对比不同元音之间参数的图形。xa=wavread(a.wav,501 756);ca=rceps(xa); % 提取倒频谱(cep)aa,ea,ka=aryule(xa,8); % 提取反射系数(k)aa2=lpc(xa,8); % 提取线性预测系数( l

11、pc)subplot(4,4,1);plot(xa)subplot(4,4,2);plot(ca)subplot(4,4,3);bar(aa)(2) 本实验中给定的矢量量化的码本本实验中给定的矢量量化的码本有 4 个码字,特征矢量采用线性预测系数(LPC 参数) ,分析阶数 P8,码字矢量维数 K9,给定码本中的码字如下:Y1 ( ) Ya876543210 ,aa= (1,-1.77891, 1.43475,-0.87491, 0.51574, -0.35793, 0.25688, 0.22895, -0.27550)Y2 ( ) Ye876543210 ,= (1, -1.74811, 1

12、.44779,-0.42867,-0.72046, 0.43426,码本Yj (j=1,2,.码本Yj (j=1,2,.矢量形成XYj min=min-1 d( X, Yj )Yj 0.31352,-0.70315, 0.50096)Y3 ( )Yi876543210 , aa= (1,-1.88931, 1.68912,-1.20478, 0.72695,-0.81863, 1.14223,-0.92035 0.33845)Y4 ( ) Yu876543210 ,= (1,-1.97814, 1.40744,-0.52973, 0.10981,-0.68175, 1.37006,-0.87

13、356, 0.20293)(3) 发【a】 、 【i】 、 【e】 、 【u】这四个元音,由麦克风采集语音数据,分别存成 “a.wav”、“i.wav”、 “e.wav”、 “u.wav”文件,存在文件夹YINSU中。(4) 对文件夹YINSU中每个语音取一段提取 8 阶线性预测系数( LPC 参数) ,形成特征矢量。(5) 采用欧氏距离(d=sum(a-b).2)) ,对文件夹YINSU中每个音素进行矢量量化,记录每个音素与码本中各个码字的距离与量化结果。(6) 采用最大似然比失真测度,对文件夹YINSU中每个音素进行矢量量化。记录每个音素与码本中各个码字的距离与量化结果。五、思考题矢量量化在高度压缩信息方面的高性能是有代价的,其代价是什么?六、实验报告要求(1) 简述实验目的、实验原理和实验任务;(2) 将记录下来的【a】 、 【i】 、 【e】 、 【u】这四个元音的线性预测系数(lpc) 、反射系数(k)以表格的形式列出;(3) 说明矢量量化的基本原理;(4) 说明采用欧氏距离,对文件夹YINSU中每个音素进行矢量量化所得到的结果;(5) 说明采用最大似然比失真测度,对文件夹YINSU中每个音素进行矢量量化的结果;(6) 收获与体会。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报