1、语音信号数字处理实验指导本课程涉及语音信号处理课程的基本原理和实验技能以及多媒体技术和数字信号处理的基本理论与实验调试方法,重点是掌握语音信号数字处理的一般方法和实验系统。实验一 语音波形文件的分析和读取 一、实验学时:2 学时二、实验的任务、性质与目的:本实验是选修语音信号处理课的电子信息类专业学生的基础实验。通过实验(1)掌握语音信号的基本特性理论:随机性,时变特性,短时平稳性,相关性等;(2)掌握语音信号的录入方式和*.WAV音波文件的存储结构;(3)使学生初步掌握语音信号处理的一般实验方法。三、实验原理和步骤:WAV 文件格式简介WAV 文件是多媒体中使用了声波文件的格式之一,它是以R
2、IFF 格式为标准。每个 WAV 文件的头四个字节就是 “RIFF”。WAV 文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV 文件标识段和声音数据格式说明段两部分。常见的WAV 声音文件有两种,分别对应于单声道(11.025KHz 采样率、8Bit 的采样值)和双声道(44.1KHz 采样率、16Bit 的采样值) 。采样率是指声音信号在“模拟数字”转换过程中,单位时间内采样的次数;采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为 8 位的短整数(short int 00H-FFH) ;而对于双声道立体声声音文件,每次采样数据为一个 16 位的
3、整数(int) ,高八位和低八位分别代表左右两个声道。WAV 文件数据块包含以脉冲编码调制(PCM)格式表示的样本。在单声道 WAV 文件中,道 0 代表左声道,声道 1 代表右声道;在多声道 WAV 文件中,样本是交替出现的。WAV 文件的格式见表 1。偏移地址字节数 数据类型内 容文件头00H 4 char “RIFF“标志04H 4 long int 文件长度08H 4 char “WAVE“标志0CH 4 char “fmt“标志10H 4 过渡字节(不定)14H 2 int 格式类别(10H 为 PCM 形式的声音数据)16H 2 int 通道数,单声道为 1,双声道为 218H 2
4、 int 采样率(每秒样本数) ,表示每个通道的播放速度1CH 4 long int 波形音频数据传送速率,其值为通道数每秒数据位数每样本的数据位数8。播放软件利用此值可以估计缓冲区的大小。20H 2 int 数据块的调整数(按字节算的) ,其值为通道数每样本的数据位值8。播放软件需要一次处理多个该值大小的字节数据,以便将其值用于缓冲区的调整。22H 2 每样本的数据位数,表示每个声道中各个样本的数据位数。如果有多个声道,对每个声道而言,样本大小都一样。24H 4 char 数据标记符data28H 4 long int 语音数据的长度表 1 wav 文件格式说明表(1)选取 WINDOWS
5、下 MEDIA 中的任一 WAV 文件,采用播放器进行播放,观察其播放波形,定性描述其特征;(2)根据 WAV 文件的存储格式,利用 MATLAB 或 C 语言,分析并读取文件头和数据信息;(3)将文件的通道数、采样频率、样本位数和第一个数据读取并显示出来。四、实验设备PC机。五、实验方式和要求:1由指导老师讲解实验的基本要求,完成的任务操作要领及注意事项。2实验1人一组,由学生独立操作完成实验。3学生在完成预习报告后才能进入实验室进行实验。4实验结束后提交一份实验报告。指导教师根据实验及报告给出考核成绩。实验二 语音信号的时域参量分析一、实验学时:4 学时二、实验的任务、性质与目的:(1)增
6、强学生对语音时域分析理论的理解,尤其是语音的短时能量、幅度和过零率的的分析和应用;(2)进一步提高学生分析问题和解决问题的能力从而培养学生初步掌握进行科学研究的方法和总结实验结果的能力。三、实验原理和步骤:(1)利用MATLAB或C语言,针对ringout.wav文件,求取语音信号的短时能量函数、短时平均幅度函数和短时平均过零率三大时域参量;三大时域参量的定义式是:短时能量函数和短时平均幅度函数短时平均过零率(2)将三大时域参量的结果用波形图的方式显示出来;(3)分析并标识波形图上的清浊音信息。四、实验设备PC机。五、实验方式和要求:1由指导老师讲解实验的基本要求,完成的任务操作要领及注意事项。2实验1人一组,由学生独立操作完成实验。3学生在完成预习报告后才能进入实验室进行实验。4实验结束后提交一份实验报告。指导教师根据实验及报告给出考核成绩。