1、课程设计任务书学生姓名: 专业班级: 通 信 0906 班 指导教师: 黄铮 工作单位: 信息工程学院 题 目:声音的延时和混响仿真初始条件:MATLAB 软件,电脑要求完成的主要任务:1. 录制一段自己的语音信号,时间控制在 1s 左右,并对录制的信号进行采样。语音信号的频谱分析,画出采样后语音信号的时域波形和频谱图。2. 将信号加入延时和混响,并与原始信号频谱进行比较。3. 设计单回声滤波器,多重回声滤波器,无限个回声滤波器,全通结构的混响器,并画出滤波器的频域响应。用滤波器对语音信号进行滤波。画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化。4. 回放语音信号。
2、时间安排:序号 阶段内容 所需时间1 查阅资料 2 天2 各部分编程 3 天4 调试程序 2 天5 GUI 设计 3 天答辩 1 天合 计 11 天指导教师签名: 2012 年 月 日系主任(或责任教师)签名: 2012 年 月 日 武汉理工大学信息群处理课程设计报告摘要数字信号处理(Digital Signal Processing)技术,从 20 世纪 60 年代以来,随着计算机科学和信息科学发展,数字处理技术应运而生并得以快速发展。 语言是人们进行信息沟通的主要方式之一,它具有直接、自然、方便等优点。语音则是语言的物理层表达方式。语音处理主要是对语音进行机器处理,以达到传输、自动识别、机
3、器理解等目的。进行了语音处理过程的滤波、采样、傅立叶变换和谱包络提取的算法实现研究,讨论了在算法的 DSP 实现方法, Matlab 语言是一种广泛应用于工程计算及数值分析领域的新型高级语言, Matlab 功能强大、简单易学、编程效率高。特别是 Matlab 还具有信号分析工具箱, 不需具备很强的编程能力, 就可以很方便地进行信号分析、处理和设计关键词 语音信号处理 MATLAB 语言 滤波器 频谱分析 GUI武汉理工大学信息群处理课程设计报告IAbstractDigital Signal Processing (Digital Signal Processing) technology f
4、rom the 1960s,along with the development of computer science and information science, digital processing techniques have emerged and to rapid development. Language is the communication of people to one of the main, it has a direct, natural, and easy. Voice is the language of the physical layer of ex
5、pression. Voice processing machines mainly for voice processing, in order to achieve transmission, automatic recognition, machine understanding of other purposes. For voice processing filtering, sampling, Fourier transform and spectral envelope extraction algorithm research, discusses the implementa
6、tion of DSP algorithms, Matlab language is a widely used engineering calculation and numerical analysis of the field of new high-level language, Matlab powerful, easy to learn, programming and high efficiency. Matlab also has a particular signal analysis toolbox, need not have strong programming ski
7、lls, you can easily carry out signal analysis, processing and design Keywords Speech signal processing Spectral analysis of MATLAB Filter Spectrum analysis Graphical User Interface武汉理工大学信息群处理课程设计课程设计说明书20目 录摘要 .IABSTRACT.II1.引言 .51.1 简介 .51.2 设计任务及要求 .62 设计原理 .72.1 语音信号的采样 .72.2 时域分析 .72.3 频域分析 .82.
8、4 延时 .82.5 混响 .92.6 滤波器的设计 .102.7 图形用户界面的设计 .103 设计步骤 .123.1 总体设计流程图 .123.2 详细设计 .133.2.1 语音的录制 .133.2.2 原始信号 .133.2.3 延时 .143.2.4 混响 .153.2.5 单回声滤波器 .173.2.6 多回声滤波器 .183.2.7 无限回声滤波器 .193.2.8 全通滤波器 .214 图形用户界面的设计 .234.1 GUI 布局 .234.2 设置属性 .234.3 编程 .244.4 运行结果 .245 总结 .2参考文献 .3附录 .4武汉理工大学信息群处理课程设计课程
9、设计说明书201.引言1.1 简介数字信号处理主要是研究用数字或符号序列表示和处理信号。处理的目的可以是削弱信号中的多余内容,滤除混杂的噪声和干扰,或者是将信号变换为容易分析和识别的形式,便于估计和选择它的特征参数。语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理。而且,语音合成的音质好坏,语音识别率的高低,也都取决于对语音信号分桥的准确性和精确性。因此语音信号分析在语音信号处理应用中具有举足轻重的地位。根据所分析出的参数的性质的不同,可将语音信号分析分为时域分析、频域分析、倒领域分析等;时域分析方
10、法具有简单、计算量小、物理意义明确等优点,但由于语音信号最重要的感知特性反映在功率谱中,而相位变化只起着很小的作用,所以相对于时域分析来说频域分析更为重要。本文将简要介绍时域分析、频域分析。声音信号是一维连续信号,而计算机只能处理离散信号。为了从离散信号还原连续信号,根据采样定理,可以确定采样频率的最小值。wav 文件是一种数字声音文件格式,本课程设计基于 Matlab 分析了 wav 声音文件频谱与声音的关系。通过采集个人的一段声音进行频谱分析等处理,然后设计数字滤波器处理这个原始声音的 wav 文件,并比较滤波以后输出声音信号与原声音信号的异同。武汉理工大学信息群处理课程设计课程设计说明书
11、201.2 设计任务及要求设计任务:(1)利用 Windows 下的录音机或其他软件,录制一段自己的语音信号,时间控制在 1s 左右,并对录制的信号进行采样。(2)语音信号的频谱分析,画出采样后语音信号的时域波形和频谱图。(3)将信号加入延时和混响,再分析其频谱,并与原始信号频谱进行比较。(4)设计几种特殊类型的滤波器:单回声滤波器,多重回声滤波器,无限个回声滤波器,全通结构的混响器,并画出滤波器的频域响应。(5)用自己设计的滤波器对采集的语音信号进行滤波。(6)分析得到信号的频谱,画出滤波后信号的时域波形和频谱,并对滤波前后的信号进行对比,分析信号的变化。(7)回放语音信号。设计要求(1)熟
12、悉离散信号和系统的时域特性。(2)熟悉语音信号的特点。(3)掌握数字信号处理的基本概念,基本理论和基本方法。(4)掌握序列快速傅里叶变换方法。(5)学会 MATLAB 的使用,掌握 MATLAB 的程序设计方法。(6)掌握 MATLAB 设计各种数字滤波器的方法和对信号进行滤波的方法武汉理工大学信息群处理课程设计课程设计说明书202 设计原理2.1 语音信号的采样(1)采样频率采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。这就是说采
13、样频率是衡量声卡采集、记录和还原声音文件的质量标准。(2)采样位数采样位数即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。采样位数和采样率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要标准。无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。每增加一个采样位数相当于力度范围增加了 6dB。采样位数越多则捕捉到的信号越精确。对于采样率来说你可以想象它类似于一个照相机,44.1kHz 意味着音频流进入计算机时计算机每
14、秒会对其拍照达 441000次。显然采样率越高,计算机摄取的图片越多,对于原始音频的还原也越加精确。(3)采样定理在进行模拟/数字信号的转换过程中,当采样频率 fsmax 大于信号最高频率fmax 的 2 倍时,即:fsmax=2fmax,则采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的 510 倍,采样定理又称奈奎斯特定理。1924 年奈奎斯特(Nyquist)就推导出:在理想低通信道的最大码元传输速率=2W*log2 N (其中 W 是理想低通信道的带宽 ,N 是电平强度)。2.2 时域分析语音信号的时域分析就是分析和提取语音信号的时域参数。进行
15、语音分析武汉理工大学信息群处理课程设计课程设计说明书20时,最先接触到并且也是最直观的是它的时域波形。语音信号本身就是时域信号,因而时域分析是最早使用,也是应用最广泛的一种分析方法,这种方法直接利用语音信号的时域波形。时域分析通常用于最基本的参数分析及应用,如语音的分割、预处理、大分类等。这种分析方法的特点是:表示语音信号比较直观、物理意义明确。实现起来比较简单、运算且少。可以得到语音的一些重要的参数。只使用示波器等通用设备,使用较为简单等。2.3 频域分析在MATLAB的信号处理工具箱中函数FFT和IFFT 用于快速傅立叶变换和逆变换。下面介绍这些函数:(1)函数FFT用于序列快速傅立叶变换
16、。函数的一种调用格式为:y=fft(x)其中,x是序列,y是序列的FFT,x可以为一向量或矩阵,若 x为一向量,y是x的FFT 。且和x相同长度。若 x为一矩阵,则y是对矩阵的每一列向量进行FFT。如果x长度是2的幂次方,函数fft执行高速基2FFT算法;否则fft执行一种混合基的离散傅立叶变换算法,计算速度较慢。(2)函数FFT的另一种调用格式为: y=fft(x,N)式中,x,y意义同前,N为正整数。函数执行N点的FFT。若x为向量且长度小于N,则函数将x补零至长度N 。若向量x的长度大于N,则函数截短x使之长度为N。若x 为矩阵,按相同方法对x进行处理。(3)经函数fft 求得的序列 y
17、一般是复序列,通常要求其幅值和相位。MATLAB提供求复数的幅值和相位函数:abs,angle,这些函数一般和FFT同时使用。函数abs(x)用于计算复向量x的幅值,函数angle(x) 用于计算复向量的相角,以弧度表示。函数unwrap(p)用于展开弧度相位角p 。(4)fftshift作用:将零频点移到频谱的中间武汉理工大学信息群处理课程设计课程设计说明书20用法:Y=fftshift(X) Y=fftshift(X,dim)描述:fftshift移动零频点到频谱中间,重新排列fft,fft2和fftn的输出结果。将零频点放到频谱的中间对于观察傅立叶变换是有用的。2.4 延时延时就是将音源
18、延迟一段时间后,再欲播放的效果处理。依其延迟时间的不同,可分别产生合唱、镶边、回音等效果。当延迟时间在335ms之间时人耳感觉不到滞后音的存在,并且他与原音源叠加后,会因其相位干涉而产生“梳状滤波“ 效应,这就是镶边效果。如果延迟时间在50ms 以上时,其延迟音就清晰可辨,此时的处理效果才是回音。回音处理一般都是用于产生简单的混响效果。延时、合唱、镶边、回音等效果的可调参数都差不多,具体有以下几项:延时时间(Dly) ,即主延时电路的延时时间调整。反馈增益(FB Gain) ,即延时反馈的增益控制。反馈高频比(Hi Ratio) ,即反馈回路上的高频衰减控制。调制频率(Freq) ,指主延时的
19、调频周期。调制深度(Depth ) ,指上述调频电路的调制深度。高频增益(HF) ,指高频均衡控制。预延时(Ini Dly) ,指主延时电路预延时时间调整。均衡频率(EQ F) ,这里的频率均衡用于音色调整,此为均衡的中点频率选择。由于延时产生的效果都比较复杂多变,如果不是效果处理专家,建议使用设备提供的预置参数,因为这些预置参数给出的处理效果一般都比较好。2.5 混响混响效果主要是用于增加音源的融合感。自然音源的延时声阵列非常密集、复杂,所以模拟混响效果的程序也复杂多变。常见参数有以下几种:混响时间:能逼真的模拟自然混响的数码混响器上都有一套复杂的程序,其上虽然有很多技术参数可调,然而对这些
20、技术参数的调整都不会比原有的效果更为自然,尤其是混响时间。高频滚降:此项参数用于模拟自然混响当中,空气对高频的吸收效应,以武汉理工大学信息群处理课程设计课程设计说明书20产生较为自然的混响效果。一般高频混降的可调范围为0.11.0。此值较高时,混响效果也较接近自然混响;此值较低时,混响效果则较清澈。扩散度:此项参数可调整混响声阵密度的增长速度,其可调范围为010,其值较高时,混响效果比较丰厚、温暖;其值较低时,混响效果则较空旷、冷僻。预延时:自然混响声阵的建立都会延迟一段时间,预延时即为模拟次效应而设置。声阵密度:此项参数可调整声阵的密度,其值较高时,混响效果较为温暖,但有明显的声染色;其值较
21、低时,混响效果较深邃,切声染色也较弱。频率调制:这是一项技术性的参数,因为电子混响的声阵密度比自然混响稀疏,为了使混响的声音比较平滑、连贯,需要对混响声阵列的延时时间进行调制。此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。调治深度:指上述调频电路的调治深度。2.6 滤波器的设计单回声滤波器的系统函数:H(z)= 1 (2-)(1Rza a1)无限个回声滤波器的系统函数:H(z)= 1 (2-)(1)(RzaRz a2)全通结构的混响器的系统函数:H(z)= 1 (2-)(*1)( RzaRza a3)函数filter的调用格式为:y=filter(b,a,x)该格式采用数字滤波器对数据进行滤波,既可以用于IIR滤波器,也可以用于FIR滤波器。其中向量 b和a分别表示系统函数的分子、分母多项式的系数,若