ImageVerifierCode 换一换
格式:DOC , 页数:3 ,大小:26KB ,
资源ID:6262994      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-6262994.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(音乐的特征.doc)为本站会员(j35w19)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

音乐的特征.doc

1、一、物理特征提取1、音高:声音的高低,它决定于音波的频率。2、音强:声音的强弱,它决定于音波的振幅。3、音长:声音的长短,它决定于发音持续时间的长短。4、音色(音质、音品):一种声音区别于其他声音的个性或特征。前四个为音乐的基本构成要素。5、曲调单位时间内乐波波动的振幅改变量 曲调也称旋律。高低起伏的乐音按一定的节奏有秩序地横向组织起来,就形成曲调。曲调是完整的音乐形式中最重要的表现手段之一。2、时域特征提取清音和浊音是语音中两个很简单的概念,其定义一般是:清音是发音时声带不振动;浊音是发音时声带要振动。6、短时能量:语音信号的能量随着时间变化比较明显,一般清音部分的能量比浊音的能量小得多。语

2、音信号的短时能量分析给出了反应这些幅度变化的一个合适的描述方法。短时能量主要用于区分清音和浊音、区分有声段和无声段等应用,在语音识别系统中,也可以作为特征中的一维参数来表示语音信号能量的大小和超音段信息。语音信号一般可分为无声段、清音段和浊音段。无声段是背景噪声段, 平均能量最低; 浊音段为声带振动发出对应的语音信号段, 平均能量最高; 清音段是空气在口腔中的摩擦、冲击或爆破而发出的语音信号段, 平均能量居于前两者之间。清音段和无声段的波形特点有明显的不同, 无声段信号变化较为缓慢,而清音段信号在幅度上变化剧烈, 穿越零电平次数也多。经验表明, 通常清音段过零率最大。7、短时平均过零率:是语音

3、信号时域分析中最简单的一种特征。顾名思义,它是指每帧内信号通过零值的次数。对于论文中处理的离散信号,短时平均过零率实质上就是信号采样点符号变化的次数。短时平均过零率可以在一定程度上反映信号的频谱性质,可以通过短时过零率获得谱特性的一种粗略估计。短时平均过零率可以用于语音信号分析,由于短时平均过零率可以在一定程度上反映频率的高低,因此在浊音段,一般具有较低的过零率,而在清音段具有较高的过零率,这样可以用短时平均过零率来初步判断清音和浊音。另外,还可以将短时平均过零率与短时能量结合起来判断语音起止点位置,即进行端点检测。8、短时自相关函数:是在信号的第 n 个样本点附近用短时窗截取一段信号,做自相

4、关计算所得的结果。即:短时自相关函数具有一个很有用的性质:若原始信号 x(n)是周期信号,周期为T,则其短时自相关函数也是周期信号,周期也是 T。这个性质可以方便的用来计算浊音信号中的基音周期及基音频率参数。9、短 时 平 均 幅 度 差短 时 平 均 幅 度 差 是 一 帧 音 频 信 号 能 量 大 小 的 表 征 , 由 于 平 均 幅 度 函 数没 有 平 方 运 算 , 因 此 其 动 态 范 围 要 比 短 时 能 量 小 , 接 近 于 标 准 能 量 计 算的 动 态 范 围 的 平 方 , 窗 长 N 对 平 均 幅 度 函 数 的 影 响 与 短 时 能 量 的 分 析 结

5、论 是 完 全 一 致 的 , 且 浊 音 对 幅 度 差 的 影 响 与 短 时 能 量 的 分 析 是 一 致 的 ,且 浊 音 时 幅 度 差 比 清 音 时 大 得 多 。 所 以 , 短 时 平 均 幅 度 函 数 可 以 用 来 区分 清 浊 音 。10、零过零率比(静音比例):如果某一帧的过零率为零,则认为该帧为零过零帧,音频片段中具有零过零率的帧数与整个片段所有帧数的比即是零过零率。11、静音比例:如果一帧的频域能量小于阈值,则认为该帧为静音帧。3、频域特征提取12、谱质心:谱质心是反映语音信号亮度的参数,它计算的是语音信号在整个频谱中的平衡点。13、子带能量:它反映了信号的谱

6、能量在整个频谱内的分布情况。可先将信号的频谱分为数个子带,然后在每一个子带中计算子带总能量的对数。14、带宽:用来标识信号传输的数据传输能力,它反映了信号功率或信号能量在频谱中集中的范围,它定义为信号频谱成分与谱质心之差的平方以能量进行加权的均值的平方根。15、基音频率:是衡量音调高低的单位。基音也叫基本频率或简称基频。当发声体由于震动而发出声音时,声音一般可以分解为许多单纯的正弦波,也就是说所有的自然声音基本都是由许多频率不同的正弦波组成的,其中频率最低的正弦波即为基音,而其他频率较高的正弦波则为泛音。音乐演奏或歌唱中,基音是区别音高的主要元素,决定旋律。而泛音则决定乐器或人声的音色。16、

7、小波熵:熵是用来衡量信息复杂度的。17、频谱流量:我们定义频谱流量为相邻两帧在频谱分布上的变化量,它是信号动态特征的一种反应。18、Mell 倒谱系数(MFCC):是以傅里叶变换和倒谱分析为基础,通过对短时音频帧中的K/M个离散采样点进行傅里叶变换,进而得到这个短时音频帧在各个频率上能量的大小。线性预测倒谱系数(LPCC):主要是根据其与线性预测系数 LPC 之间的关系得到的。Mel 倒谱系数 MFCC 是受人的听觉系统研究成果推动而导出的声学特征。研究发现,当两个音调的频率差小于临界带宽时,人就会把两个音调听成一个(屏蔽效应)。Mel 刻度是对这一临界带宽的度量方法之一, MFCC 在语音识别领域应用广泛。本文详细介绍了 Mel 频率倒谱系数参数的 6 大提取步骤19、线性谱对系数 LSP20、光谱波峰因数 SCF21、频谱平坦度 SFM

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报