1、1第六届“认证杯”数学中国数学建模网络挑战赛承 诺 书我们仔细阅读了第六届“认证杯”数学中国数学建模网络挑战赛的竞赛规则。我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料) ,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们允许数学中国网站()公布论文,以供网友之间学习交流,数学中国网
2、站以非商业目的的论文交流不需要提前取得我们的同意。我们的参赛队号为:参赛队员 (签名) :队员 1:队员 2:队员 3:参赛队教练员 (签名): 参赛队伍组别:2第六届“认证杯”数学中国数学建模网络挑战赛编 号 专 用 页参赛队伍的参赛队号:(请各个参赛队提前填写好):竞赛统一编号(由竞赛组委会送至评委团前编号):竞赛评阅编号(由竞赛评委团评阅前进行编号):32013 年第六届“认证杯”数学中国数学建模网络挑战赛题 目 基于 AP 算法的流行音乐标准化的研究与分类 关 键 词 特征向量提取;AP 聚类算法;流行音乐 摘 要:据网站音乐库,结合 matlab 软件提取样本音乐的相关数据。本文采用
3、了特征向量提取法和 AP 聚类法等方法,对流行音乐风格划分问题进行了探究,成功地解决了音乐风格划分的问题,并建立了可以划分不同风格音乐的一系列模型。针对题中首要问题,我们引入流行音乐传统划分模型,并对可能影响到音乐风格划分的所有因素进行了客观分析。进而以音频作为划分不同音乐风格的主要因素,参考因素为:音乐的起源地、演奏者的派别等。根据音乐的音频特征结合物理学原理,我们认为音频特性可作为不同风格音乐划分的标准:由于音乐风格是一个模糊的概念,人们对音乐的分类往往带着主观因素。文中首先对音频文件中音频数据的特征向量进行提取,证明了传统音乐风格划分的模糊性。其次,根据 N 个数据点之间的相似度,提出运
4、用 AP 聚类法对音频数据进行聚类,对音乐的风格进行更进一步的描述,并建立以下模型: 2112 |),(pkkkyxyxd利用本文模型,对“酷狗音乐”中热度较高的 100 首歌曲样本进行分类处理,得到理想类群A、B、C、D、E,为避免概念混淆,将各类群定义为对应的歌曲风格,并进一步对模型进行了优化。最后在模型检验中,通过典型数据的收集与模型验证,论证了对当前音乐的分类以及分类的标准是科学的。随着时代的不断进步,人们的价值观和文化观也在与时俱进。在预测中,采用第二个问题设计的算法以及分类标准,对互联网数据进行分析、量化,我们得出这样的结果:A、B、C 三种风格的音乐占有广大的市场,其中以 A 风
5、格的音乐占有的市场最广,达到音乐市场总额的 34%。参赛队号: 所选题目: 题参赛密码 (由组委会填写)4AbstractTo explore pop music style classification,this paper is succeeded in solving the problem by adopting the feature vector extraction method and AP clustering algorithm and so on, and established a series of models that can be divided into mu
6、sic styles.For the first question, we analyzed all factors that will be likely to affect music style classification. Then the main factor is music audio, reference factors: music origin, the players faction and so on. Therefore, we believe that: an audio can only track and describe a song. So, we th
7、ink that the audio is the standard of different styles of music classification.Because the style of music is a fuzzy concept, people often have subjective emotion on classification of music. Firstly, analysis of traditional music division model proves that fuzzy music style. Secondly, we use AP clus
8、tering algorithm to provide a further description for music classification, putting forward the method to different styles of music. The model is:2112 |),(pkkkyxyxdBy established own partition method for current music. Finally, to test the model to proved that our classification and classification s
9、tandard is scientific.With the progress of the era, peoples values and culture are also advancing with the times. Therefore, we can only predict a short-term pop music market. In the forecast we used algorithm and classification standard designed in the second issue. After analyzing Internet data, w
10、e concluded the results: A, B, C these three kinds of music occupy a vast market. A style occupies the largest music market, reaching 34% of the total market.Key Words: Feature vector extracted; AP clustering algorithm; Popular music 51、问题重述随着互联网的发展,流行音乐的主要传播媒介从传统的电台和唱片逐渐过渡到网络下载和网络电台等。网络电台需要根据收听者的已知
11、喜好,自动推荐并播放音乐。由于每个人喜好的音乐可能横跨若干种风格,区别甚大,需要分别对待。这就需要探讨如何区分音乐风格的问题。在流行音乐中,传统的风格概念包括 Pop(流行) 、Country(乡村) 、Jazz(爵士) 、Rock(摇滚) 、R,&, AgeNwBRockJazCountryPpS8且各种风格的音乐何集合 S 緎之间满足如下关系:1)()&()()()()() AgeNwPBRockPJazCountryPpSP )3(根据以上建立的模型对题目中的分类方法进行分析评估。5.2.1 音频分析要进行不同风格音乐的分类,根据所建立的模型,我们首先要对音频进行分析。那么我们先假设一段
12、音频信号流 采样后的离散音频信号为:x)()()1(kxnx )4(所以,连续信号中得到了 个采样数据,其中 是时刻 得到的数据,kn)1(kn在相对较短的时间内处理的时候,假设将这 个数据分成 组,那么每一组就是一个帧,L每个帧包含 个采样点,如果从每一组帧的 个采样点可以提取 特征/Lk /kfeatur点,最后得到 个特征点,就构成了音频数据流 的特征,这些特征被用来nfeatur x进行音频数据流 的分割,识别。由于这些特征点反映在短时间内的平均能量不同,x所以音乐在不同的时间段将出现平缓、高潮等不同的部分。其反映在函数上可以表示为: mnnwNE)()1)5(5.2.2 音频信息据前
13、文定义:音频是不同风格音乐的分类标准。因此,我们采用时域分析法建立、 和音频之间的关系,用 和 对音乐的音频特征进行描述。其函数表达FERFER式为: 0,max11112 iiiiiiFLenii EEERX且 )6(5.2.3 音乐特征片段的提取每一种风格的音乐基本上可以看作是由平缓部分、高潮部分等部分构成,而往往决定这种音乐风格的是音乐的高潮部分。所以,我们采用 F和 R对音乐的高潮部分进行描述,描述对象可以看作是高潮部分出现的时间、次数以及强度等方面。因此特征的提取工作实际上可以看作为一个分类的过程:将每一个帧进行分类,将高潮部分和相对激烈的帧提取出来作为特征向量 【2】 。我们将音乐
14、归化为一系列的帧,对每一个帧运用公式 计算帧能量。然后可以根)6(据如下公式:10)(minmin EEGF )7(计算得到静音阀值,并依据阀值对帧能量进行噪声过滤,得到剩下的声音片段是音乐原声。然后通过(6)式计算帧能量比,帧能量比较大的帧即可判断为特征片段的端点,而端点之间的帧可作为特征片段 【3】 。5.2.4.实验数据及图表分析9我们很据模型中相应的算法编写特征提取函数,其返回值是各个端点之间的平均值和方差。在 MATLAB 实验模拟中,我们对每一种不同风格的音乐选取首歌曲为样本歌曲(歌曲清单见附录 1) 。在实验中采用的音频文件均是采样速率为 44.1KHz,PCM 编码标准为 Wa
15、ve 文件。各个音频均取 20 秒作为样本。利用 MATLAB 作出 6 种不同风格歌曲的特征向量分布图(matlab 源码见附录 2.1):图 2 特征向量分布图Fig.2 the distribution of feature vector由上图可知明显的看到以下几点:1各种不同风格音乐的区别之处主要表现在:其高潮段落之间的间隔大小、距离方差不相同。2不同风格音乐的高潮出现时间也是不相同的。像 Rock(摇滚乐)、Jazz(爵士乐)在其音乐一开始就表现为高潮部分并且出现高潮的部分比较集中。而像 New Age(新世纪)、Country(乡村)音乐其高潮部分一般出现的时间比较晚,而且出现高潮
16、的部分比较分散。3不同风格的音乐在其音乐风格上截然不同。但是,反映在 MATLAB 处理图像上,不同风格的音乐在其散点图上具有很大的相似度。像 Jazz(爵士乐)和 Country(乡村乐),虽然它们的风格截然不同,但它们的散点图却有很大的相似之处。4Rock(摇滚乐)、Pop(流行音乐)和 Jazz(爵士乐)它们的音频之间具有很大的相似。因此,它们的音频特征的散点分布图像具有一个共同的特点:高潮段落之间间隔较小并且距离方差较小,有明显的聚簇现象。105我们可以明确的看出 New Age(新世纪)和其他风格的音乐有明显的不同,所以,我们可以认为 New Age(新世纪)风格的音乐最容易进行分类
17、处理。图 3 各样本特征向量分布对比图Fig.3 the balance of the sample feature vector distribution由图 3 可以明确的看出,不同风格的音乐在其特征向量分布图像上有着明显的聚簇现象。由于,各种不同风格音乐的特征向量都具有很多的相似之处,故我们可以根据特征向量对不同风格的音乐进行划分。结论:题中将音乐划分为 Pop(流行) 、Country(乡村) 、Jazz(爵士) 、Rock(摇滚) 、R&B(节奏布鲁斯) 、New Age(新世纪)这 6 种风格的音乐是不科学的。针对这一不科学分类,我们利用 AP 聚类算法对音乐的风格进行重新的划分。
18、5.3 AP 算法的引入1.AP 算法中的一些常用定义exemplar:聚类中心。similarity:数据点i和点j的相似度,记为S(i , j)。preference:数据点i的参考度称为 P(i)或 S(i,i)。是指点i作为聚类中心的参考度。一般取S相似度值的中值。Responsibility:R(i,k)用来描述点k适合作为数据点i的聚类中心的程度。Availability:A(i,k)用来描述点i选择点k作为其聚类中心的适合程度。2.AP 算法简介AP 算法是根据 N 个数据点之间的相似度进行聚类,这些相似度可以是对称的,即两个数据点之间相似度一样;也可以是不对称的,即两个数据点之间的相似度不等。这些相似度可以组成 的相似矩阵 Q。AP 算法不需要事先制定类聚数目,相反他将所有的数据点都作为潜在的聚类中心。称之为 exemplar.4