1、2007 年 2 月 Journal on Communications February 2007第 28 卷第 2 期 通 信 学 报 Vol.28 No.2性能优越的混合域数字音频盲水印算法王向阳 1,2, 杨红颖 1, 牛盼盼 1(1. 辽宁师范大学 计算机与信息技术学院,辽宁 大连 116029;2. 北京大学 视觉与听觉信息处理国家重点实验室,北京 100871)摘 要:提出了一种性能优越的自适应混合域数字音频水印嵌入算法,首先将原始数字音频划分成音频数据段;然后选取巴克码作为同步码,并在时域内将同步码嵌入到音频段的前部分;最后对音频段后部分实施 DWT 和DCT,并采用量化调制策
2、略将水印信息嵌入到频域系数中。实验结果表明,该算法对常规信号处理与去同步攻击均具有较好的顽健性。关键词:数字水印;数字音频;去同步攻击;混合域中图分类号:TP391 文献标识码:A 文章编号:1000-436X(2007)02-0109-06Novel blind audio watermarking algorithm in the hybrid domainWANG Xiang-yang1,2, YANG Hong-ying1, NIU Pan-pan1(1. School of Computer and Information Technique, Liaoning Normal Uni
3、versity, Dalian 116029, China;2. State Key Laboratory of Vision and Auditory Information Processing, Beijing University, Beijing 100871, China)Abstract: A new robust digital audio watermarking against desynchronization attack using DWT and DCT was proposed. Firstly, the origin digital audio was segm
4、ented and then each segment was cut into two sections. Secondly, with the spatial watermarking technique, synchronization code was embedded into the first section. Finally, the DWT and DCT were performed on the second section, and then the watermark was embedded into the low frequency components by
5、quantization. Experiment results show that the proposed watermarking scheme is inaudible and robust against various signal processing such as noise adding, re-sampling, re-quantization, random cropping, MPEG audio layer 3 (MP3) compression, time-scale modification, frequency-scale modification.Key w
6、ords: digital watermarking; digital audio; desynchronization attack; hybrid domain收稿日期:2006-06-19;修回日期:2007-01-04基金项目:辽宁省自然科学基金资助项目(20032100);视觉与听觉信息处理国家重点实验室 (北京大学)开放基金资助项目(0503);大连市科技基金资助项目(2006J23JH020) ;江苏省计算机信息处理技术重点实验室 (苏州大学)开放课题基金资助项目(KJS0602);“图像处理与图像通信”江苏省重点实验室(南京邮电大学)开放基金资助项目(ZK205014) Fou
7、ndation Items: The Natural Science Foundation of Liaoning Province(20032100); The Open Foundation of State Key Laboratory of Vision and Auditory Information Processing (Beijing University)(0503); The Natural Science Foundation of Dalian(2006J23JH020); The Open Foundation of Jiangsu Province Key Lab.
8、 for Computer Information Processing Technology(Soochow University)(KJS0602); The Open Foundation of Key Lab. of Image Processing and Image Communication(Nanjing University of Posts and Communications)(ZK205014)110 通 信 学 报 第 28 卷1 引言随着网络技术(特别是 Internet 技术)与多媒体信息处理技术的飞速发展,数字作品的知识产权保护成为迫切需要解决的关键问题。在这一
9、背景下,数字水印技术受到了人们的普遍关注,并已成为网络信息安全研究领域的一个热点 1。依据应用范围,通常可以把数字水印划分为图像水印、视频水印和音频水印等。近几年,对于图像水印和视频水印(尤其是图像水印 )的研究很多,而有关数字音频水印的研究却显得相对滞后 1。特别地,可有效抵抗去同步攻击的强顽健音频水印算法更是异常匮乏 24。所谓去同步攻击(desynchronization attack),并非指该种攻击能够从含水印对象中去除水印信息,而是指其可以将数字水印变形到检测器检测不出来(即改变水印嵌入位置)。截止到目前,人们主要采用 4 种措施设计抗去同步攻击的顽健音频水印方案 1,5,分别为穷
10、举搜索、扩频水印扩频码相结合、利用原始音频重要特征、同步码等。其中,穷举搜索方案具有计算量较大、虚警率较高等不足 1;多数扩频水印扩频码相结合方案难以实现水印信息盲检测 46;利用原始音频重要特征方案具有特征点提取不稳定、所需阈值过多而不利于实际应用等弱点 711。相比之下,同步码方案具有更为明显的技术优势 12,13。本文提出了一种基于同步码的自适应混合域数字音频水印算法,该算法以量化调制策略为基础,能够在时域内将同步码嵌入到音频段前部分,而在混合域内将水印信息嵌入到音频段后部分。2 数字水印的嵌入本文算法的基本工作原理为:首先将原始音频信号进行分段处理,然后再将每个音频数据段划分成前后 2
11、 个部分以进行信息嵌入(其中,前面部分用于空域嵌入同步信号,后面部分用于混合域嵌入水印信息)。而水印信息的具体嵌入过程为:首先对音频数据段(后面部分 )进行 DWT,再对小波域的低频系数进行 DCT,最后利用自适应量化策略将加密后的水印信息嵌入到 DCT 域的低中频系数中。图 1 给出了嵌入数据的结构。图 1 嵌入数据的结构假设原始数字音频信号为 (),0Aai。其中, 为音频数据的个数, aLa ,1是第 个音频数据的幅度值, 为表2,()p i p示每个数据所使用的比特数。假设二值水印图像为 。其中,,0,WwijiMjN 代表二值水印图像的第 行、第 列(,)ij1ij像素值。假设同步码
12、为 ,其syn(),0FfL中, (为了便于使用,这里已对原巴,fi克码进行简单变换,即+10,11) , 为同步syn码的长度。2.1 数字水印的置乱加密为了消除二值水印图像的像素空间相关性,提高整个数字水印系统的安全性能,确保数字音频某一部分受到破坏后仍能全部或部分地恢复水印,宜首先对二值水印图像进行置乱加密。为此,本文首先引入 Arnold 变换,将二值水印图像 W 置乱加密为安全水印矩阵 。1W2.2 数字音频的自适应分段为 了 有 效 抵 抗 剪 切 、 平 移 等 去 同 步 攻 击 , 以使 得 数 字 音 频 部 分 数 据 丢 失 后 仍 能 保 证 水 印 检 测的 有 效
13、 可 靠 , 本 文 算 法 首 先 对 原 始 数 字 音 频 信 号进 行 分 段 处 理 , 然 后 再 将 每 个 音 频 数 据 段 分 割 成长 度 为 和 的 2 部 分 并 分 别 嵌 入 同 步 码 与 水1L印 信 息 。 其 中 , 第 个 音 频 数 据 段 可 以 表 示 为i(),0AiakL ai这里, , , , 为12L1syn12HMN小 波 变 换 级 数 , 为 常 数 (本 文 选 取 为 5)。设某个音频数据段为 (其长度为 和0A1L的 2 部分为 和 ) ,则同步码与数字水印信012息的嵌入过程如下。2.3 同步码嵌入为 了 保 证 不 可 感
14、知 性 与 顽 健 性 的 良 好 平 衡 , 本文 采 用 修 改 多 个 采 样 值 ( 个 采 样 值 ) 的 方 法 , 将n同 步 信 息 嵌 入 到 采 样 值 的 统 计 均 值 中 , 具 体 步 骤 为 :1)将 按同步码长度 分成 段,每一01AsynLsyn第 2 期 王向阳等:性能优越的混合域数字音频盲水印算法 111段 含有 个采样点,即01()PAmn0011syn()(),paimL 2)计算 的平均值,即01()PA0011syn()(),)nimpaimL3)采用量化方法嵌入同步码,即对每一段,修改其均值 ,以嵌入一位同步码。01()PA01()PA修改策略为
15、 00001111()()()()pamiimPA 其中, 为修改前采,PApain样值, 为修改后的采0011()i样值,且有 00111()()mQPAfmS00 11 1()()florund2这里, 和 分别为修改前后的样本01()PAm01()均值; 为舍入取整操作, 为截断取round )(flor整操作; 为量化步长, ( 为向下Sb12asS取整函数), 。01()as2.4 水印信号的嵌入1)音频数据段(后面部分)的 DWT。对每个音频数据段 进行 级小波变换,并得到小波系数02AH。其中, 为音频数据段01022,HD 02HA小波变换的第 级近似分量,分别为音频数据段 小
16、波变换011022, 02的第 级的细节分量。2)近似分量的 DCT。考虑到小波变换域的近似分量能够有效抵御各种干扰,这里选择 级小波变换的近似分量 进行 DCT 及嵌入水印。HA0200022DCT()(,H CHLatt3)水印信号的嵌入。为保证音频水印的顽健性及不可感知性,本文根据人类听觉系统的频域掩蔽特性,采用量化策略将水印信息嵌入到 DCT域的低中频部分,即量化调制前 个 DCT 系数,MN得到 ,其中02HCA0202 2(),HCHattL 量化规则如下 0221020221(),(),)HCHCHCIQatSwijattij如 果如 果其中, (1)tiNj,0022()HCH
17、CatIQtS( 是取模运0022()mod(),HCattmod算)其中, , , 为量化步iM jN 2长, ( 为向下取整函数),lb2sS21002()HLCCtMNbatsA4)逆 DCT。对嵌入水印后的音频数据段做逆 DCT。HCA020022IDCT()HHA5)逆 DWT。以 代替 并进行 级逆DWT,得到含有水印的音频数据段信号 。02A2.5 循环嵌入为抵抗剪切、平移等去同步攻击,增加水印的顽健性,重复步骤 2.3 节、2.4 节对其他音频数据段进行同步码与水印信息的嵌入(即对同步码及水印信息采用循环嵌入的策略) 。3 数字水印的提取本 文 讨 论 的 自 适 应 混 合
18、域 数 字 音 频 水 印 算 法112 通 信 学 报 第 28 卷属 于 盲 水 印 算 法 , 即 检 测 数 字 水 印 信 号 时 不 需 要原 始 音 频 载 体 。 整 个 数 字 水 印 检 测 过 程 包 括 同 步码 检 测 与 水 印 信 号 提 取 2 个 关 键 环 节 , 如 图 2所 示 。图 2 水印检测原理3.1 同步码的检测这里所说的同步码检测,是指检测窗口(大小为 )所覆盖的音频数据段内是否含有所嵌入1L的同步码信息。其工作步骤为:首先按照 2.3 节工作步骤,分别计算音频数据段(即窗口所覆盖部分)前 个采样值 的平nm()PA均值 *()PA*syn()
19、(),0,paiL 然后提取同步码信息 。提取策略为F*1syn()()modru,2 0PAFf SL为了有效避免假同步现象发生,本文采用了通信领域的帧同步码逐比特比较方法确定同步码,即如果所提取出的同步码 和原同步码 完全相F同,则认为已检测到所嵌入的同步码信息。3.2 水印信号的提取这里所说的水印信号提取,是指从同步码后的音频数据段(令该音频数据段为 ,其长度为0*2A)内提取水印信息。其工作步骤为:2L1)对音频数据段 进行 级 DWT,得到小0*2H波系数 0*0*10*1222,HHAD2)对近似分量 做 变换CT*2000222T()(),HCHHHLatt3)提取水印信息,提取
20、公式为 *2()1(,mod2HCtWwijS (0,iMNij 4)对所提取出的水印信息 进行逆置乱加密,便可得到二值水印图像 *(,)0,wijiMjN 需要说明的是,由于本文对同步码及水印信息采用了循环嵌入策略,故数字水印检测过程将提取出多个二值水印图像 ( )。为此,*rW1,2R需进一步按照“多数原则”计算出最终的数字水印 ,即*W*1,(,)(,)0rwijwij如 果 中 有 一 半 以 上 不 含 一 半 为否 则 反 之这里, , ,r=1,2,R。*,rrij*ij4 仿真实验结果为了验证本文数字音频水印算法的高效性,以下分别给出了检测性能测试、抗攻击能力测试的实验结果,并
21、与文献10算法进行了对比。实验中,所选用的原始载体是采样频率为 44.1kHz,分辨率为 16bit,时间长度为 10s 的单声道数字音频信号,其波形如图 3(a)所示。数字水印采用了6464 的二值图像(如图 3(b)。小波变换采用了常见的 Daubechies-1 小波基。小小波变换采用了常见的 Daubechies-1 小波基。小波变换级数选取为H=3,并选用了码长为 16bit 的巴克码1111100110101110 作为同步信号。第 2 期 王向阳等:性能优越的混合域数字音频盲水印算法 113图 3 原始音频与数字水印仿真实验分别对本文算法和文献10算法的含水印音频信号进行了一系列
22、攻击,包括重新采样、重新量化、叠加噪声、低通滤波、MP3 压缩、随机剪切、时间延展、音高位移等攻击形式。其中:1)重新采样。将音频信号采样频率下降为22.05kHz、11.025kHz、8kHz,再还原为原采样频率 44.1kHz。2)重新量化。先将音频信号从 16bit 量化为8bit,再量化为 16bit。3)叠加噪声。对数字音频信号在时域中加入均值为 0、均方差为 0.01 的高斯白噪声。4)低通滤波。采用长度为 6 阶,截止频率为22.05kHz 的巴特沃兹低通滤波器。5)有损压缩。先对音频信号进行压缩(截止频率 32320kHz),再解压缩。6)随机剪切。在数字音频的前面(或中间)
23、随机剪切音频 10%。7)时间延展。在音高保持不变的情况下,将整个数字音频的长度延展 4%,即将数字音频时间长度改变为 15.6s。8)音高位移。在数字音频长度保持不变的情况下,将数字音频的音高减少 4%。表 1 给 出 了 不 同 数 字 水 印 嵌 入 方 案 的 抗 攻 击能 力 对 照 结 果 (包 括 失 真 率 (BER)、 信 噪 比 (SNR)14。表 1 不同数字水印嵌入方案的抗攻击能力对照结果文献 10 本文算法攻击类型失真率/% 信噪比/dB 失真率/% 信噪比/dB无攻击 0 48.24 0 48.67重新量化 0 44.36 0 44.71重新采样 22.05kHz
24、42.54 43.32 0 43.57重新采样 11.025kHz 46.41 27.65 0.61 27.76重新采样 8kHz 46.53 27.13 17.07 27.62叠加噪声 2.15 41.66 1.60 41.78MP3 压缩 112kHz 0 48.54 0 48.61MP3 压缩 64kHz 49.21 47.43 0 47.77MP3 压缩 48kHz 51.50 39.43 1.46 39.54MP3 压缩 32kHz 47.21 42.32 5.27 42.65随机剪切 10% 0 48.76 0 48.62时间延展 4% 31.51 40.43 6.11 40.87
25、音高位移 4% 18.53 38.76 9.24 38.985 结束语本文提出了一种新的自适应混合域数字音频水印算法,该算法首先将原始数字音频划分成音频数据段;然后选取巴克码作为同步码,并在时域内将同步码嵌入到音频段的前部分;最后对音频段后部分实施 DWT 和 DCT,并采用量化调制策略将水印信息嵌入到频域系数中。仿真实验表明,本文所提出的音频水印算法不仅具有较好的不可感知性,而且对于重新采样、重新量化、MP3 压缩、随机剪切、时间延展、音高位移等攻击均具有较好的顽健性。此外,本文提出的混合域音频水印嵌入算法还具有计算简单、容易实现、抽取水印时无需原始载体音频等特点,这大大增强了其用于数字音频
26、作品版权保护的实用性。参考文献:1 李伟, 袁一群, 李晓强等. 数字音频水印技术综述J. 通信学报, 2005, 26(2): 100-111.LI W, YUAN Y Q, LI X Q, et al. Overview of digital audio watermarkingJ. Journal on Communications, 2005, 26(2): 100-111.2 LIE W N, CHANG L C. Robust and high-quality time-domain audio watermarking subject to psycho acoustic mas
27、kingA. Proceedings of IEEE International Symposium on Circuits and SystemsC. Arizona, USA, 2002. 45-48.3 MEGIAS D, HERRERA J J, MINGUILLON J. A robust audio watermarking scheme based on MPEG 1 layer compressionA. Communications and Multimedia Security-CMS 2003C. LNCS 963: Springer-Verlag, 2003. 226-
28、238.4 KIM H J. Audio Watermarking Techniques. Pacific Rim Workshop on Digital SteganographyR. Kyushu Institute of Technology. Kitakyushu, Japan, 2003.5 孙圣和, 陆哲明 , 牛夏牧. 数字水印技术及应用M. 北京:科学出版社,2004. SUN S H, LU Z M, NIU X M. Digital Watermarking TechniqueM. Beijing: Science Press, 2004. 114 通 信 学 报 第 28
29、 卷6 SEOK J, HONG J, KIM J. A novel audio watermarking algorithm for copyright protection of digital audioJ. ETRI Journal, 2002, 24(3): 181-189.7 WU C P, SU P C, JAY KUO C C. Robust audio watermarking for copyright protectionA. Conference on Advanced Signal Processing: Algorithms, Architectures, and
30、Implementations IX, SPIEs Annual MeetingC. Denver, CO, 1999. 387-397.8 LI W, XUE X Y. Audio watermarking based on music content analysis: robust against time scale modificationA. Proceedings of the Second International Workshop on Digital WatermarkingC. Korea, 2003. 289-300.9 LEE H S, LEE W S. Audio
31、 watermarking through modification of tonal maskersJ. ETRI Journal, 2005, 27(5): 608-616. 10 SYLYAIN B, MICHIEL V D V, AWEKE L. Informed detection of audio watermark for resolving playback speed modificationsA. Proceedings of the 2004 Workshop on Multimedia and SecurityC. Magdeburg, Germany, 2004.11
32、7-123. 11 KIM H O, LEE B K, LEE N Y. Wavelet-based audio watermarking techniques: robustness and fast synchronizationEB/OL. http:/amath. kaist.ac.kr/ research/paper/01-11.pdf.12 王泳, 黄继武, SHI Y Q. 快速重同步的有意义水印盲检测算法J. 计算机研究与发展, 2003, 40(20): 215-220.WANG Y, HUANG J W, SHI Y Q. Meaningful watermarking f
33、or audio with fast resynchronizationJ. Journal of Computer Research and Development, 2003, 40(20): 215-220. 13 HUANG J W, WANG Y, SHI Y Q. A blind audio watermarking algorithm with self-synchronizationA. Proceedings of IEEE International Symposium on Circuits and SystemC. Arizona, USA, 2002. 627-630
34、.14 DITTMAN J, STEINBACH M, LANG A, et al. Advanced audio watermarking benchmarkingA. Proceedings of the IS&T/ SPIE 16th Annual Symposium on Electronic Imaging. Volume 5306-Security,Steganography, and Watermarking of Multimedia Contents VIC. San Jose, CA, US, 2004.作者简介:王向阳(1965-),男,辽宁铁岭人,辽宁师范大学教授,主要研究方向为多媒体信息处理技术、网络信息安全技术。杨红颖(1965-),女,辽宁铁岭人,副教授,主要研究方向为多媒体技术、计算机辅助教学。牛盼盼(1983-),女,辽宁盘锦人,辽宁师范大学硕士生,主要研究方向为信息安全与数字水印等。杨红颖(1965-),女,辽宁铁岭人,辽宁师范大学副教授,主要研究方向为多媒体技术、计算机辅助教学。