1、1数字水印技术研究摘要伴随着计算机网络的发展,信息媒体的数字化为信息的存取提供了巨大的便利,显著提高了信息表达的效率和准确性。但是同时也带了了一些负面影响,一些别有企图的个人和团体在没有得到原作者的同意的情况下复制和传播有版权的数据文件或作品。所提数字媒体的信息安全、知识产权保护和认证等问题变得日益突出,变成一个急需解决的议题。密码技术是信息安全技术领域的的主要传统技术之一,但是此方法有缺点:一是加密后的文件因不可理解性从而妨碍信息的传播。而是一旦被解密后,文件就不再受保护。所以需要一种代替技术或者是对密码学进行补充的技术,这是,数字水印技术被提出了。数字水印技术是一种可以在开放网络环境下保护
2、版权和认证来源及数据完整性的新兴技术,原作者的创作信息和个人标致通过数字水印系统以人所不可感知的水印形式嵌入在多媒体中,从而使人们无法从表面上感知水印,只有专用检测器或软件才可以检测出隐藏的数字水印。水印的存在要以不破坏原本数据的欣赏价值、实用价值为原则。数字水印技术基本特征主要有:鲁棒性、不可见性=不可检测性、自恢复性。数字水印的主要应用领域有版权保护、盗版跟踪、图像认证、票据防伪、标题与注释、拷贝保护。数字水印按特点划分为鲁棒数字水印和脆弱数字水印;按水印所负载的媒体划分分为图像水印、音频水印、视频水印、文本水银一级用于三维网络水印等;按检测过程划分分为铭文水印和盲水印;按内容划分分为有意
3、义水印和无意义水印;按用途划分分为票据防伪水印、版权保护水印、篡改提示水印和隐蔽表示水印;按水印隐藏的位置划分分为时空域数字水印、频域数字水印、时/频域数字水印和时间/ 尺度与数字水印。尽管人们都在努力发展和完善数字水印技术,但水印技术仍然没有完全成熟和广为人们理解,而且还有很多问题没有得到解决。尽管水印技术很难在短期内取得突破,但是,鉴于水印技术的广泛的应用价值,有必要对数字水印做一番深入研究。目录1 数字水印的特点 22.2 按水印所附载的媒体划分 32.3 按检测过程划分 32.4 按内容划分 32.5 按用途划分 32.6 按水印隐藏的位置划分 33 数字水印的特性 33.1 隐蔽性
4、33.2 鲁棒性 33.3 抗窜改性 43.4 水印容量 43.5 安全性 43.6 低错误率 44 典型数字水印算法 424.1 空域算法 44.2PATCHWORK 算法 44.3 变换域算法 44.3.1 基于离散余弦变换的数字水印 54.3.2 基于离散小波变换的数字水印 54.4 压缩域算法 64.5NEC 算法 64.6 生理模型算法 65 数字水印应用领域 75.1 数字作品的知识产权保护 75.2 商务交易中的票据防伪 75.3 证件真伪鉴别 75.4 声像数据的隐藏标识和篡改提示 75.5 隐蔽通信及其对抗 81 数字水印的特点作为数字水印技术基本上具有下面几个方面的特点:1
5、.1 安全性:数字水印的信息应是安全的,难以篡改或伪造,同时,应当有较低的误检测率,当原内容发生变化时,数字水印应当发生变化,从而可以检测原始数据的变更;当然数字水印同样对重复添加有很强的抵抗性。1.2 隐蔽性:数字水印应是不可知觉的,而且应不影响被保护数据的正常使用;不会降质;1.3 鲁棒性:是指在经历多种无意或有意的信号处理过程后,数字水印仍能保持部分完整性并能被准确鉴别。可能的信号处理过程包括信道噪声、滤波、数/模与模/ 数转换、重采样、剪切、位移、尺度变化以及有损压缩编码等。主要用于版权保护的数字水印易损水印(Fragile Watermarking) ,主要用于完整性保护,这种水印同
6、样是在内容数据中嵌入不可见的信息。当内容发生改变时,这些水印信息会发生相应的改变,从而可以鉴定原始数据是否被篡改。1.4 水印容量:是指载体在不发生形变的前提下可嵌入的水印信息量。嵌入的水印信息必须足以表示多媒体内容的创建者或所有者的标志信息,或购买者的序列号,这样有利于解决版权纠纷,保护数字产权合法拥有者的利益。尤其是隐蔽通信领域的特殊性,对水印的容量需求很大。2 数字水印的分类2.1 按特性划分按水印的特性可以将数字水印分为鲁棒数字水印和易损数字水印两类。鲁棒数字水印主要用于在数字作品中标识著作权信息,利用这种水印技术在多媒体内容的数据中嵌入创建者、所有者的标示信息,或者嵌入购买者的标示(
7、即序列号) 。在发生版权纠纷时,创建者或所有者的信息用于标示数据的版权所有者,而序列号用于追踪违反协议而为盗版提供多媒体数据的用户。用于版权保护的数字水印要求有很强的鲁棒性和安全性,除了要求在一般图像处理(如:滤波、加噪声、替换、压缩等)中生存外,还需能抵抗一些恶意攻击。3易损水印(Fragile Watermarking) ,与鲁棒水印的要求相反,易损数字水印主要用于完整性保护,这种水印同样是在内容数据中嵌入不可见的信息。当内容发生改变时,这些水印信息会发生相应的改变,从而可以鉴定原始数据是否被篡改。易损水印应对一般图像处理(如:滤波、加噪声、替换、压缩等)有较强的免疫能力(鲁棒性) ,同时
8、又要求有较强的敏感性,即:既允许一定程度的失真,又要能将失真情况探测出来。必须对信号的改动很敏感,人们根据易损水印的状态就可以判断数据是否被篡改过。2.2 按水印所附载的媒体划分按水印所附载的媒体,我们可以将数字水印划分为图像水印、音频水印、视频水印、文本水印以及用于三维网格模型的网格水印等。随着数字技术的发展,会有更多种类的数字媒体出现,同时也会产生相应的水印技术。2.3 按检测过程划分按水印的检测过程可以将数字水印划分为明文水印和盲水印。明文水印在检测过程中需要原始数据,而盲水印的检测只需要密钥,不需要原始数据。一般来说,明文水印的鲁棒性比较强,但其应用受到存储成本的限制。目前学术界研究的
9、数字水印大多数是盲水印。2.4 按内容划分按数字水印的内容可以将水印划分为有意义水印和无意义水印。有意义水印是指水印本身也是某个数字图像(如商标图像)或数字音频片段的编码;无意义水印则只对应于一个序列号。有意义水印的优势在于,如果由于受到攻击或其他原因致使解码后的水印破损,人们仍然可以通过视觉观察确认是否有水印。但对于无意义水印来说,如果解码后的水印序列有若干码元错误,则只能通过统计决策来确定信号中是否含有水印。2.5 按用途划分不同的应用需求造就了不同的水印技术。按水印的用途,我们可以将数字水印划分为票证防伪水印、版权保护水印、篡改提示水印和隐蔽标识水印。票证防伪水印是一类比较特殊的水印,主
10、要用于打印票据和电子票据、各种证件的防伪。一般来说,伪币的制造者不可能对票据图像进行过多的修改,所以,诸如尺度变换等信号编辑操作是不用考虑的。但另一方面,人们必须考虑票据破损、图案模糊等情形,而且考虑到快速检测的要求,用于票证防伪的数字水印算法不能太复杂。版权标识水印是目前研究最多的一类数字水印。数字作品既是商品又是知识作品,这种双重性决定了版权标识水印主要强调隐蔽性和鲁棒性,而对数据量的要求相对较小。篡改提示水印是一种脆弱水印,其目的是标识原文件信号的完整性和真实性。隐蔽标识水印的目的是将保密数据的重要标注隐藏起来,限制非法用户对保密数据的使用。2.6 按水印隐藏的位置划分按数字水印的隐藏位
11、置,我们可以将其划分为时(空)域数字水印、频域数字水印、时/频域数字水印和时间/尺度域数字水印。时(空)域数字水印是直接在信号空间上叠加水印信息,而频域数字水印、时/频域数字水印和时间/尺度域数字水印则分别是在 DCT 变换域、时/ 频变换域和小波变换域上隐藏水印。随着数字水印技术的发展,各种水印算法层出不穷,水印的隐藏位置也不再局限于上述四种。应该说,只要构成一种信号变换,就有可能在其变换空间上隐藏水印。3 数字水印的特性数字水印系统必须满足一些特定的条件才能使其在数字产品版权保护和完整性鉴定方面成为值得信赖的应用体系。一个安全可靠的水印系统一般应满足如下要求:3.1 隐蔽性4也称不可感知性
12、,即对于不可见水印处理系统,水印嵌入算法不应产生可感知的数据修改,也就是水印在通常的视觉条件下应该是不可见的,水印的存在不会影响作品的视觉效果。3.2 鲁棒性水印必须很难去掉(希望不可能去掉 ),当然在理论上任何水印都可以去掉,只要对水印的嵌入过程有足够的了解,但是如果对水印的嵌入只是部分了解的话,任何破坏或消除水印的企图都应导致载体严重的降质而不可用。3.3 抗窜改性与抗毁坏的鲁棒性不同,抗窜改性是指水印一旦嵌入到载体中,攻击者就很难改变或伪造。鲁棒性要求高的应用,通常也需要很强的抗窜改性。在版权保护中,要达到好的抗窜改性是比较困难的。3.4 水印容量嵌入的水印信息必须足以表示多媒体内容的创
13、建者或所有者的标志信息,或是购买者的序列号。这样在发生版权纠纷时,创建者或所有者的信息用于标示数据的版权所有者,而序列号用于标示违反协议而为盗版提供多媒体数据的用户。3.5 安全性应确保嵌入信息的保密性和较低的误检测率。水印可以是任何形式的数据,比如数值、文本、图像等。所有的水印都包含一个水印嵌入系统和水印恢复系统。3.6 低错误率即使在不受攻击或者无信号失真的情况下,也要求不能检测到水印(漏检、false -negative) 以及不存在水印的情况下,检测到水印( 虚检、 false - positive) 的概率必须非常小。4 典型数字水印算法近年来,数字水印技术研究取得了很大的进步,下面
14、对一些典型的算法进行了分析,除特别指明外,这些算法主要针对图像数据(某些算法也适合视频和音频数据) 。4.1 空域算法该类算法中典型的水印算法是将信息嵌入到随机选择的图像点中最不重要的像素位 (LSB:least significant bits)上,这可保证嵌入的水印是不可见的。但是由于使用了图像不重要的像素位,算法的鲁棒性差,水印信息很容易为滤波、图像量化、几何变形的操作破坏。另外一个常用方法是利用像素的统计特征将信息嵌入像素的亮度值中。4.2Patchwork 算法方法是随机选择 N 对像素点 (ai,bi) ,然后将每个 ai 点的亮度值加 1 ,每个 bi 点的亮度值减 1,这样整个
15、图像的平均亮度保持不变。适当地调整参数,Patchwork 方法对JPEG 压缩、FIR 滤波以及图像裁剪有一定的抵抗力,但该方法嵌入的信息量有限。为了嵌入更多的水印信息,可以将图像分块,然后对每一个图像块进行嵌入操作。4.3 变换域算法该类算法中,大部分水印算法采用了扩展频谱通信 (spread spectrum communication)技术。算法实现过程为:先计算图像的离散余弦变换 (DCT),然后将水印叠加到 DCT 域中幅值最大的前 k 系数上(不包括直流分量 ),通常为图像的低频分量。若 DCT 系数的前 k 个最大分量表示为 D=,i=1 , ,k,水印是服从高斯分布的随机实数
16、序列 W =,i=1 , ,k,那么水印的嵌入算法为 di = di(1 + awi),其中常数 a 为尺度因子,控制水印添加的强度。然后用新的系数做反变换得到水印图像 I。解码函数则分别计算原始图像 I 和水印图像I*的离散余弦变换,并提取嵌入的水印 W*,再做相关检验 以确定水印的存在与否。该方法即使当水印图像经过一些通用的几何变形和信号处理操作而产生比较明显的变形后仍然5能够提取出一个可信赖的水印拷贝。一个简单改进是不将水印嵌入到 DCT 域的低频分量上,而是嵌入到中频分量上以调节水印的顽健性与不可见性之间的矛盾。另外,还可以将数字图像的空间域数据通过离散傅里叶变换(DFT)或离散小波变
17、换 (DWT)转化为相应的频域系数;其次,根据待隐藏的信息类型,对其进行适当编码或变形;再次,根据隐藏信息量的大小和其相应的安全目标,选择某些类型的频域系数序列(如高频或中频或低频) ;再次,确定某种规则或算法,用待隐藏的信息的相应数据去修改前面选定的频域系数序列;最后,将数字图像的频域系数经相应的反变换转化为空间域数据。该类算法的隐藏和提取信息操作复杂,隐藏信息量不能很大,但抗攻击能力强,很适合于数字作品版权保护的数字水印技术中。4.3.1 基于离散余弦变换的数字水印 最早的基于分块 DCT 水印技术出现于 E Koch,J Zhao 的文献。针对静止图像和视频压缩标准(JPEG 和 MPE
18、G) ,他们的水印方案中图像也被分成 88 的块,由一个密钥随机的选择图像的一些分块,在频域的中频上稍微改变一个三元组以隐藏二进序列信息。选择在中频分量编码是因为在高频编码易于被各种信号处理方法破坏,而在低频编码则由于人的视觉对低频分量很敏感,对低频分量的改变易于被察觉。未经授权者由于不知道水印嵌入的区域,因此是很难测出水印的,此外,该水印算法对有损压缩和低通滤波是鲁棒的。将图像分割成 88 块,并对每个块做 DCT 变换,然后随机选择构造所有块的一个子集,对子集的每一个块,选择一组频率并嵌入二进制水印信息。由于频率组的选择不是基于最显著分量,并且频率系数的方差较小,因此该方法对噪声、几何变形
19、以及多文档攻击比较敏感。Cox 等人于 1995 年提出了基于图像全局变换的水印方法,称之为扩频法。这也是目前大部分变换域水印算法中所用到的技术。它将满足正态分布的伪随机序列加入到图像的DCT 变换后视觉最重要系数中,利用了序列扩频技术(SS)和人类视觉特性(HVS) 。算法原理为先选定视觉重要系数,再进行修改,最常用的嵌入规则如下:其中分别是修改前和修改后的频域系数, 是缩放因子,是第 i 个信息位水印。一般说来,乘法准则的抗失真性能要优于加法准则。水印的检测是通过计算相关函数实现的。从嵌入水印的图像中提取出是嵌入规则的逆过程,把提取出来的水印与原水印作相似性运算,与制定的阈值比较,可确定是
20、否存在水印。这是稳健性水印的奠基性算法。Chiou-Ting Hsu 等人提出一种基于分块 DCT 的水印,他们的水印是可辨识的图像,而不是简单的一个符号或一个随机数。通过有选择地修改图像的中频系数来嵌入水印。验证时,衡量提取出的水印同原水印之间的相似性来判断是否加入了水印。4.3.2 基于离散小波变换的数字水印与传统的 DCT 变换相比,小波变换是一种变分辨率的,将时域与频域相联合的分析方法,时间窗的大小随频率自动进行调整,更加符合人眼视觉特性。小波分析在时、频域同时具有良好的局部性,为传统的时域分析和频域分析提供了良好的结合。目前,小波分析已经广泛应用于数字图像和视频的压缩编码、计算机视觉
21、、纹理特征识别等领域。由于小波分析在图像处理上的许多特点可用于信息隐藏的研究,所以这种分析方法在信息隐藏和数字水印领域的应用也越来越受到广大研究者的重视,目前已经有很多比较典型的基于离散小波变换的数字水印算法。 除了上述有代表性的变换域算法外,还有一些变换域水印算法,它们中有相当一部分是上述算法的改进及发展。总的来说,与空域的方法相比,变换域的方法具有如下优点: (1) 在变换域中嵌入的水印信号能量可以分布到空域的所有像素上,有利于保证水印的不可见性;6(2) 在变换域,人类视觉系统(HVS) 的某些特性(如频率掩蔽特性)可以更方便地结合到水印编码过程中,因而其隐蔽性更好;(3) 变换域的方法
22、可与国际数据压缩标准兼容,从而易实现在压缩域(compressed domain) 内的水印算法,同时也能抵抗相应的有损压缩。4.4 压缩域算法基于 JPEG、MPEG 标准的压缩域数字水印系统不仅节省了大量的完全解码和重新编码过程,而且在数字电视广播及 VOD(Video on Demand)中有很大的实用价值。相应地,水印检测与提取也可直接在压缩域数据中进行。下面介绍一种针对 MPEG-2 压缩视频数据流的数字水印方案。虽然 MPEG-2 数据流语法允许把用户数据加到数据流中,但是这种方案并不适合数字水印技术,因为用户数据可以简单地从数据流中去掉,同时,在 MPEG-2 编码视频数据流中增
23、加用户数据会加大位率,使之不适于固定带宽的应用,所以关键是如何把水印信号加到数据信号中,即加入到表示视频帧的数据流中。对于输入的 MPEG-2 数据流而言,它可分为数据头信息、运动向量(用于运动补偿)和 DCT 编码信号块 3 部分,在方案中只有 MPEG-2 数据流最后一部分数据被改变,其原理是,首先对 DCT 编码数据块中每一输入的 Huffman 码进行解码和逆量化,以得到当前数据块的一个 DCT 系数; 其次,把相应水印信号块的变换系数与之相加,从而得到水印叠加的 DCT 系数,再重新进行量化和Huffman 编码,最后对新的 Huffman 码字的位数 n1 与原来的无水印系数的码字
24、 n0 进行比较,只在 n1 不大于 n0 的时候,才能传输水印码字,否则传输原码字,这就保证了不增加视频数据流位率。该方法有一个问题值得考虑,即水印信号的引入是一种引起降质的误差信号,而基于运动补偿的编码方案会将一个误差扩散和累积起来,为解决此问题,该算法采取了漂移补偿的方案来抵消因水印信号的引入所引起的视觉变形。4.5NEC 算法该算法由 NEC 实验室的 Cox 等人提出,该算法在数字水印算法中占有重要地位,其实现方法是,首先以密钥为种子来产生伪随机序列,该序列具有高斯 N(0,1) 分布,密钥一般由作者的标识码和图像的哈希值组成,其次对图像做 DCT 变换,最后用伪随机高斯序列来调制(
25、叠加)该图像除直流(DC)分量外的 1000 个最大的 DCT 系数。该算法具有较强的鲁棒性、安全性、透明性等。由于采用特殊的密钥,因此可防止 IBM 攻击,而且该算法还提出了增强水印鲁棒性和抗攻击算法的重要原则,即水印信号应该嵌入源数据中对人感觉最重要的部分,这种水印信号由独立同分布随机实数序列构成,且该实数序列应该具有高斯分布 N(0,1)的特征。4.6 生理模型算法人的生理模型包括人类视 HVS(HumanVisualSystem)和人类听觉系统 HAS。该模型不仅被多媒体数据压缩系统利用,同样可以供数字水印系统利用。利用视觉模型的基本思想均是利用从视觉模型导出的 JND(Just No
26、ticeable Difference)描述来确定在图像的各个部分所能容忍的数字水印信号的最大强度,从而能避免破坏视觉质量。也就是说,利用视觉模型来确定与图像相关的调制掩模,然后再利用其来插入水印。这一方法同时具有好的透明性和强健性。5 数字水印应用领域随着数字水印技术的发展,数字水印的应用领域也得到了扩展,数字水印的基本应用领域是版权保护、隐藏标识、认证和安全不可见通信。当数字水印应用于版权保护时,潜在的应用市场在于电子商务、在线或离线地分发多媒体内容以及大规模的广播服务。数字水印用于隐藏标识时,可在医学、制图、数字成像、数字图像监控、多媒体索引和基于内容的检索等领域得到应用。数字水印的认证
27、方面主要ID 卡、信用卡、ATM 卡等上面数字水印的安全不可见通信将在国防和情报部门得到广泛7的应用。 多媒体技术的飞速发展和 Internet 的普及带来了一系列政治、经济、军事和文化问题,产生了许多新的研究热点,以下几个引起普遍关注的问题构成了数字水印的研究背景。5.1 数字作品的知识产权保护数字作品(如电脑美术、扫描图像、数字音乐、视频、三维动画)的版权保护是当前的热点问题。由于数字作品的拷贝、修改非常容易,而且可以做到与原作完全相同,所以原创者不得不采用一些严重损害作品质量的办法来加上版权标志,而这种明显可见的标志很容易被篡改。“数字水印”利用数据隐藏原理使版权标志不可见或不可听,既不
28、损害原作品,又达到了版权保护的目的。目前,用于版权保护的数字水印技术已经进入了初步实用化阶段,IBM 公司在其“数字图书馆” 软件中就提供了数字水印功能,Adobe 公司也在其著名的 Photoshop 软件中集成了 Digimarc 公司的数字水印插件。然而实事求是地说,目前市场上的数字水印产品在技术上还不成熟,很容易被破坏或破解,距离真正的实用还有很长的路要走。5.2 商务交易中的票据防伪随着高质量图像输入输出设备的发展,特别是精度超过 1200dpi 的彩色喷墨、激光打印机和高精度彩色复印机的出现,使得货币、支票以及其他票据的伪造变得更加容易。另一方面,在从传统商务向电子商务转化的过程中
29、,会出现大量过度性的电子文件,如各种纸质票据的扫描图像等。即使在网络安全技术成熟以后,各种电子票据也还需要一些非密码的认证方式。数字水印技术可以为各种票据提供不可见的认证标志,从而大大增加了伪造的难度。5.3 证件真伪鉴别信息隐藏技术可以应用的范围很广,作为证件来讲,每个人需要不只一个证件,证明个人身份的有:身份证、护照、驾驶证、出入证等;证明某种能力的有:各种学历证书、资格证书等。国内目前在证件防伪领域面临巨大的商机,由于缺少有效的措施,使得“造假”、 “买假”、“用假”成风,已经严重地干扰了正常的经济秩序,对国家的形像也有不良影响。通过水印技术可以确认该证件的真伪,使得该证件无法仿制和复制
30、。5.4 声像数据的隐藏标识和篡改提示数据的标识信息往往比数据本身更具有保密价值,如遥感图像的拍摄日期、经/纬度等。没有标识信息的数据有时甚至无法使用,但直接将这些重要信息标记在原始文件上又很危险。数字水印技术提供了一种隐藏标识的方法,标识信息在原始文件上是看不到的,只有通过特殊的阅读程序才可以读取。这种方法已经被国外一些公开的遥感图像数据库所采用。 此外,数据的篡改提示也是一项很重要的工作。现有的信号拼接和镶嵌技术可以做到“移花接木”而不为人知,因此,如何防范对图像、录音、录像数据的篡改攻击是重要的研究课题。基于数字水印的篡改提示是解决这一问题的理想技术途径,通过隐藏水印的状态可以判断声像信号是否被篡改。 5.5 隐蔽通信及其对抗数字水印所依赖的信息隐藏技术不仅提供了非密码的安全途径,更引发了信息战尤其是网络情报战的革命,产生了一系列新颖的作战方式,引起了许多国家的重视。网络情报战是信息战的重要组成部分,其核心内容是利用公用网络进行保密数据传送。迄今为止,学术界在这方面的研究思路一直未能突破“文件加密”的思维模式,然而,经过加密的文件往往是混乱无序的,容易引起攻击者的注意。网络多媒体技术的广泛应用使得利用公用网络进行保密通信有了新的思路,利用数字化声像信号相对于人的视觉、听觉冗余,可以进行各种时(空)域和变换域的信息隐藏,从而实现隐蔽通信。