1、 第 1 页图像压缩技术的研究与实现专 业 :电子信息工程第 2 页目录摘要 .4Abstract.5前言 .6第一章 绪论 .711 图像压缩技术的发展现状 712 研究内容和目的 813 论文结构安排 .8第二章 图像压缩的理论分析 .921 图像压缩的可能性 922 图像压缩原理 923 图像压缩的理论基础 10第三章 常见无损压缩方法基本原理 .1231 图像压缩编码的分类 1232 预测编码 123.2.1系统框图 133.2.2调制 1433 常见压缩方法 173.3.1 JPEG2000与 JPEG的区别 173.3.2 JPEG2000与 JPEG的实验比较 193.3.2.1
2、将彩色图像转化为灰度图像 193.3.2.2基于离散余弦变换(DCT)实现图像压缩 203.3.3 小波变换的分析: .233.3.3.1利用小波变换实现图像压缩 233.3.3.2二维小波分析压缩图像 Matlab实现 273.3.4 DCT和小波变换的图像压缩的比较 30第四章 结论 .33第五章 总结与体会 .34致 谢 .35参考文献 .36附录 1 外文原文 38附录 2 外文翻译 48第 3 页摘要图像压缩技术对于数字图像信息在网络上实现快速传输和实时处理具有重要的意义。本文介绍了当前几种最为重要的图像压缩算法: JPEG2000、分形图像压缩和小波变换图像压缩。其中主要研究了离散
3、余弦变换压缩和小波变换压缩,并对两种压缩的前后数据进行了对比,同时还分析了离散余弦变换压缩和小波变换压缩之间的差异。关键词:图像压缩;JPEG2000; 小波变换图像压缩;第 4 页AbstractImage compression techniques for digital image information in Internet rapid transmission and real-time processing has important significance. This paper introduces several most important image compres
4、sion algorithm: JPEG2000, fractal image compression and wavelet image compression. One major research on the discrete cosine transform compression and wavelet compression, and two kinds of data compression and comparison, this paper also analyzes the discrete cosine transform compression and wavelet
5、 compressed differences.Key word: Image compression; JPEG2000; wavelet transformation image compression第 5 页前言近二十年来,科学技术取得了飞速的发展。由计算机技术所带来的信息革命使人类由工业化的社会进入到了信息化的社会。多媒体技术和 Internet互连网技术的广泛应用加速了全球高速公路的建设,基于网络的多媒体数据传输正改变着人类的生活方式。科学实验表明,人类从外界获取的知识之中,有 80%以上都是通过视觉感知获取的。眼睛获取的是图象信息,一幅图胜过千言万语,图象信息是人类认识世界及人类
6、自身的重要源泉。图象压缩就是在没有明显失真的前提下,将图象的位图信息转变成另外一种能将数据量缩减的表达形式。首先,尽管图象中数据量很大,但数据之间不是完全独立的,图象中存在着各种各样的相关性或冗余信息。即一部分数据可以由另一部分数据完全推算出来。其次,大部分图象视频信号的最终接收者都是人眼,而人类的视觉系统是一种高度复杂的系统,它能从极为杂乱的图象中抽象出有意义的信息,并以非常精练的形式反映给大脑。人眼对图象中的不同部分的敏感程度是不同的,如果去除图象中对人眼不敏感或意义不大的部分,对图象的主观质量是不会有很大影响的。本文主要是利用离散余弦变换压缩和小波变换压缩对图像进行压缩,并对比了图像压缩
7、前后的数据,同时也对比了离散余弦变换压缩和小波变换压缩之间的差异。并得出了自己对两种不同压缩的看法。第 6 页第一章 绪论11 图像压缩技术的发展现状基于分形的方法是近几年来引起关注和争议的一种图像压缩方法。对图像压缩而言,分形主要是利用自相似的特点,通过迭代函数系统来实现压缩。利用分形特征对图像进行描述和处理是很自然的。分形能取得更好的图像质量,当然在较低压缩比的情况下,JPEG 是更好的选择。分形压缩方法计算量比较大,时间开销长,因此加快分形压缩方法的速度是当前研究的热点之一。小波变换(Wavelet Transform)在频率精度方面稍差一些,但在时间的分析能力上更好一些,而且可以对时间
8、和频率同时进行分解,这是传统傅立叶变换所做不到的。小波变换已经开始应用到图像数据压缩等领域,主要是采用离散小波变换。在某些情况下,小波变换更优于 DCT等其他正交变换。利用人工神经网络(Artificial Neural Network,ANN)进行图像压缩是这个领域近几年的又一研究热点,并且取得了积极的进展。这是一种与视觉系统知识紧密相关的压缩方法。ANN 并分布的联结机制与人的视觉系统有某些相似之处,利用此原理及其改进的方法进行图像压缩可获得较好的效果。视频压缩标准,从最初的 H261 发展到现在盛行的 MPEG-4,一直在不断发展,而 1997年 7月诞生了 MPEG7,其标题为“多媒体
9、内容描述接口” ,编号为ISOIECl5938。严格地说,MPEG7 不是一个压缩标准,它的主要目标是对多媒体的信息内容采用各种标准化的描述,以便进行有效的查询和检索。它可独立于其它MPEG标准使用,也可用来增强其它 MPEG标准的功能。MPEG-7 的应用范围很广泛,既可应用于存储(在线或离线),也可用于流式应用(如广播、将模型加入等)。它将在数字图书馆(如图像目录、音乐字典)、多媒体名录服务(如网页)、广播媒体选择(如无线电信道、TV 信道)、多媒体编辑(个人电子新闻业务,媒体写作)等领域发挥重要作用。MPEG-21于 2000年 5月开始,其标题为“多媒体框架”(Multimedia F
10、ramework),主要目标是提供多媒体所需的不同技术之综合。它将为网络环境下的多媒体资源提第 7 页供以下功能:内容的创建、复制、分发、使用、表述,知识产权的管理与保护,内容的标识与描述,金融管理,用户秘密,终端与网络资源提取,事件报告等。由于视频压缩标准在多媒体技术和产业中的特殊地位,世界各地众多的公司、科研机构和院校都投入了大量的人力、物力进行标准的研究,试图占领技术和产业的制高点。目前,在各种视频压缩编码标准中,己注册的专利多以千计,而我国由于在数字图像压缩领域起步较晚,在标准的竞争中处于不利地位。所以我们现今研究的重点是标准的研究。12 研究内容和目的本文通过 DCT和小波变换为基础
11、的压缩方法,最大限度地减小图像的冗余度,同时分析 DCT和小波变换压缩的实验结果,最后比较 DCT和小波变换之间的差异。最后并得出了自己对两种不同压缩方法的看法和今后发展的前景。13 论文结构安排全文安排具体如下:第一章 介绍图像压缩技术的发展现状,第二章 图像压缩的理论分析,第三章 介绍离散余弦变换和小波变换压缩的算法和压缩前后数据的分析,第四章 介绍了本次论文的结果分析和比较,第五章 总结了整个毕业论文期间的感受和体会。第 8 页第二章 图像压缩的理论分析由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人香农提出把数据看作是信息和冗余度的组合。所谓冗余度,是由于一
12、副图像的各像素之间存在着很大的相关性,可利用一些编码的方法删去它们,从而达到减少冗余、压缩数据的目的。为了去掉数据中的冗余,常常要考虑信号源的统计特性,或建立信号源的统计模型。21 图像压缩的可能性图像可以压缩,是因为图像中存在大量的冗余信息,图像的冗余包括以下几种 【1】 :(1)空间冗余:像素点之间的相关性。(2)时间冗余:活动图像的两个连续帧之间的冗余。(3)信息熵冗余:单位信息量大于其熵。(4)结构冗余;图像的区域上存在非常强的纹理结构。(5)知识冗余:有固定的结构,如人的头像。(6)视觉冗余:某些图像的失真是人眼不易觉察的。22 图像压缩原理去 除 多 余 数 据 。 以 数 学 的
13、 观 点 来 看 , 这 一 过 程 实 际 上 就 是 将 二 维 像 素 阵 列 变换 为 一 个 在 统 计 上 无 关 联 的 数 据 集 合 图 像 压 缩 是 指 以 较 少 的 比 特 有 损 或 无 损 地 表示 原 来 的 像 素 矩 阵 的 技 术 , 也 称 图 像 编 码 。图 像 数 据 之 所 以 能 被 压 缩 , 就 是 因 为 数 据 中 存 在 着 冗 余 。 图 像 数 据 的 冗 余 主要 表 现 为 : 图 像 中 相 邻 像 素 间 的 相 关 性 引 起 的 空 间 冗 余 ; 图 像 序 列 中 不 同 帧 之 间存 在 相 关 性 引 起 的
14、时 间 冗 余 ; 不 同 彩 色 平 面 或 频 谱 带 的 相 关 性 引 起 的 频 谱 冗 余 。数 据 压 缩 的 目 的 就 是 通 过 去 除 这 些 数 据 冗 余 来 减 少 表 示 数 据 所 需 的 比 特 数 。 由 于第 9 页图 像 数 据 量 的 庞 大 ,在 存 储 、 传 输 、 处 理 时 非 常 困 难 ,因 此 图 像 数 据 的 压 缩 就 显得 非 常 重 要 。信 息 时 代 带 来 了 “信 息 爆 炸 ”, 使 数 据 量 大 增 , 因 此 , 无 论 传 输 或 存 储 都 需要 对 数 据 进 行 有 效 的 压 缩 。 在 遥 感 技
15、术 中 , 各 种 航 天 探 测 器 采 用 压 缩 编 码 技 术 ,将 获 取 的 巨 大 信 息 送 回 地 面 。图 像 压 缩 是 数 据 压 缩 技 术 在 数 字 图 像 上 的 应 用 , 它 的 目 的 是 减 少 图 像 数 据 中的 冗 余 信 息 从 而 用 更 加 高 效 的 格 式 存 储 和 传 输 数 据 。23 图像压缩的理论基础图像压缩的理论基础是信息论。从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去掉确定的信息(可推知的),也就是用一种更接近信息本质的描述来代替原有冗余的描述。这个本质的东西就是信息量(即不确定因素)【2】 。信息论
16、之父 CEShannon 第一次用数学语言阐明了概率与信息冗余度的关系。在 1948年发表的论文“通信的数学理论(A Mathematical Theory of Communication)”中,香农指出,任何信息都存在冗余,冗余大小与信息中每个符号(数字、字母或单词)的出现概率或者说不确定性有关。依据信息论,设有一个无记忆的信源 A,它产生消息托a 1,i=l,2,N 的概率是已知的,记为 P(a1),i=l,2, ,N,则信息量为:(2.1)iiaPIlog可见越是不可能出现的消息,它的出现对信息的贡献量越大。一个消息出现的可能性越小,其信息量就越多;而消息出现的可能性越大,其信息量就越
17、少。信源的平均信息量称为“熵”(entropy),即:iNiiiNii aPaPIHlog11上式取以 2为底的对数时,单位为比特(bit): iiaNi21log第 10 页熵达到最大的情况出现在信源各符号的出现概率相等时,而信源此时提供最大可能的信源符号平均信息量。香农信息论可以证明:信源熵是进行无失真编码的理论极限。低于此极限的无失真编码方法是不存在的。而且可以证明,利用像素间的相关性,使用高阶熵一定可以获得更高的压缩比。设 K为数字图像第 k个码字 CK的长度(二进制代码的位数)。其相应出现的概率为 PK,则该数字图像所赋于的码字平均长度 R为:MKbitPR1在一般情况下,编码效率往
18、往用下列简单公式表示:%H式中 H为信源熵,R 为平均码字长度。根据信息论中的信源编码理论,可以证明在 RH 条件下,总可以设计出某种无失真编码方法。当然如果编码结果使 R远大于 H,表明这种编码方法效率很低,占用比特数太多。第 11 页第三章 常见无损压缩方法基本原理图像编码与压缩从本质上来说是对要处理的图像源数据按一定的规则进行变换和组合,从而达到以尽可能少的代码(符号)来表示尽可能多的数据信息。压缩通过编码来实现,或者说编码带来压缩的效果。所以,一般把此项处理称之为压缩编码。31 图像压缩编码的分类图像压缩编码的方法目前已有多种,其分类方法视出发点不同而有差异。据统计,图像压缩编码方法已
19、多达 30一 40种。按压缩技术所依据和使用的数学理论和计算方法进行分类,可分为统计编码(Statistical Coding)、预测编码(Predictive Coding)和变换编码(Transform Coding)-大类;按压缩过程的可逆性分为有损压缩(熵压缩 Entropy Compression)和无损压缩(冗余度压缩 Redundancy Reduction)两类 【6】 。按可逆性可分为两大类:第一类压缩过程是可逆的,也就是说,从压缩后的图像能够完全恢复出原来的图像,信息没有任何丢失,称为无损压缩;第二类压缩过程是不可逆的,无法完全恢复出原图像,信息有一定的丢失,称为有损压缩。
20、选择哪一类压缩,要折衷考虑,尽管我们希望能够无损压缩,但是通常有损压缩的压缩比比无损压缩的高。32 预测编码预测编码(predictive coding)主要是减少了数据在时间和空间上的相关性,因而对于时间序列据有着广泛的应用价值。在数字通信系统中,例如语音的分析与合成、图像的编码与解码,预测编码已经得到了广泛的实际应用。预测编码是一种简单而且十分有效的数据压缩方法,广泛应用于声音,图像等数据的压缩。所谓预测,就是根据已经出现的数据样本对将要出现的下一个数据的第 12 页大小做出估计。由于声音、图像等数据具有严格平滑连续性,相邻采样点间数值变化往往不大,因此借助前面的若干个数据样本往往可以较准
21、确地预测出当前样本的数值,预测的误差一般都很小,如果我们不是直接对原始数据进行编码,而是先做预测,然后仅对较小的预测误差进行编码,这样就可以减少码长,达到压缩效果,这就是预测编码的基本思想 7。3.2.1系统框图一个基本的预测编码系统示于图 3-1【8】 。原始数据送入编码单元,与预测器输出的估值相减,得到预测误差值,经编码器编码(如啥夫曼编码)后形成码流进行传输和存储。解码是首先恢复出预测误差值,再和用与编码器相同的预测器计算出的预测值相加,从而恢复出原始数据。图 3-1基本预测编码解码系统第 13 页例如有一组数 200,201,203,202,204,204,假设我们用前一个数据来预测后
22、一个数据,预测编码的工作过程示于图 3-2。预测误差,即原始数据真值与预测值之差分别为 l,2, 1,2,O, 。图 3-2预测编码原理示意图如果采用二进制对原始数据编码,每个数据都需要 8比特。预测编码不是对原始数据编码,而是对预测误差编码。由于预测误差动态范围大大缩小,因此只用 3比特就可以了,这就减少了码长,达到了压缩的目的。预测编码系统图像按行扫描进行编码。在扫到某一像素前,可以用此像素前面的一些像素值对其进行预测估计,然后与实际像素值进行比较。即用实际值减去预测估计值得到差值信号,再将此差值信号量化、编码和传输。在接收端则用量化的差值信号重建图像信号。预测编码最简单的形式是M 调制系
23、统。3.2.2调制增量调制也称调制 【9】 (delta modulation,DM),它是一种预测编码技术,是 PCM编码的一种变形。PCM 是对每个采样信号的整个幅度进行量化编码,因此它具有对任意波形进行编码的能力。DM 是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成“O”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正” ,则用“1”表示;相反则用“O”表示,或者相反。由于 DM编码只需用 l位码对信号进行编码,所以 DM编码系统又称为“1第 14 页位系统” 。DM编码基本原理框图如图 3-3所示,其中上图为编码原理框图,下图为译码原理
24、框图。DM 编码器包括比较器、本地译码器和脉冲形成器三个部分。接收端译码器比较简单,它只有一个与编码器中的本地译码一样的译码器及一个视频带宽的低通滤波器。图 3-3 DM编码、译码原理图DM编码器实际上就是 1 bit编码的预测编码器。它用一位码子来表示 e(t),(3.1)tfte式中 f(t)为输入视频信号,f(t)是 f(t)的预测值。当差值 P(f)为一个正的增量时用“1”码来表示,当差值 P(r)为一个负的增量时用“0”码来表示。在收端,当译码器收到“1” 时,信号则产生一个正跳变,收到“O”时,则信号电压产生一个负的跳变,由此即可实现译码。DM波形编码的原理如图 3.4所示。纵坐标
25、表示“模拟信号输入幅度” ,横坐标表示“编码输出” 。用 i表示采样点的位置,xi表示在 i点的编码输出。输入信号的实际值用 yi表示,输入信号的预测值用 yi+1=yi表示。假设采用均匀量化,量阶的大小为,在开始位置的输入信号 y0=0,预测值 y0=0,编码输出x0=l。现在让我们看几个采样点的输出。在采样点 i=l处,预测值 y1=,由于实际输入信号大于预测值,因此 x1=l;在采样点 i=4处,预测值 y4=4,同样由于实际输入信号大于预测值,因此 x4=1;其他情况依此类推。第 15 页从图 3-4中可以看到,在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化,这种现象就称为增
26、量调制器的“斜率过载”(slope overload)。一般来说,当输入信号的变化速度超过反馈回路输出信号的最大变化速度时,就会出现斜率过载。之所以会出现这种现象,主要是反馈回路输出信号的最大变化速率受到量化阶大小的限制,因为量化阶的大小是固定的。从图 3-4中还可以看到,在输入信号缓慢变化部分,即输入信号与预测信号的差值接近零的区域,增量调制器的输出出现随机交变的“0”和“l” 。这种现象称为增量调制器的粒状噪声(granular noise),这种噪声是不可能消除的。图 3-4 DM波形编码示意图在输入信号变化快的区域,斜率过载是关心的焦点,而在输入信号变化慢的区域,关心的焦点是粒状噪声。
27、为了尽可能避免出现斜率过载,就要加大量化阶,但这样做又会加大粒状噪声;相反,如果要减小粒状噪声,就要减小量化阶,这又会使斜率过载更加严重。DM最普通的译码器就是一个 RC积分电路。利用 RC的充、放电即可实现译码。第 16 页33 常见压缩方法香农的率失真理论奠定了信源编码的理论基础。以此理论为依据可以得到数据压缩的两种基本途径:一是改变了信源的概率分布,使其尽可能地非均匀,再用最佳编码方法使平均码长逼近信源熵;二是信源的冗余度寓于信源符号间的相关性之中,去除它们之间的相关性,使之成为或近似成为不相干信源。图像压缩编码有几十种之多,并且涉及到很深的数学理论和推导,在此只介绍几种方法。3.3.1
28、 JPEG2000与 JPEG的区别JPEG是 Joint Photographic Experts Group的缩写。 “jpg ” 、 “ j p e g ” 是其最常用的图像文件格式 。联合图像专家组成立于 l986年,1992 年发布了 JPEG的标准而在 1994年获得 IS( )1099181的认定 。规定对静止图像进行压缩 的建议性标准,其目的是为了提供一个适用于连续色度图像的压缩标准。在编码和解码时 ,JPEG 使用离散余弦变换(DCT),并对图像的分量从左到右 ,从上到下进行扫描编码。这种编码方式在中、高比特率时 ,可以得到质量满意的压缩图像 ,并且实现累进传输 。 JPEG
29、 是一种有损压缩格式,能够将图像压缩在很小的储存空间 ,图像中重复或不重要的资料会被丢失,因此容易造成图像数据的丢失。尤其是使用过高的压缩比例,将使最终解压缩后恢复的图像质量明显降低。JPEG 也是一种很灵活的格式,具有调节图像质量 的功能,允许用不同压缩比例对文件进行压缩,支持多种压缩级别,压缩比率通常在 10:1 到 40:1 之间,压缩比越大,品质就越低;相反地,压缩比越小,品质就越好。JPEG 格式压缩的主要是高频信息,对色彩的信息保留较好,适合应用于互联网,可减少图像的传输时间,可以支持 24bit真彩色,也普遍应用于需要连续色调的图像。JPEG2000是国际化标准组织(ISO)和国
30、际电子技术联盟(IEC)联合推出的新一代静止图像压缩标准,自 1997年开始起草,2000 年 12月国际标准(IS)正式发布,文第 17 页档代码为 ISOIEC 154441。JPEG2000 是取代 JPEG的下一代图像压缩标准。提供了许多新的特性,其中包括:低码率下的超级压缩特性;连续色调和二值图像压缩;支持无损和有损压缩 渐进性传输;感兴趣区域编码;码流的随机访问和处理;良好的容错性等等。JPEG2000与传统 JPEG 最大的不同,在于放弃了 JPEG所采用的以离散余弦转换 (Discrete Cosine Transform)为主的区块编码方式,而采用以小波转换 ( Wavele
31、t transform)为主的多解析编码方式。小波转换的主要目的是要将影像的频率成分抽取出来 JPEG2000的编码、解码过程 图 3-5 编解码过程 JPEG2000与 JPEG的区别 JPEG2000与 JPEG最大的不同,在于它放弃了 JPEG 所采用的以离散余弦转换 ( Discrete Cosine Transform)为主的区块编码方式,而改用以小波转换( Wav elet transform)为主的多解析编码方式。JPEG2000与 JPEG的比较 如图 3-6第 18 页图 3-63.3.2 JPEG2000与 JPEG的实验比较 3.3.2.1将彩色图像转化为灰度图像先读取一
32、张彩色的图片 22,然后用 rgb2gray转化灰度,最后显示转化过的灰度图像,程序如下:I=imread(d:我的文档桌面22.jpg);J=rgb2gray(I);imshow(J)第 19 页图 3-7 彩色图像图 3-8 转化后的灰度图像如图 3-7和图 3-8所示,是将彩色图像转化为灰度图像3.3.2.2基于离散余弦变换(DCT)实现图像压缩程序:I=imread(cameraman.tif);imshow(I);title(原始图像)disp(原始图像大小:)第 20 页whos(I)I=im2double(I);%图像类型存储转换,将图像矩阵转换成双精度类型T=dctmtx(8)
33、;%离散余弦变换矩阵B=blkproc(I,8 8,P1*x*P2,T,T);mask=1 1 1 1 0 0 0 01 1 1 0 0 0 0 01 1 0 0 0 0 0 01 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 00 0 0 0 0 0 0 0;B2=blkproc(B,8 8,P1.*x,mask);I2=blkproc(B2,8 8,P1*x*P2,T,T);figure,imshow(I2);title(压缩后的图像)disp(压缩图像的大小:)whos(I2)程序运行结果:第 21 页图 3-9离散余
34、弦变换压缩前后的数据对比 图 3-10 离散余弦变换压缩的原图 图 3-11离散余弦变换压缩后的图像 程序的运行结果如图 3-10和图 3-11所示。从运行结果可以看出,DCT 变换虽然可以得到良好的图像质量,但压缩率并不大。3.3.3 小波变换的分析:小波分解方法是一种窗口大小(即窗口面积)固定,但其形状可改变,时间窗和频率窗都可改变的时频局域化分析方法,即在低频部分具有较高的频率分辨率和较低的时间分辨率,在高频部分具有较高的时间分辨率和较低的频率分辨率,所以被称为“数学显微镜” 。正是这种特性, 使小波变换具有对信号的自适应性。小波变换可以同时在时域和频域上分析信号的局部特性。平方可积函数
35、 f(t )L 2(R)的连续小波变换定义为 ()(1, ,tfdtabtfabWTbat 其中,小波变换的核函数 是母小波 的时间平移 b和尺ttba)(, )(t度伸缩 a的结果,表示内积运算。小波变换的基本思想是用一族函数去表示或逼近一信号,该族函数称为小波函数系。它是通过一个小波母函数的伸缩和平移,产生其“子波”来构成。图像可以看做是二维矩阵。一般假设图像矩阵的大小为 M X N,那么每次小波变换后,图像第 22 页便分解为 4个大小为原来尺寸 1/4的子块频带区域:LL 频带,HL 频带,LH 频带和HH频带。分别包含了相应频带的小波系数,相当于在水平方向和竖直方向上进行隔点采样。L
36、L 频带保持了原始图像的内容信息,图像的能量集中于此频带。HL 频带保持了图像水平方向上的高频边缘信息。LH 频带保持了图像竖直方向上的高频边缘信息。HH 频带保持了图像在对角线方向上的高频信息。进行下一层小波变换时,变换数据集中在 LL频带上。 3.3.3.1利用小波变换实现图像压缩程序:clear allI=imread(cameraman.tif);imshow(I); %显示图像title(原始图像)disp(原始图像 I的大小:);whos(I)I=im2double(I);c,s=wavedec2(I,2,bior3.7); %对图像用小波进行层分解cal=appcoef2(c,s
37、,bior3.7,1); %提取小波分解结构中的一层的低频系数和高频系数ch1=detcoef2(h,c,s,1); %提取二维水平方向细节系数cv1=detcoef2(v,c,s,1); %提取二维垂直方向细节系数cd1=detcoef2(d,c,s,1); %提取二维对角线方向细节系数ca1=appcoef2(c,s,bior3.7,1); %保留小波分解第一层低频信息ca1=wcodemat(ca1,440,mat,0); %首先对第一层信息进行量化编码ca1=0.5*ca1; %改变图像高度figure,image(ca1); %显示压缩后的图象title(第一次压缩后的图像)disp
38、(第一次压缩图像的大小为:)whos(ca1)第 23 页ca2=appcoef2(c,s,bior3.7,2); %保留小波分解第二层低频信息进行压缩ca2=wcodemat(ca2,440,mat,0); %首先对第二层信息进行量化编码ca2=0.25*ca2; %改变图像高度figure,image(ca2); %显示压缩后的图象title(第二次压缩后的图像)disp(第二次压缩图像的大小为:)whos(ca2)运行结果:图 3-12 小波变换压缩前后数据第 24 页图 3-13 小波变换压缩原图图 3-14 小波变换第一次压缩后的图像第 25 页图 3-15 小波变换第二次压缩后的图
39、像将上述语句执行后结果如图 3-12所示,实际上压缩前图像的大小为 256X256个像素,所占空间 65536字节,第一次压缩后的大小为 135135个像素,所占空间为145800字节;而第二次压缩后的大小为 75X75个像素,所占空间为 45000字节。其压效效果显而易见。可以看出,第一次压缩是提取原始图像中小波分解第一层的低频信息,此时压缩 效果较好,压缩比较小;第二次压缩是提取第一层分解低频部分的低频 部分(即第二层的低频部分),其压缩比较大,压缩效果在视觉上也基本可以。3.3.3.2二维小波分析压缩图像 Matlab实现在本实验中采用的是较为经典的实验图像 11头像,该文件格式是“jp
40、g”的位图文件,文件存放在 D盘根目录。我们运用 Matlab工具箱中的函数及相关语法得到如下程序:clear allI=imread(d:我的文档桌面11.jpg);imshow(I); %显示图像title(原始图像)disp(原始图像 I的大小:);第 26 页whos(I)I=im2double(I);c,s=wavedec2(I,2,bior3.7); %对图像用小波进行层分解cal=appcoef2(c,s,bior3.7,1); %提取小波分解结构中的一层的低频系数和高频系数ch1=detcoef2(h,c,s,1); %提取二维水平方向细节系数cv1=detcoef2(v,c,
41、s,1); %提取二维垂直方向细节系数cd1=detcoef2(d,c,s,1); %提取二维对角线方向细节系数ca1=appcoef2(c,s,bior3.7,1); %保留小波分解第一层低频信息ca1=wcodemat(ca1,440,mat,0); %首先对第一层信息进行量化编码ca1=0.5*ca1; %改变图像高度figure,image(ca1); %显示压缩后的图象title(第一次压缩后的图像)disp(第一次压缩图像的大小为:)whos(ca1)ca2=appcoef2(c,s,bior3.7,2); %保留小波分解第二层低频信息进行压缩ca2=wcodemat(ca2,44
42、0,mat,0); %首先对第二层信息进行量化编码ca2=0.25*ca2; %改变图像高度figure,image(ca2); %显示压缩后的图象title(第二次压缩后的图像)disp(第二次压缩图像的大小为:)whos(ca2) 运行结果:第 27 页图 3-16 小波变换压缩前后的数据图 3-17小波变换压缩的原图第 28 页图 3-18 小波变换第一次压缩的图像图 3-19 小波变换第二次压缩后的图像如图 3-16实际上压缩前图像的大小为 240240个像素,所占空间为 57600字节,第一次压缩后的大小为 127127个像素,所占空间为 129032字节;而第二次第 29 页压缩后
43、的大小为 71X71个像素,所占空间为 40328字节。其压效效果显而易见。可以看出,第一次压缩是提取原始图像中小波分解第一层的低频信息,此时压缩 效果较好,压缩比较小;第二次压缩是提取第一层分解低频部分的低频部分(即第二层的低频部分),其压缩比较大,压缩效果在视觉上也基本可以。3.3.4 DCT和小波变换的图像压缩的比较长期以来,人们对静止图像(包括活动图像一视频)的压缩编码都是基于 DCT变换编码,这些基 DCT变换的编码算法也已成熟地应用于各个方面的图像压缩。作为一种多分辨率分析方法,小波变换具有很好的时一频或空一频局部特性,特别适合按照人类视觉系统特性设计图像压缩编码方案,也非常有利于
44、图像的分层传输。本文通过对图像 DCT和小波变换性能差别的研究。 分析图像压缩算法应当从全面、系统观点考虑,经过静止图像的基于 DCT和小波的编码比较后,可知在图像编码中的主要因素是量化器和熵编码器,而不是小波变换和 DCT的差别。对于静止的图像来说,小波变换和 DCT之间的差别很小,还不到 1 d B。相对于 DCT域下的图像压缩,小波压缩具有很大优势。小波变换能够有效地应用于图像数据压缩,从根本上说,其压缩机理正是体现在小波变换对图像的多频段分解恰与人类觉系统的多频率通道特性相吻合,从而使我们能够从人类视觉的多通道处理特性上对图像进行相应的压缩处理。从形式上讲,小波变换提供了一种有效的多层
45、次结构的图像描述形式,能够从整体上把握图像的结构,可以利用图像中更大范围内的相关性,并使得图像的统计特性变得相对简单化。而且对于一般的图像,经过小波压缩后能够得到很大的压缩比,而且压缩后的图像画面没有大的失真。如果要改变压缩比,只需要调整程序中子矩阵的大小即可。最后,小波压缩的程序既简单又实用,更加方便于被广泛利用。如图 3-20,离散余弦变换和小波变化压缩前后数据对比,通过此图可以很清楚看出两种不同的变换压缩前后的数据对比。离散余弦变换压缩 尺寸 大小/字节 程序运行时间第 30 页压缩前图像 256x256 65536压缩后图像 256x256 524288 0.9060小波变换压缩 尺寸
46、 大小/字节 程序运行时间压缩前图像 240x240 57600第一次压缩后图像 127x127 129032 0.4530第二次压缩后图像 71x71 40328 0.10903-20离散余弦变换和小波变化压缩前后数据对比第四章 结论在许多应用领域,都会用到数字图像。由于数字图像数据量大因此就会面临数字图像信息进行传输或存储的问题。想要在有限的存储 空间尽可能的存储更多的图像 或者在有限的时间内传输更多的图像,这就涉及数字图像的压缩技术。图像压缩技术是图像处理技术的重要分支之一,图像压缩技术的研究几十年来取得了很多的成就。目前存在的图像压缩技术都各自有各自的优点但也存在不足。本文在介绍了现有的几种图像压缩技术的基础上,详细分析了 DCT和小波变换压缩,并对压缩前后的数据和图像进行了对比,并得出了从全面、系统观点考虑,经过静止图像的基于 DCT和小波的编码比较后,可知在图像编码中的主要因素是量化器和熵编码器,而不是小波变换和 DCT 的差别。从本文实验可以看出相对于 DCT域下的图像压缩,小波压缩具有很大优势。从根本上说,小波压缩机理正是体现在小波变换对图像的多频段分解恰与人类觉系统