1、在保证质量的前提下以较小的空间存储图像和较少的比特率传输图像,第七章 图像编码,压缩基础 无损压缩技术 有损压缩技术 评价参数与压缩标准 图像文件格式,Your wife, Helen, will meet you at Logan Airport in Boston at 5 minutes past 6:00 P.M. Tomorrow night.,Your wife, Helen, will meet you at Logan Airport in Boston at 5 minutes past 6:00 P.M. Tomorrow night.,Your wife, Helen,
2、will meet you at Logan Airport in Boston at 5 minutes past 6:00 P.M. Tomorrow night.,冗余的 Redundant,不相干的Irrelevant,信息,信息,图像包含大量的数据,但这些数据是高度相关的,静止图像往往含有大量的空间冗余信息;动态图像不但含有大量的空间冗余信息还含有大量的时间冗余信息。,冗余信息 信息熵、结构、知识、视觉,图像信息,信息,消息的平均信息量,应用分类,数据域分类,压缩技术,空间域编码,变换域编码,其他方法,图像压缩编码技术,实现,压缩基础 无损压缩技术 有损压缩技术 评价参数与压缩标准
3、图像文件格式,最佳二进制编码,设图像的灰度集合X=x1,x2,xn,灰度的概率为 P(x1), P(x2), P(xn), 现用一种不等长度代码 W=1,2,.3对X进行编码,最佳二进制编码,不同的代码结构将对应于各自不同的最佳代码分配,通过用较短代码代表频繁出现的字符,用较长代码代表不常出现的字符,从而实现数据的压缩。,基于统计的技术,无损压缩-统计技术,哈夫曼编码是平均码长以最大限度的逼近其信息源熵值的最好方法,码字的排列顺序 本身概率所赋予的符号及其构成联合概率的符号,再反序。,0,0,1,0,G:0100,哈夫曼编码例题,C: 1 B: 001 A: 011 F: 0000 E: 01
4、01 D: 00010 H: 00011,无损压缩-统计技术,PCM编码-脉冲编码调制,对连续图像信号的空间进行采样、幅值量化并用适当码字将其量化编码。编码方法有等长和不等长编码两种。它属于有误差编码。,无损压缩-统计技术,DPCM编码-差分脉冲编码调制,空间域中最成熟也是最通用的编码技术。其结构和语言信号中使用的线性预测编码完全相同。与 PCM 不同的是它编码的是图像象素及其预测值的差分。该编码系统会引起斜率过载、界线繁忙、颗粒噪声和轮廓噪声。,由于象素灰度之间的相关性,可根据象素以前的象素估计或预测该象素。,预测值是根据实际灰度值和其邻域相关象素估计出来,其差分值所组成的随机序列各元素之间
5、将比原图像象素之间具有更小的相关性。此外大部分元素都落在很小的灰度值区间内。,P143-148,生成的文件包含的是定长码 (12-16位) , 每个码代表原文件中数据的一个特定序列。,无损压缩-字典技术,基于字典的技术,帧间编码技术,序列图像的传送与存储,压缩任务,单帧图像的相关数据压缩相继帧间图像的相关数据压缩,解决方法,稳定数据与上一帧图像比较不变的数据 重建时重复上一帧图像 运动数据与上一帧图像比较变化的数据 重建时在上一帧图像上叠加帧间相应象素的误差,帧间图像误差超过给定门限的数值,自适应帧间预测编码技术,稳定区缓变区速变区,变动指数前已编码象素邻域象素帧间之差的绝对值,实现方案p15
6、0151,等值线编码技术IP算法,T算法,等值线的灰度其起始点位置IP算法指向符序列等值变化的方向的序列,边缘,轮廓,以线条为主的图像,适合对象,压缩基础 无损压缩技术 有损压缩技术 评价参数与压缩标准 图像文件格式,有损压缩-变换域编码,变换图像编码 图像变换后删去那些接近于零的系数,粗量化那些较小的系数,由此将传输和存储的数据集中到那些包含图像主要信息的系数上。在重构图像中,那些重要内容很少会有损失。,变换域编码-K-L变换,K-L变换编码,求图像向量X的K_L变换,就是求图像协方差矩阵Cx的特征向量i,也称特征向量变换。,变换域编码-余弦变换,原图像,FDCT,量化器,熵编码器,压缩图像
7、数据,解熵编码器,解量化器,IDCT,重建图像,编码过程,解码过程,DCT编码,图像DCT变换后,大多数的DCT系数值非常接近0,舍弃这些系数对重构图像质量影响不大。,变换域编码性能比较,图像大小,子图像太小,各变换误差较大;子图像大小1616,误差变小;,误差最小是 K-L变换,最差的是哈尔变换;傅立叶变换随子图像的大小变大,其性能变得越好。,有损压缩-矢量量化编码,编码器,在量化时用码书中的一组码字代替一组输入矢量,根据一定的失真测度在码书中搜索出与输入矢量失真最小的码字的索引。在传输时仅传输这些索引,接收方根据码字索引在码书中查找对应码字,从而再现矢量。,解码器,矢量量化编码示例,原始,
8、压缩,小波变换编码,利用小波分解,去掉图像高频部分而保留低频部分,压缩比高,能保持图像特征基本不变,抗干扰能力强。,高分辨率字图像上大部分点数值接近零,第一次压缩,第二次压缩,原图,新发展的编码技术,压缩基础 无损压缩技术 有损压缩技术 评价参数与压缩标准 图像文件格式,客观保真度评价准则,以输入图像和重建图像之间数据的保误差为基础,导出各种失真测度,如均方差、均方根误差或信噪比的各种保真度准则。保真度准则可作为检验图像系统的一种量度。,主观保真度评价准则,图像质量的优劣既与图像的客观保真度有关,又与人的视觉生理特征有关。,主观评价常受到图像的内容、类型复杂程度、测试环境等因素的影响,压缩标准
9、,压缩标准,压缩标准,压缩标准,JBIG标准 Joint Bi-level Image Group,联合二值化图像专家组简称。1991年9月推出,用于二值图像上午累进压缩编码,是一种传真图像压缩新标准。,无失真编码,编码效率高,能自适应图像特征二值图像的累进编码。适用于图像数据库的浏览灰度和彩色图像的信息保持型编码。效率不低于 JPEG 的无失真模式。,特点,压缩标准,评价图像压缩技术,压缩比(比特率) 压缩时间 压缩质量(保真度),压缩基础 无损压缩技术 有损压缩技术 评价参数与压缩标准 图像文件格式,图像文件格式,PCX,TIFF,GIF,BMP,JPEG,PCX图像文件格式,Zsoft
10、公司为其软件产品PC Paintbrush 开发的一种图像文件格式。,特点,RLE压缩方式一个文件只存储一幅图像256色PCX图像必须包含调色板数据PCX图像的显示与设备密切相关,PCX文件结构,128个字节的头标,长度随图像大小变化,typedef struct char manufacturer; /always 0xa0 char version; /version No. char encoding; /always 1(RLE) char bits_per_pixel; /color bits int xmin,ymin; /image origin int xmax,ymax; /
11、image dimensions int hres; /resolution values int vers; /resolution values char pattern48; /color palette char reserved; char color_planes; /color planes int bytes_per_line; /line buffer size int palette_type; /1 grey or 2 color char filler58; PCXHEAD;,1 1 1 1 2 2 4 8 8,1 2 3 4 1 4 1 1 3,单色 4色 8色 16
12、色 4色,CGA 16色 16色,EGA 256色 真彩色,解释,读入 PCX文件头结构,PCXHEAD h; if(fread(char*),PCX图像文件格式,优点对绘图软件生成的图形有较好的压缩效果缺点不提供保存灰度或彩色校正表不能保存CMYK 数据或HIS数据扫描图像或视频图像的压缩效果较差,GIF图像文件格式,1987年,CompuServe 公司为方便网络以及BBS用户传送图像数据而设计的文件格式 - Graphics Interchange Format,特点,文字叠加功能;改进的LZW压缩算法处理图像数据;一个文件同时存储多幅图像;支持交错图像生成,适合于图像传输类应用;为图像
13、传输格式设计,使用顺序文件组织方式。,GIF图像文件结构,文件标识块,逻辑屏幕描述块,可选择的调色板数据块,图像数据块,结束码的尾块,块,GIF图像文件结构,标记,屏幕描述,下一步步骤,全局彩色表,图像长宽比,背景颜色索引值,GIF图像文件格式,优点 多幅图像的保存提供足够的信息,结构性好 允许差别较大的I/O设备交换图像缺点不提供保存灰度或彩色校正表不能保存CMYK 数据或HIS数据只能保存256种24位彩色,TIFF图像文件格式,1986年,Aldus 公司设计的一种通用的位映射图像文件格式 - Tagged Image File Format,特点,一个文件中保存多幅图像;支持任何尺寸的
14、图像;支持多种压缩方法,灵活性好,适应范围广;为图像存储格式设计,使用随机组织方式;独立于计算机结构,操作系统和图形硬件。,TIFF文件结构,文件头 - 图像文件头IFH,8个字节组成,必须位于和0相对的固定位置;标识信息区 - 图像文件目录IFD,每一组都由固定长度12字节的标记指针组成,指向IFD目录的信息指针;图像数据区 - 存放图像数据的部分,并指示TIFF图像文件的压缩与保存、数据的排列方式以及图像分割的方法等信息。,TIFF文件表头数据结构部分,typedef struct unsigned int Byte_Order; unsigned int Version; unsigne
15、d long TagOffset; TIFFHEADER;,字节顺序域,位置域,版本域,标识信息区 - IFD,typedef struct unsigned int Tag;/2 unsigned int Type;/2 unsigned long Length;/4 unsigned long Offset;/4 TIFFTAG;,标记码,类型码,长度字段,数据字段,TIFF文件的重要标记字段,必不可少,图像数据区,分割后的每个数据条的长度, 图像没有压缩时,值是条内字节的和; 图像压缩后,值是压缩后字节数的值。,数据条的大小,既每个数据条内行数,指出数据条在文件中起始地址,图像数据区,每
16、块的列数,必须是16的倍数,每块的行数,必须是16的倍数,分割后的每块的长度,每块在文件中的起始地址, 图像没有压缩时,值是条内字节的和; 图像压缩后,值是压缩后字节数的值。,TIFF图像文件格式,优点适用范围广; 独立于计算机结构,操作系统和图形硬件; 能保存黑白、灰度及彩色图像;用作进行数据交换的位图格式。缺点TIFF的任选项及变种带来解码困难;TIFF文件格式可定义而变得“模糊”,BMP图像文件格式,微软公司为Windows环境设置的标准图像格式,而且Windows系统软件中内含了一系列支持BMP图像处理的API函数 - Bitmap,特点,一个文件中只保存一幅图像; 压缩处理成为图像文
17、件的一个选项; 非压缩格式是BMP图采用的通用格式,压缩格式采用RLE4(16色)或RLE8(256色)方式。 支持多种图像的存储; 数据排列顺序以图像的左下角为起点,RGB三基色数据的排列顺序与其它图像格式相反。 设备独立性,以一种独立于设备的方法描述位图。,BMP文件结构,文件头 - 固定长度值54个字节,由两个数据结构 BITMAPFILEHEADER,BITMAPINFOHEADER组成;调色板数据 - 对所有不超过256色的图像模式进行设置,真彩色图像模式例外; 图像数据 - 存放图像数据的部分,与图像数据是否压缩、图像文件的大小以及图像处理软件是否支持压缩处理的BMP图像文件有关。
18、,BMP文件头数据结构 BITMAPFILEHEADER,typedef struct tagBITMAPFILEHEADER WORD bfType; WORD bfSize; WORD bfReserved1; WORD bfReserved2; DWORD bfOffBits; BITMAPFILEHEADER;,位图文件的类型,必须为BM,位图文件的大小,字节单位,位图文件保留字,必须为0,位图文件保留字,必须为0,BMP文件的类型、大小和打印格式等信息,BMP文件头数据结构 BITMAPINFOHEADER,typedef struct tagBITMAPINFOHEADER DWO
19、RD biSize; DWORD biWidth; DWORD biHeight; WORD biPlanes; WORD biBitCount; DWORD biCompression; DWORD biSizeImage; DWORD biXPeIsPerMeter; DWORD biYPeIsPerMeter;DWORD biClrUsed; DWORD biClrImportant; BITMAPINFOHEADER;,本文件头标的大小,以字节为单位,位图的宽度,以象素为单位,每象素彩色位数,1、4、8或24,位图的高度,以象素为单位,图像位平面数,必须为1,压缩类型, 0(压缩)、1
20、(RLE8)或2(RLE4),压缩图像字节大小,水平分辨率,垂直分辨率,使用的彩色数,“重要”的彩色数,位图 尺寸,BMP调色板数据结构,typedef tagRGBQUAD BYTE rgbBlue; BYTE rgbGreen; BYTE rgbRed; BYTE rgbReserved; RGBQUAD;,蓝色值,00-FF,绿色值,00-FF,保留字段,必须为0,红色值,00-FF,每象素1、4、8位的图像必须有一彩色表,其彩色表的大小分别为2、16、256个入口,每个入口为3个字节,00-FF。,位图 颜色,位图 尺寸,位图 颜色,图像数据区-非压缩,位图扫描行与位图阵列的关系 Wi
21、ndows 对于BMP图像特别规定:文件每行字节的个数必须是4的倍数注意BMP图像数据的存储方式 单色 一个字节记录8个象素16色 一个字节记录2个象素256色 一个字节记录1个象素真彩色 三个字节记录1个象素,图像数据结构,当前BMP图像数据的水平方向长度,每个象素所使用的颜色模式,指定调色板数据的起始地址 NULL指不含调色板信息, 1=单色图像;4=16色;8=256色;24=真彩色。,当前BMP图像数据的垂直方向长度,BMP图像文件格式,优点在Windows下受到广泛支持,支持稀疏位图缺点只适合于Windows上的应用软件,阻碍BMP文件格式的流通程度;文件普遍较大。,JPEG图像文件格式,利用数字化图像的标准编码技术,对图形图像进行处理得来的象素格式的文件格式 - Joint Photographic Experts Group,特点,采用有损编码压缩技术; 解码后的图像比一般图像(GIF)更接近原始图像; JPEG 格式采用的标准是数据流编码标准,还有一种渐进子格式; 编码技术比GIF、BMP等图像文件要复杂。,JPEG图像格式的编码技术,图像变换,Huffman或 算术编码,JPEG图像文件格式,优点适合于大部分的图像类型;特别适合于处理摄影得到的照片;压缩比大,解码后的重构图像效果能较好地接近原始图像;缺点不适合处理具有突出边界的图像;编码技术很复杂。,