ch5彩色数字图像基础.ppt-道客多多

资源描述

1、多媒体技术,第五章：彩色数字图像基础,多媒体技术,2006年,中山大学信息科学与技术学院,主要内容,视觉系统对颜色的感知图像的颜色模型图像的基本属性图像的分类伽马()校正常用图像文件格式,多媒体技术,2006年,中山大学信息科学与技术学院,视觉系统对颜色的感知,可见光的波长范围为380nm780nm，大多数自然光都是由不同波长的光组合而成。眼睛本质上是一个照相机。人的视网膜(human retina)通过神经元来感知外部世界的颜色，每个神经元或者是一个对颜色敏感的锥体(cone)，或者是一个对颜色不敏感的杆状体(rod)。人的视网膜有对红、绿、蓝颜色敏感程度不同的三种锥体细胞，另

2、外还有一种在光功率极端低的条件下才起作用的杆状体细胞，因此颜色只存在于眼睛和大脑中。颜色是视觉系统对可见光的感知结果。红、绿和蓝三种锥体细胞对不同频率的光的感知程度不同，对不同亮度的感知程度也不同，因此不同组成成分的可见光就呈现出不同的颜色,多媒体技术,2006年,中山大学信息科学与技术学院,视觉系统对颜色的感知,视觉系统对颜色和亮度的响应特性曲线（各个波长的光的强度相等）,多媒体技术,2006年,中山大学信息科学与技术学院,视觉系统对颜色的感知,上面的颜色响应曲线表明，人类眼睛对蓝光的灵敏度远远低于对红光和绿光的灵敏度。亮度响应曲线表明人眼对波长为550nm左右的黄绿色最为敏感。,多媒体

3、技术,2006年,中山大学信息科学与技术学院,视觉系统对颜色的感知,许多具有不同光谱分布的光产生的视觉效果（颜色）是一样的。即光谱与颜色的对应是多对一的。光谱分布不同而看上去相同的两种颜色称为条件等色（匹配等色）。绝大部分可见光谱对眼睛的刺激效果都可以用红（700nm）、绿（546.1）、蓝（435.8nm）三色光按不同比例和强度的混合来等效表示。（三刺激理论）,多媒体技术,2006年,中山大学信息科学与技术学院,视觉系统对颜色的感知,匹配任意可见光所需的三原色光比例曲线,多媒体技术,2006年,中山大学信息科学与技术学院,视觉系统对颜色的感知,视觉系统对颜色的感知,从人的主观感觉角度，颜

4、色包含三个要素： 1、色调（hue）：色调反映颜色的类别，如红色、绿色、蓝色等。色调大致对应光谱分布中的主波长。,视觉系统对颜色的感知,2、饱和度（Saturation）饱和度是指彩色光所呈现颜色的深浅或纯洁程度。对于同一色调的彩色光，其饱和度越高，颜色就越深，或越纯；而饱和度越小，颜色就越浅，或纯度越低。高饱和度的彩色光可因掺入白光而降低纯度或变浅，变成低饱和度的色光。100%饱和度的色光就代表完全没有混入白光的纯色光。,视觉系统对颜色的感知,3、明亮度（luminance）明亮度是光作用于人眼时引起的明亮程度的感觉。一般来说，彩色光能量大则显得亮，反之则暗。大量试验表明，人的眼睛能分辨12

5、8种不同的色调，1030种不同的饱和度，而对亮度非常敏感。人眼大约可以分辨35万种颜色。,颜色模型,颜色模型（color model）是用来精确标定和生成各种颜色的一套规则和定义。某种颜色模型所标定的所有颜色就构成了一个颜色空间。颜色空间通常用三维模型表示，空间中的颜色通常使用代表三个参数的三维坐标来指定对于人来说，可以通过色调、饱和度和亮度来定义颜色（HSL颜色模型）；对于显示设备来说，可以用红、绿、蓝磷光体的发光量来描述颜色（RGB颜色模型）；对于打印设备来说，可以使用青色、品红、黄色和黑色颜料的用量来指定颜色（CMYK颜色模型）。,理论上绝大部分可见光谱都可用红、绿和蓝 (RGB)

6、三色光按不同比例和强度的混合来表示。颜色CR(红色的百分比)G(绿色的百分比) B(蓝色的百分比)RGB模型称为相加混色模型，用于光照、视频和显示器。例如，显示器通过红、绿和蓝荧光粉发射光线产生彩色。,RGB颜色模型,CMYK颜色模型,在理论上，绝大多数颜色都可以用三种基本颜料（青色cyan、品红magenta、和黄色yellow）按一定比例混合得到。理论上，青色、品红和黄色三种基本色素等量混合能得到黑色。但实际上，因为所有打印油墨都会包含一些杂质，这三种油墨混合实际上产生一种土灰色，必须与黑色 (K) 油墨混合才能产生真正的黑色，所以再加入黑色作为基本色形成CMYK颜色模型。 CMYK模

7、型称为相减混色模型。,相加色与相减色的关系,RGB模型到CMYK模型的转换,分色算法（F代表白色）,颜色模型的空间表示,RGB彩色空间和CMY彩色空间的表示法,HSL颜色模型,在HSL模型中，H定义色调；S定义颜色的深浅程度或饱和度；L定义亮度。 RGB模型和CMYK模型主要是面向设备的，而HSL模型更容易被人理解和控制。,颜色的输入,图像的分类,矢量图与点位图矢量图是用一系列计算机指令来表示一幅图，如画点、画线、画曲线、画圆、画矩形等。这种方法实际上是用数学方法来描述一幅图。矢量图的优点是：（1）缩放、旋转、移动时图像不会失真。（2）存储和传输时数据量较小。矢量图的缺点是：（1）图像显示时花

8、费时间比较长。（2）真实世界的彩色图像难以转化为矢量图。,图像的分类,矢量图与点位图点位图是将一副图像在空间上离散化，即将图像分成许许多多的像素，每个象素用若干个二进制位来指定该像素的颜色或灰度值。点位图的优点是：（1）显示速度快。（2）真实世界的图像可以通过扫描仪、数码相机、摄像机等设备方便的转化为点位图。点位图的缺点是：（1）存储和传输时数据量比较大。（2）缩放、旋转时算法复杂且容易失真。,图像的分类,矢量图,点位图,图像的分类,灰度图,标准单色图标准灰度图,图像的分类,彩色图,256色标准图像 24位标准图像,图像的基本属性,1、分辨率显示分辨率：指显示屏上能够显示出的象素数目。同样

9、大小显示屏能够显示的象素越多，说明显示设备的分辨率越高，显示的图像质量也就越高。（640480，1024 768）图像分辨率：指组成一副图像的像素的密度，一般用单位长度上包含像素的个数来衡量。常用单位为DPI（dots per inch），即每英寸多少点。,图像的基本属性,2、像素深度像素深度是指存储每个像素所用的位数。像素深度决定彩色图像每个像素可能有的颜色数，或者确定灰度图像每个像素可能有的灰度级数。 3、调色板一个彩色图像假如只包含24位真彩色空间中的16个离散的点（16色图），则可以建立一个颜色查找表，表中的每一行记录一组RGB值，实际像素的值用来指定该点颜色在查找表中的索引值，这样就

10、可以大大缩小存储量。这个颜色查找表就叫做调色板。,图像的基本属性,4、真彩色、伪彩色与直接色真彩色：真彩色是指在组成一幅彩色图像的每个像素值中，有R，G，B三个基色分量，每个基色分量直接决定显示设备的基色强度，这样产生的彩色称为真彩色。伪彩色：每个像素的颜色不是由每个基色分量的数值直接决定，而是把像素值当作彩色查找表(调色板)的表项入口地址，去查找一个显示图像时使用的R，G，B强度值，用查找出的R，G，B强度值产生的彩色称为伪彩色。直接色：每个像素值分成R，G，B分量，每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度，用变换后得到的R，G，B强度值产生的彩色称为直接色

11、。,伽马()校正,一个图像系统中一般包含输入设备（扫描仪、摄像机、数码相机）、存储设备（胶片、磁盘）和输出设备三大模块。各种涉及到光电转换的设备的输入输出特性曲线一般是非线性的，且表现为幂函数的形式： yxn 输出(输入) （按照惯例，“输入”和“输出”都缩放到01之间）。所以整个图像系统的传递函数是一个幂函数。 12n 一个图像系统追求的目标：真实的再现原始场景。,伽马()校正,为了真实地再现原始场景，如果图像再现环境为明亮环境则必须时整个图像系统的1；如果为暗淡环境，则必须使整个系统的1.25；如果为黑暗环境，则必须使系统的1.5。实际图像系统的值并非符合我们要求的值，且是不能随意改变

12、的。所有要求我们加入一个中间环节来校正整个系统的值，即补偿系统的非特性曲线，使之接近于应用环境所要求的值。这个过程就叫做伽马（）校正。,伽马()校正,Photoshop 中提供的Gamma校正功能,位图文件(Bitmap-File，BMP)格式是Windows采用的图像文件存储格式，在Windows环境下运行的所有图像处理软件都支持这种格式。BMP位图文件默认的文件扩展名是bmp或者dib。,BMP图像文件格式,BMP文件大体上分为四个部分：,BMP图像文件格式,typedef struct tagBITMAPFILEHEADER WORD bfType; /* 说明文件的类型 */DWORD

13、 bfSize; /* 说明文件的大小，用字节为单位 */WORD bfReserved1; /* 保留，设置为0 */WORD bfReserved2; /* 保留，设置为0 */DWORD bfOffBits; /* 说明从BITMAPFILEHEADER结构开始到实际的图像数据之间的字节偏移量 */ BITMAPFILEHEADER;,BMP图像文件格式,typedef struct tagBITMAPINFOHEADER DWORD biSize; /* 说明结构体所需字节数 */LONG biWidth; /* 以像素为单位说明图像的宽度 */LONG biHeight; /* 以

14、像素为单位说明图像的高速 */WORD biPlanes; /* 说明位面数，必须为1 */WORD biBitCount; /* 说明位数/像素，1、2、4、8、24 */DWORD biCompression; /* 说明图像是否压缩及压缩类型 */DWORD biSizeImage; /* 以字节为单位说明图像大小 */LONG biXPelsPerMeter; /* 说明水平分辨率，像素/米 */LONG biYPelsPerMeter; /* 说明垂直分辨率，像素/米 */DWORD biClrUsed; /* 说明图像实际用到的颜色数，如果为0则颜色数为2的biBitCount次方

15、 */DWORD biClrImportant; /*说明对图像显示有重要影响的颜色索引的数目，如果是0，表示都重要。*/ BITMAPINFOHEADER;,BMP图像文件格式,调色板实际上是一个数组，它所包含的元素与位图所具有的颜色数相同，决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。typedef struct tagRGBQUAD BYTE rgbBlue; /*指定蓝色分量*/BYTE rgbGreen; /*指定绿色分量*/BYTE rgbRed; /*指定红色分量*/BYTE rgbReserved; /*保留，指定为0*/

16、RGBQUAD;,BMP图像文件格式,紧跟在彩色表之后的是图像数据字节阵列。图像的每一扫描行由表示图像像素的连续的字节组成，每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。扫描行是由底向上存储的，这就是说，阵列中的第一个字节表示位图左下角的像素，而最后一个字节表示位图右上角的像素。,GIF（Graphics Interchange Format）格式由CompuServe公司于87年开发，版本号GIF87a，89年扩充后版本号为GIF89a。GIF图像文件以块(block)为单位存储信息。一个GIF文件由表示图形/图像的数据块、数据子块以及显示图形/图像的控制信息块组成，称为GIF数

17、据流(Data Stream)。数据流中的所有控制信息块和数据块都必须在文件头(Header)和文件结束块(Trailer)之间。,GIF图像文件格式,GIF图像文件格式,GIF图像文件格式,GIF文件采用了LZW无损压缩算法来存储图像数据。 GIF文件允许设置背景的透明属性。 GIF文件格式可在一个文件中存放多幅彩色图像并且制作出幻灯片或者动画效果。 GIF文件支持图像数据的交叉存储方式，这样一个大的图像可以逐步显示，让用户首先看到图像概貌，然后逐步清晰。 GIF文件定义的图像中可以加入文本。,GIF文件格式的特点：,算法概要,JPEG(Joint Photographic Experts

18、Group) 是一个由 ISO和CCITT两个组织机构联合组成的一个图像专家小组，负责制定静态的数字图像数据压缩编码标准，这个专家组开发的算法称为JPEG算法，并且成为国际上通用的标准。JPEG是一个适用范围很广的静态图像数据压缩标准，既可用于灰度图像又可用于彩色图像。JPEG不仅适于静止图像的压缩，电视图像的帧内图像的压缩编码，也常采用此算法。JPEG标准还可以大范围地调节图像压缩率及其保真度。标准主要采用了两种基本的压缩算法，一种是采用以离散余弦变换(DCT)为基础的有损压缩算法，另一种是采用以预测技术为基础的DPCM无损压缩算法。,JPEG编码标准,JPEG编码标准,基于DPCM的无损编

19、码模式：压缩比可以达到2:1。基于DCT的有损顺序编码模式：压缩比可以达到10:1以上。基于DCT的递增编码模式基于DCT的分层编码模式,JPEG规定了4种运行模式，以满足不同需要：,JPEG有损顺序编码算法的主要计算步骤如下： 1. 将源图像分成几个颜色平面（分量图像）。 2. 分成88数据块进行正向离散余弦变换(FDCT)。 2. 量化(quantization)。 3. Z字形排列量化结果(zigzag scan)。 4. 使用差分脉冲编码调制(differential pulse code modulation，DPCM)对直流系数(DC)进行编码。 5. 使用行程长度编码(ru

20、n-length encoding，RLE)对交流系数(AC)进行编码。 6. 熵编码(entropy coding)。,JPEG编码标准,JPEG编码标准,译码或者叫做解压缩的过程与压缩编码过程正好相反。,IDCT,JPEG编码标准,正向离散余弦变换,对每个单独的彩色图像分量，把整个分量图像分成88的图像块，如图所示，并作为两维离散余弦变换DCT的输入。通过DCT变换，把能量集中在少数几个系数上。,DCT变换使用下式计算,逆变换使用下式计算,JPEG编码标准,量化,对于有损压缩算法，JPEG算法使用如图所示的均匀量化器进行量化，量化步距是按照系数所在的位置和每种颜色分量的色调值来确定。,JP

21、EG编码标准,量化,因为人眼对亮度信号比对色差信号更敏感，因此使用了两种量化表：亮度量化值和色差量化值。此外，由于人眼对低频分量的图像比对高频分量的图像更敏感，因此图中的左上角的量化步距要比右下角的量化步距小。,JPEG编码标准,DC系数DPCM编码和AC系数Z形排列之后采用RLE编码,JPEG编码标准,熵编码,使用熵编码还可以对DPCM编码后的直流DC系数和RLE编码后的交流AC系数作进一步的压缩。JPEG标准规定了两种熵编码算法：哈夫曼编码和自适应算术编码。哈夫曼编码采用的一般是固定的哈夫曼编码表，而不是临时统计出来的，并且对亮度分量和色度分量采用了不同的哈夫曼表。,JPEG编码标准,基于

22、DPCM的无损编码模式：主要采用了三邻域二维预测编码和熵编码。,无失真编码器,源图像数据,压缩的图像数据,预测器,熵编码器,表说明,DPCM预测编码框图,JPEG编码标准,JPEG编码标准,基于DCT的递增编码模式：此模式与顺序模式编码步骤基本一致，不同之处在于递增模式每个图像分量的编码要经过多次扫描才完成。第一次扫描只进行一次粗糙的压缩，然后根据此数据先重建一幅质量低的图像，以后的扫描再作较细的扫描，使重建图像质量不断提高，直到满意为止。递增模式分为两种：（1）按频段累进。（2）按位累进。,JPEG编码标准,基于DCT的分层编码模式：（1）降低原始图像的空间分辨率。（2）对已经降低分辨率

23、的图像按照顺序编码模式进行压缩并存储或传输。（3）对低分辨率图像进行解码，然后用插值法提高图像的分辨率。（4）将分辨率已经升高的图像作为原图像的预测值，并把它与原图像的差值进行基于DCT的编码。（5）重复步骤3、4直到图像达到完整的分辨率。,JPEG图像文件格式,JPEG标准委员会没有对JPEG文件格式作出明确的定义，现在被广泛采用的是1992年9月由C-Cube Microsystems公司提出的JPEG文件交换格式（JPEG File Interchange Format，JFIF），版本号为1.02。JFIF文件格式直接使用JPEG标准为应用程序定义的许多标记，因此JFIF格式成了事实上JPEG文件交换格式标准。JEPG文件大体上可以分成两个部分：标记码（tag）和压缩数据。标记码部分给出了JPEG图像的所有信息，如图像的宽、高、Huffman表、量化表等等。,JPEG图像文件格式,JPEG文件使用的颜色空间是电视图像信号数字化标准ITU-RBT 601推荐标准规定的YCbCr彩色空间。从RGB转换成YCbCr的计算公式如下：Y = 0.299 R + 0.587G + 0.114 BCb = - 0.1687R - 0.3313G + 0.5B + 128Cr = 0.5 R - 0.4187G - 0.0813 B + 128,

展开阅读全文