1、1基于颜色特征的图像检索方法研究与实现【摘要】本文介绍了一个基于改进的加权颜色直方图的图象检索系统。本系统通过将基于改进的加权的局域颜色直方图的图像检索方法和全局直方图的图像检索方法相结合,提高查全率和查准率。其中,基于分块局域直方图的检索方法利用了图像中间部分的重要性,将图像平均划分成 33 个子块,取中间一块的图像,计算其与参考位图相应位置的颜色特征距离,再计算原图的颜色直方图与参考位图的颜色特征距离,分别赋予权值后得出的值就是图像之间内容的相似程度。本文引入欧氏距离的相似性度量方法实现图像检索。实验表明,该方法具有较好的查全率和查准率。【关键字】图像检索,颜色特征,颜色直方图,相似性度量
2、方法2CONTENT-BASED IMAGE RETRIEVAL SYSTEMLEARN AND REALIZATIONABSTRACTThis image retrieval system is based on a improved weighted color histogram. With combining the improved image retrieval algorithem of based on the weighted central-block color histogram and the image retrieval algorithem of overall
3、 histogram, the recall rate and the rate of search is improved . Using the importance of the image of the middle part, the retrieval method based on the block local histogram divide a picture into an average of 3 3 sub-blocks. Choose the middle one , calculate the colour feature distance between the
4、 middle block of original image and the middle block of reference image .Then calculate the colour feature distance between the original image and reference image. Weighted with fixed value , we can get the similarity between them. We introduce the Euclidean distance measurement methods to achieve s
5、imilar image retrieval. The experiments show that the method has a better recall rate and the rate of search.Keywords: Image Retrieval, features of color,color histogram, similar methods of measurement3第一章 绪论 .51.1 课题研究的目的和意义 .51.2 图像检索系统的关键技术 .61.3 国内外研究现状 .71.4 本文所作的主要工作 .8第二章 基于颜色特征的图像检索 .92.1 颜色
6、模型 .92.1.1 RGB 模型 .102.1.2 HSV 模型 .112.1.3CMY 模型 .122.1.4L*a*b 模型 .122.2 颜色特征的提取与表达 .132.2.1 全局颜色直方图 .132.2.2 基于分块颜色直方图法 .132.2.3 累加直方图 .142.2.4 局部累加直方图 .142.3 图像特征的相似性匹配 .152.3.1 直方图相交法 .152.3.2 欧氏距离方法 .162.3.3 模糊方法 .16第三章 图像检索系统的设计 .173.1 系统设计 .173.1.1 算法分析 .173.1.2 系统结构框图 .183.2 系统性能分析 .19第四章 总结与
7、展望 .204.1 论文工作总结 .204.2 进一步的工作 .21致谢 .21参考文献(REFERENCES) .224第一章 绪论1.1 课题研究的目的和意义随着多媒体技术的快速发展,计算机硬件技术的不断更新,以图片、图表、动画和视频为形式的信息发布量日益庞大,随之出现了大量庞大的不同内容的图像信息库。数字图像的应用包括国防军事、工业制造、医疗卫生、新闻媒体、大众娱乐等各方面。人们在工作生活中越来越多地接触到大量的各种各样的图像信息。首先,在科学计算、可视化、工程制图及其他众多的应用领域如数字图书馆、天气预报、知识产权保护、天气预报、医疗图像管理、犯罪预防、军事观察和地球资源观察系统、宇宙
8、探测、交通检测等领域,每天都有数量非常巨大的图像信息在不断产生与使用。其次,随着 Internet 的发展,网络的应用和发展对社会各个领域产生了巨大影响,特别是 WEB 的兴起,网络上传输的信息正以指数级增长。作为一种全新的媒体和公共资源,越来越多的图像信息出现在 Web 站点上,但是它们都是无序、无索引的,在这样的环境下寻找感兴趣的资料是非常耗时的。因此,人们对信息检索工具和系统的依赖将会日益增加。面对信息量如此巨大的图像信息,热门迫切需要一种有效的检索方法。传统的图像检索技术是基于文本索引的图像检索,通过用文本描述图像的语义,然后再这些图像文本标注基础上应用成熟的文本搜索算法,为用户搜索预
9、期的图像。虽然检索比较准确而且速度很快,但是随着图像数据库规模的增大(如数十万以上) ,这种检索消耗的时间大大增加,而且人工标注具有主观性和不确定性。鉴于上述因素,人们提出了一种新的图像检索技术-基于图像内容的检索 CBIR(contented-based image retrieval) ,它不需要用户的参与,而利用图像自身的特征,如颜色、纹理、形状等特征来进行检索,具有较强的客观性。基于内容的图像检索是一种实用性很强的技术,有着广阔的前景,涉及到社会和生活的方方面面。51.2 图像检索系统的关键技术目前,对于通用的静止图像检索,用于检索的特征主要有颜色(Color ) 、纹理(Textur
10、e) 、形状(Shape)等,其中颜色、纹理、形状应用尤为普遍;活动视频检索脱胎于序列图像分析中的技术。本文主要研究对静止图像检索,其中数据库是专用的图像库。对于目标图像和检索图像进行颜色空间转换、亮度图像的边缘提取和二值分割、提取目标区域的颜色特征。颜色内容包含两个一般的概念,一个对应于全局颜色分布,一个对应于局部颜色信息。按照全局颜色分布来索引图像可以通过计算每种颜色的像素的个数并构造颜色灰度直方图来实现,这对检索具有相似的总体颜色内容的图像是一个很好的途径。局部颜色信息是指局部相似的颜色区域,它考虑了颜色的分类与一些初级的几何特征。比如 Smith等提出了颜色集合(color set)方
11、法来抽取空间局部颜色信息并提供颜色区域的有效索引。运用颜色直方图进行检索有如下三种方式:(1)指明颜色组成-该法需要用户对图像中的颜色非常敏感,而且使用起来也不方便,检索的查准率和查全率并不高,因此暂时不做进一步开发。(2)指明一幅示例图像-通过与用户确定的图像的颜色直方图的相似性匹配得到查询结果,这是该课题研究方法的根本。(3)指明图像中一个子图-分割图像为各个小块,然后利用选择小块来确定图像中感兴趣的对象的轮廓,通过建立更复杂的颜色关系(如颜色对方法)来查询图像,该方法是进一步优化检索的一个设想。在颜色空间选取方面,最常用的颜色空间是 RGB 颜色空间。通常,人们采用欧氏距离来刻画两种颜色
12、之间的差异,RGB 空间存在的一个严重问题是其中所计算出来的两种颜色6之间的距离无法正确表征人们实际所感知到的这两种颜色之间的真实差异。HSI 空间比较直观并且符合人的视觉特性。HSI 颜色模型有两个重要的特点作为基础。首先,I 分量与彩色信息无关,其次 H 和 S 分量与人感受彩色的方式紧密相连,其中 H 分量尤其影响人类的视觉判断。这些特点使得 HSI 模型非常适合基于人视觉系统对彩色感知特性的图像处理。得到图像特征的统计直方图后,不同图像间的特征匹配可借助计算直方图间的距离来进行。一般意义上直方图匹配方法有直方图相交法,直方图匹配法,欧氏距离法,中心矩法,累积直方图匹配法共 6 种。本文
13、重点讨论欧氏距离法,并将其作为系统编程实现的主要方法。所以,颜色特征的图像检索关键技术路径如图一:图 1-1 颜色特征的图像检索关键技术路径1.3 国内外研究现状基于内容的图像检索技术开始于上世纪 90 年代初期,目前已有十几年历史,是当前研究的热点,许多著名杂志如 IEEE Trans. On PAMI 、IEEE Trans. On Image processing 等纷纷设专刊介绍该领域研究的最新成果,著名的国际会议如:IEEE conference of CVPR 、 ACM conference on multimedia 等纷纷设立专题交流最新的研究成果。各大研究机构和公司都推出了
14、他们的系统,在商用领域,IBM 首先研制出了 QBIC系统;在学术研究领域,MIT 的 Photobook 系统,新加坡国立大学的 CORE 系统,美国哥伦颜色颜色空间颜色空间空间相似度量特征表达颜色空间7比亚大学的 VisualSEEK 系统,加利福尼亚大学 Santa Barbara 分校的 Netra、伊利诺依大学的 MARS、CMU 的 Infomedia 以及哥伦比亚大学的 VideoQ 等。下面主要介绍这些系统概况:1QBIC 系统 IBM Almaden 研究中心研究开发的,是基于内容检索系统的典型代表。 QBIC 系统允许使用例子图像、用户构建的草图和图画、选择的颜色和纹理模式
15、、镜头和目标运动和其他图形信息等,对大型图像和视频数据库进行查询。 2Photobook 系统 MIT 的媒体实验室在 1994 年开发研制的。图像在装入时按人脸、形状或纹理特性自动分类,图像根据类别通过显著语义特征压缩编码。 3CORE 系统 新加坡国立大学开发的一个基于内容的检索机。其显著技术特色包括: 多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。 4VisualSEEK 系统 美国哥伦比亚大学图像和高级电视实验室开发的。它实现了互联网上的“基于内容“ 的图像/视频检索系统,提供了一套工具供人们在
16、Web 上搜索和检索图像和视频。1.4 本文所作的主要工作从图一的技术路径分析,结合设计要求,我们需要对要素工作具体化,目的是使系统试验简单高效而不失代表性。如下:颜色空间选取 面向硬件的 RGB 空间和面向视觉的 HSI 空间;颜色特征的表达 全局直方图,全局累加直方图,局部累加直方图;8相似性度量 欧氏距离计算方法。第 2章 基于颜色特征的图像检索图像是通过颜色表现出来的,颜色是图像最重要的属性。所以,对于基于内容的图像检索来说图像采取哪种颜色表示方式就显得尤为重要。本章的主要任务是分析不同的颜色空间表示方式以及适合于图像检索系统的颜色空间。2.1 颜色模型图像是通过颜色表现出来的,颜色是
17、彩色图像的最显著的特征,与其它特征相比,颜色特征具有非常稳定,对于旋转、平移、尺度变化都不敏感,表现出很强的鲁棒性,又由于颜色特征计算简单,因此基于颜色的查询成为现有基于内容的图像检索系统中应用最基本的方法。而如何选取合适的颜色特征,以及对颜色特征如何进行有效的抽取将关系到最终的颜色特征的相似性比较和检索的效果。颜色模型是指某个三维颜色空间中的一个可见光子集,它包含某个颜色域的所有颜色。颜色模型的用途是在某个颜色域内方便的指定颜色。由于每一个颜色域都是可见光的子集,所以任何一个颜色模型都无法包含所有的可见光。常见的颜色模型包括 RGB(红、绿、蓝) ;HSV(色调、饱和度、亮度) ;CMYK(
18、青、洋红、黄、黑) ;以及 CIE 组织的 L*a*b 等。92.1.1 RGB 模型面向硬设备的最常用颜色模型是 RGB 模型。在 RGB 模型中,所有颜色都可看作是 3个基本颜色,即红(R,red) ,绿(G,green)和蓝( B,blue)的不同组合。将这三种颜色成分分别人为地分成 0 到 255 共 256 个等级,0 表示没有刺激量,255 表示刺激量达到最大值。R、G、 B 均为 255 时表示白光,均为 0 时表示黑色。这样,我们就能表示出256256256(约 1600 万)种颜色。如图 2-1 所示,采用三维直角坐标系,红、绿、蓝为原色,各个原色混合在一起产生复合色。绝大部
19、分的可见光谱可以用红、绿、蓝 R(、G 、B)三色光按不同比例和强度的混合来表示。在颜色重叠的位置,产生青色、洋红和黄色。因为 RGB 颜色合成产生白色,它们也称为加色。将所有颜色加在一起产生白色,也就是说,所有光被反射回眼睛。加色用于光照、视频和显示器。RGB 颜色模型通常采用单位立方体来表示,在正方体的主对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。(0,0,0)为黑色,(l,1,1)为白色。正方体的其它六个角点分别为红、黄、绿、青、蓝和品红,需要注意的一点是,RGB 颜色模型所覆盖的颜色域取决于显示设备荧光点的颜色特征,是与硬件相关的。在显示屏上显示颜色定义时,往往
20、采用这种模式。图像如用于电视、幻灯片、网络、多媒体,一般使用 RGB 模式。图 2-1 RGB 颜色模型虽然 RGB 彩色模型被广泛应用于 CRT 设备显示彩色图像,但它并不是一个均匀视觉的颜色空间,不符合人对颜色的感知心理,而且,RGB 颜色空间上的距离并不代表人眼视觉上10的颜色知觉差异。但在对彩色图像进行特征提取时,需要用数量来描述颜色的差别,因此需要用另一种符合人的视觉心理的视觉彩色模型来表示颜色。2.1.2 HSV 模型HSv 空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域25。它把彩色信号表示为三种属性:色调 H(Hue)、
21、饱和度 S(Saturation)和亮度 V(value),其中亮度又称 LightneSS 或 Intensity,所以 HSV 空间还有 HLS 和 HIS 这两种叫法。HSV 模型的色调 H 表示从一个物体反射过来的或透过物体的光的波长,更一般地说,色调是由颜色名称来辨别的,如红、橙、黄、绿等,它用角度-180180 或 O360 来度量。亮度 V 是颜色的明暗程度,通常用百分比度量,O%为最暗的黑色,而 100%为最亮的白色。饱和度 S 指颜色的深浅程度,即在纯色中包含的白色光的成份。例如同样是红色,也会因颜色浓度不同而分为深红色、粉红色和浅红色。饱和度 S 也用百分比来度量,从浓度最小的 O%到浓度完全饱和的 100%。色调 H 和饱和度 S 分量合起来定义了颜色的色度(Chromatieity)特性。HSV 颜色模型用 Munsell 三维空间坐标系统表示,其示意图如图 2-2 所示。2-2 HSV 颜色模型Munsen 颜色空间具有以下己经被人的眼睛所证实的特点:1.坐标之间的心理感知独立性(PereeptualIndependenee),即人可以独立感知各颜色分量的变化。2.线性伸缩性(LinearSealability),人眼可感知的颜色差异与 HSV 颜色分量的相应