1、河南理工大学毕业设计(论文)说明书I摘要随着多媒体及网络技术的发展,互联网中的图像等多媒体信息的数量在迅速增加。如何在庞大的多媒体数据资源海洋中搜索到自己所需要的图像,随之成为一个函待解决的问题。近年来基于内容的图像检索技术己经成为了研究的热点,该技术具有传统文本检索方式所无法比拟的优越性,目前已被应用于多媒体通信、生物识别、知识产权保护等方面,具有广阔的发展前景。本课题设计了基于颜色特征的图像检索系统,该系统主要包括两个关键步骤:颜色特征的提取和相似度匹配。本文中首先采用应用广泛的 HSV 颜色空间来表示图像的颜色特征,对颜色分量进行非等间隔量化形成特征矢量;然后用欧式距离度量函数进行图像的
2、相似性匹配;最后在 MATLAB 平台下编程实现了基于颜色特征的检索系统。根据用户输入的样本图像与图像库中的图像进行特征匹配,找出与样本图像距离比较小的若干幅图像,并按照图像之间的距离由小到大的顺序显示给用户。关键词: 图像检索;直方图;颜色特征;MATLAB河南理工大学毕业设计(论文)说明书IIABSTRACTWith the development of multimedia technology, In Internet the number of images and other multimedia information in the rapidly increasing. How
3、 to locate the useful image in the vast multi-media is a great technology problem. In recent years, Content-based image retrieval has become a research focus, the technology has the superiority which the traditional text retrieval methods can not match. It has been widely used in multimedia communic
4、ations, biometrics, intellectual property protection and so on, and has broad prospeets for development.This topic is designed based Color Image Retrieval System, which includes two key steps: color feature extraction and similarity matching. In this article was first used widely HSV color space to
5、represent color feature image. We carried out color components quantification of non-interval to form feature vector; Then use the Euclidean distance metric function to match the similarity function of the image. Finally, this system should be implemented under the platform of the MATLAB by programm
6、ing. Under user input sample image to conduct feature matching with image which in library images. In this system, It also can identify the images that have a short distance to the sample images, And in accordance with the distance between the images displayed to the user in the order from small to
7、big. Keywords: Image Retrieval;Histogram Algorithm; Color Features;MATLAB 河南理工大学毕业设计(论文)说明书1目录摘要 .IABSTRACT.II1 绪论 .11.1 选题背景及现状 11.2 基于颜色特征图像检索的特点及发展趋势 21.3 论文结构 52 颜色模型及转换 .62.1 概述 62.2 颜色模型 62.2.1 RGB 颜色模型 .62.2.2 HSV 颜色模型 .82.3 颜色模型转换 93 颜色特征提取的方法 .113.1 颜色直方图 113.2 累加直方图 133.3 颜色矩 154 颜色特征检索匹配算
8、法 .174.1 直方图相交法 174.2 欧式距离法 174.3 二次式距离 185 基于颜色特征的图像检索系统的设计和实现 .195.1 开发工具的选取 195.2 系统框架 195.3 性能评价 27总结与展望 30河南理工大学毕业设计(论文)说明书2致谢 31参考文献 32附录: 34河南理工大学毕业设计(论文)说明书11 绪论伴随着信息社会的迅速发展,图像多媒体信息的来源不断扩大。文献中,图像信息也被称为信息技术中的“一等公民”(first-class citizens) 。目前,各种图像数据库(包含各类专用图像数据库、Internet 图库等)中都有大量的图像,其中少则几十上百,多
9、则成千上万,这些图像数据库随着时间的推移还会不断地膨胀。怎样从这些海量数据中快速提取感兴趣的目标图像,己经成为制约信息获取、流动的关键问题之一。因此,对图像数据检索技术的研究己经成为信息技术处理领域的一个重要而又关键的问题,它不但具有很高的研究价值,更具有广泛的应用前景,并将为信息高速公路、数字图书馆和数字地球等计划的成功实施奠定坚实的理论基础。而本文是把图像检索技术的一个重要手段:基于颜色特征的图像检索技术作为研究的重点。1.1 选题背景及现状随着 Internet 网络技术的不断发展,网络用户越来越多,网络已成为目前最重要的信息来源之一。事实上,来自网络的信息量比任何一种渠道的信息量都要大
10、。所涉及的领域之广、更新速度之快和搜集成本之低也是其他任何手段无法比拟的。网络将会改变人类的一切,这已不是谣言,而是一个不争的事实。但是,网络的确是一个名副其实的“双刃剑” ,利用好它可以发挥它无穷的威力;反之,就会给自己带来无穷的祸害,给国家带来巨大的损失。从广义上讲,网络就是一个巨型数据库,人人都可以从中取到自己所需的东西。利用搜索引擎合法的在网上搜索特定信息本身就是网络的建设目的之一。目前,国内外许多研究者正在研究基于网络的信息收集和检索技术。特别是随着网络的普及,数据检索和收集显得越来越重要,已成为人们达到特定目的最有效的方法和手段之一。随着我国社会经济的发展,使得从公共媒体到家庭娱乐
11、、从自然科学到社会科学,每一个领域都渗透着对多媒体技术和因特网技术的应用,都要求对各种资料的智能化的管理。国内较有代表性的系统有:浙江大学计算机系研究的河南理工大学毕业设计(论文)说明书2基于图像颜色的检索系统 Photo Navigator、清华大学的 Internet 上静态图像的基于图像内容检索的原形系统、中科院计算技术研究所数字化技术研究室开发的 Image Hunter 系统、南京邮电学院研制的基于纹理和颜色特征的实验系统等。这些系统的框架和查询的处理过程都很相似,只是采用的特征和搜索方法各具特色,性能也互有差异。国外著名系统如:IBM 公司的 QBIC 系统,是 IBM公司与 20
12、 世纪 90 年代开发制作的图像和动态景象检索系统,是第一个商用基于内容的图像检索系统,它的系统结构及所采用的技术对后来的检索系统有很深远的影响。QBIC 支持基于示例图像、用户构造的略图、选择颜色、纹理等的查询。另外国外其他典型系统代表有:Virage 公司的 VIR 工程系 Photo book系统、哥伦比亚大学的 Visual SEEK 和 WEB SEEK 查询系统以及美国伊利诺斯大学的 MARS 系统等。1.2 基于颜色特征图像检索的特点及发展趋势在图像的形状,颜色,纹理等特征中,颜色特征是最可靠,最显著,最稳定的视觉特征,也是人识别图像的主要感知特征,相对于几何特征而言,颜色对图像
13、中子对象的大小和方向的变化都不敏感,具有相当强的鲁棒性。同时,在许多情况下,颜色又是描述一幅图像最简便而有效的特征,人们对于一幅图像的印象,往往从图像中颜色的空间分布开始。所有这些都促使颜色成为基于内容的图像检索所采取的主要手段之一,而本文正是着重于这一点,把基于颜色特征的图像检索技术作为本文的研究内容。目前,基于颜色特征的图像检索的研究主要是借助图像的颜色特征来进行的,其基本工作原理是在建立图像库时,分析输入图像,提取图像的颜色特征作为特征向量,与图像一起存储在数据库中。图像检索时,则提取给定查询范例图像的特征或由用户指出要查询图像的特征,与数据库中的特征向量进行匹配,并根据匹配结果返回相应
14、图像。如图 1-1 所示: 基于颜色特征的图像检索系统结构图。河南理工大学毕业设计(论文)说明书3图 1-1 基于颜色特征图像检索系统结构图基于颜色特征的提取和检索是一个逐步求精的过程,存在着一个特征调整、相似匹配的过程,如图 1-2 所示:(1)提查询要求。用户查找一个数据对象时,利用系统人机界面提供的输入方式形成一个查询条件。(2)相似性匹配。用户提交的查询要求经处理形成查询特征,将查询特征与数据库中的特征按照一定的匹配算法进行匹配。(3)返回查询结果。满足一定相似性的一组候选结果按相似度大小排列返回给用户,因此,系统人机界面要有显示浏览查询结果的功能。河南理工大学毕业设计(论文)说明书4
15、图 1-2 基于内容图像的原理图基于颜色特征的图像检索具有下列主要特点:(1) 从图像内容中由计算机自动提取视觉特征,并根据这些特征从图像数据库中查找、检索出具有相似特征的图像数据。(2) 使用相似匹配代替精确匹配。在基于颜色特征的图像检索中,通常采用相似匹配方式,从而获得类似图像,并不断缩小检索范围,直至定位于所要求的目标,与传统数据库检索的精确匹配不同。(3) 直观的可视化查询方式,交互性强。基于颜色特征的图像检索通常采用范例检索方式。(4) 满足多层次的检索要求。系统通常包含图像库、特征库,用户可以向系统提交与所需查询的图像一致或类似的例图进行特征的检索。基于颜色特征的图像检索技术当前的
16、发展趋势可以概括为以下几个方面:(1) 改进现有的基于颜色特征的图像检索技术。包括继续完善图像的相似性度量、特征提取和描述等问题。(2) 相关反馈技术。人们对图像检索结果的判定具有一定的主观性,所提取的特征还不能完整而准确地描述图像内容。因此很难一次搜索就得到满意的检索结果。图像的检索技术需要根据具体应用场合和使用者不同而调整,这样河南理工大学毕业设计(论文)说明书5便可以将用户的特殊需求反馈给系统,以使检索效果更接近用户的要求。(3)高维索引技术。图像检索系统想有更好的扩展性,要利用高维索引技术。1.3 论文结构本文的内容构架介绍如下:第一章 绪论,主要介绍了课题背景和当前国内外研究现状,说
17、明了基于颜色特征的图像检索技术的原理和基于颜色特征的图像检索的特点和发展趋势,明确了本文的主要研究内容。第二章 描述常用的 RGB、HSV 颜色模型,并且比较了两种颜色模型的异同,提出了二者的转换原因、转换公式。第三章 分析了几种常用的颜色特征提取方法:颜色直方图、累加直方图、颜色距等,并对其做了相关比较。第四章 介绍了常用的基于颜色特征的特征匹配算法:直方图相交法、欧氏距离法和二次式距离法。把欧式距离法作为本文所用的匹配算法。第五章 系统功能的设计与实现,根据本文所提出的方法实现了一个基于颜色特征的检索系统,并通过系统实验根据其检索效果进行了比较和性能分析。河南理工大学毕业设计(论文)说明书
18、62 颜色模型及转换2.1 概述颜色模型是指某个颜色空间中的一个可见光子集,它包含某个颜色域的所有颜色,颜色模型的用途是在某个颜色域内方便的指定颜色,由于每个颜色域都是可见光的子集,所以任何一个颜色模型都无法包含所有的可见光。常见的模型包括 HSV(色调、饱和度、亮度 V) ,RGB(红、绿、蓝),CMYK(青,洋红,黄,黑)以及 CIE 组织的 L*a*b 等。本文在此只探讨 HSV 与 RGB 两种常用的颜色空间模型。2.2 颜色模型2.2.1 RGB 颜色模型RGB 颜色模型又称 RGB 颜色空间,它是一种色光表示模式,是使用最多、最熟悉的颜色模型。计算机定义 R、G、B 三种颜色成分的
19、取值范围是 0-255,0 表示没有刺激量,255 表示刺激量达最大值。R、G 、B 均为 255 时就合成了白光,R、G、B 均为 0 时就形成了黑色。R、G、B 为三原色,各个原色混合在一起可以产生复合色,如图 2-1 所示。绝大部分的可见光可以用 R、G 和 B 三色光按不同比例和强度的混合来表示。在颜色重叠的位置,产生青色、洋红和黄色。因为 RGB 颜色合成产生其它颜色,它们也称为加色。图 2-1 RGB 三原色混合效果河南理工大学毕业设计(论文)说明书7把R、G、B三种色彩作为任何色彩的基本色的理论即为三原色原理,原理指出:(1)自然界的可见颜色都可以用三种原色按照一定的比例混合得到
20、,反之,任意一种颜色都可以分解为三种原色。(2)作为原色的三种颜色应该相互独立,即其中任何一种都不能用其他两种混合得到。(3)三原色之间的比例直接决定混合色调的饱和度。(4)混合色的亮度等于各原色的亮度之和。根据R G B三原色原理,由R G B 三原色可构成一类颜色空间,各种颜色的光均可以通过 R、G、B 三种基色混合而成。RGB 颜色模型通常采用图 2-2 所示的单位立方体来表示,在正方体的主对角线上各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。(0,0, 0)为黑色, (1,l, 1)为白色。正方体的其它六个角点分别为红、黄、绿、青、蓝和品红。图 2-2 RGB 颜色模型河南
21、理工大学毕业设计(论文)说明书8RGB 色度系统在计算机彩色输入输出设备中的应用非常普遍。常见的如CRT 显示器,它利用红、绿、蓝色的荧光粉显示颜色,RGB 三色荧光点被不同强度的电子束击中,就会产生各种色彩,通过控制电子束的强弱和通断,则可以形成各种绚丽多彩的画面。扫描仪和数码照相机也都是工作于 RGB 颜色空间的,它们捕捉的是图像的红色、绿色和蓝色信息。RGB 颜色空间的缺点是:改变一个颜色时,三个通道上的颜色全部需要修改:它不是均匀视觉的颜色空间,颜色空间上的距离,并不代表人眼视觉上的颜色相似性。2.2.2 HSV 颜色模型HSV 颜色空间是一种面向视觉感知的颜色模型,HSV 空间能够较
22、好的反映人眼对色彩的感知和鉴别能力。它直接对应于人眼颜色视觉特性三要素,即色调 H、饱和度 S 和亮度 V,通道间各自独立。色调 H 表示从一个物体反射过来的或透过物体的光波长,即是光的颜色,不同波长的光呈现不同的颜色,具有不同的色调。饱和度 S 表示颜色的深浅程度,饱和度高颜色深,如深蓝。饱和度低则颜色浅,如浅蓝。饱和度的深浅与颜色中加入白色的比例有关,它反映了某种颜色被白色冲淡的程度,白色成分为 O,则饱和度为 1 OO,只有白色,则饱和度为 O。亮度 V 表示人眼感觉到的光的明暗程度,与物体的反射率成正比。用一个三维空间锥体可以将色调、饱和度、亮度表示出来如图 2-3 示:色调 H 被表
23、示为绕圆锥中心轴的角度,饱和度 S 被表示为从圆锥的横截面的圆心到这个点的距离,亮度 V 被表示为从圆锥的横截面的圆心到顶点的距离。河南理工大学毕业设计(论文)说明书9图 2-3 HSV颜色模型HSV 颜色空间具有两个大特点:其一,亮度分量与图像的彩色信息无关:其二,色调和饱和度分量与人感受颜色的方式是紧密相连的。2.3 颜色模型转换HSV 颜色空间是一个均匀颜色空间,其转换是一个非线性变换。一幅图像中的 RGB 值 (R,G ,B)通过非线性转换可转换到 HSV 空间值(H,S,V)。一般情况下获取的图像都是在 RGB 空间描述的,但是 RGB 空间结构并不符合人们对颜色相似性的主观判断,所
24、计算出来的两种颜色之间的距离无法正确表征人们实际所感知到的两种颜色的真实差异。而 HSV 颜色空间由色调(H)、饱和度(S)、亮度(V) 三个分量组成,与人眼的视觉特性比较接近,其中亮度表示颜色的明暗程度,主要受光源强弱影响;色调表示不同颜色,如红、绿、黄;而饱和度表示颜色的深浅如深红、浅红。显然,HSV 空间要比 RGB 空间更直观,更容易接受。因此,为了更符合人眼的视觉特征,经常需要做颜色空间的转换,将 RGB 颜色空间转换为 HSV 颜色空间,转换公式如公式。= rGBR(2.1)= g(2.2) 河南理工大学毕业设计(论文)说明书10= bBGR(2.3) max=max( , , )
25、 min=min( , , )rgbrg设 定义 为:max(,v,in,)min()min(,)rvvbr bgbrgrg 则 v= 255v(2.4) i(,)vs(2.5) 其 它且且且且且r bgrbgrbgrrrbgbgbh5),min(),ax(3,i,1)()(,in,ax5这里 , , 。60h0,36h0,1s,V设 HSV 空间颜色 C =(h , s , v ) 和 C =(h , s , v ) ,则色彩 C 和色11221彩 C 的相似性 S 可以定义为公式:22 2122122112 )()sin)si()cos()cs(5 vhhS (2.6) S 0,1 , C
26、 , C 越相似, S 数值越趋近于 1。 C , C 之间的距离最大121212 2时,这时 的数值就越趋近于 0。河南理工大学毕业设计(论文)说明书113 颜色特征提取的方法颜色是一种能简化目标提取和分类的重要描述符,对颜色的特征表达依赖于所用的颜色模型,最好选择与人的感觉相一致的颜色空间。最早采用颜色进行图像检索是由 Swain 和 Ballard 提出的基于颜色直方图的检索方法,其核心思想是在一定的颜色空间中对图像中的各种颜色出现的频数进行统计,然后图像之间相似的问题就转化成比较图像直方图之间的相似性问题。常用的颜色特征提取表示方法有:颜色直方图、累加直方图和颜色矩等。在本文中我们把颜
27、色直方图作为研究的重点,并在此基础上实现基于颜色特征的图像检索系统。3.1 颜色直方图颜色直方图就是根据图像中每个像素出现在色彩空间的概率统计而成的,计算颜色直方图需要将颜色空间划分为若干个小的颜色区间,每个区间成为直方图的一个柄(bin)。然后,通过计算颜色落在每个小区间的像素数量可以得到颜色直方图。横坐标表示颜色的色彩的值,纵坐标表示每个小的颜色区间中所对应的图像像素的总和。它的优点就在于它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。颜色直方图是在许多图像检索河南理工大学毕业设计(论文)说明书12
28、系统中被广泛采用的颜色特征表示法。在 RGB 颜色空间中,颜色直方图可以看成是一个离散函数,即(3.1) (),knH01,.L其中,k 表示图像的特征取值,L 表示特征可取值的个数,n 表示图像中k具体征值为 k 的像素个数,n 表示图像像素的总个数。为了更好的使用颜色直方图,应对直方图的性质有所了解:位置无关性:直方图描述了每个灰度级的像素的个数,但不能为这些像素在图像中的位置提供任何线索。当一幅图像被压缩为直方图后,所有的空间信息将全部丢失。因此,任一特定的图像具有唯一的直方图,例如图 3-1 中(a) 、 (b) 、 (c ) 、(d)四幅图像,如果阴影部分具有相同的灰度值而且面积相等
29、,那么这四幅图像的直方图却是完全相同的,这说明了不同的图像可能具有完全相同的直方图。图 3-1 直方图的位置无关性叠加性:如果一幅图像由两个不连接的区域组成,并且每个区域的直方图己知,则整幅图像的直方图是该两个区域的直方图之和。显然,该结论可推广到任何数河南理工大学毕业设计(论文)说明书13目的不连接区域。总体性:图 3-2 直方图的总体性直方图是总体灰度的概念,从直方图中可以看出图像整体的性质。如图 3-2 所示:直方图 A 表示图像总体偏暗:直方图 B 表示图像总体偏亮;直方图C 表示图像的灰度动态范围太小,许多细节必然分辨不清楚;直方图 D 表示图像灰度级分布均匀,给人以清晰、明快的感觉
30、。本文采取的方法是用HSV空间的颜色直方图来描述图像的整体颜色特征,一幅图像的颜色一般很多,尤其是真彩色图像,直方图矢量的维数会很多,若对HSV空间的进行适当的量化后再计算直方图,则可以节约存储空间和减少计算复杂度。因此需要对HSV三个分量按照人的颜色感知进行量化,一般采用非等间隔量化的方法,非等间距量化就是对颜色空间每一通道的划分不采用等分的方法。如果颜色划分过于粗略,则会造成一定的检索误差;如果颜色划分过细,则计算量较大。应该兼顾检索误差与计算量,对HSV三个分量选取一个合适的量化标准。在实际运算中对H、S、V三维特征矢量取不同的权值组合成一维特征向量以便于计算。在这三个矢量中,人眼对于颜
31、色的划分主要依据色调H ,其次是饱和度S,最后才是亮度 V。同时根据H、S、V的量化级数和其频带宽度可组合成一维矢量L :L= H+ +V (3.2)vsQ河南理工大学毕业设计(论文)说明书14其中,Q 和 Q 分别是分量 S 和 V 的量化级数。通过该方法即将 H、S、Vsv三维特征矢量组合成了一维矢量。3.2 累加直方图在许多应用中,图像检索结果只能由人来做主观评价。人眼对颜色的分辨能力是有限的,例如对色调(H)的微小变化不敏感。换言之,在相同亮度和饱和度下,色调在一定范围微小的变化,人眼无法觉察。如何适应人的这个视觉特性,人们首先想到了加大量化间隔,将相近的颜色量化到 H 轴同一坐标上。
32、有实验表明,采用一般直方图,当量化间隔 时,检索效果有很大改善。o20但这种简单量化存在两个严重问题,首先,对两个相近颜色,这种量化既可能将它们量化到同一个 H 坐标上,也可能量化到不同的两个 H 坐标上。可见,简单的加大量化间隔会导致误检。再者,色调(H) 的分布有其自身的特殊性,从视觉角度来看,其相似性的分布并非均匀分布,如蓝色的相近色的分布范围要比黄色的更宽些,简单的等间隔量化并不适合色调(H)信号。一般直方图方法对每个颜色分量平等对待,没有考虑颜色轴上相邻颜色的相似性,在一些情况下可能会漏检。如有三幅单色图像,颜色分别为红色、粉红色和蓝色,用欧式距离对三幅图像进行度量,结果粉红图像与红
33、色图像的相似程度等同于蓝色图像与红色图像的相似程度,这不符合人的视觉感觉。在图3-3 中给出的三幅图像的直方图,人的视觉感觉很容易判断 H 和 H 较相似,12而它们与 H 的区别显著,但是结果却不如人意。3河南理工大学毕业设计(论文)说明书15图 3-3 三幅直方图累加直方图可以较好的解决这一问题。累加直方图是以颜色作为横坐标,纵坐标为颜色累加出现的频数,以此绘出的图形。这样图像的累加直方图空间可以定义为:H1,01knkHhchchc (3.3)表示 种颜色的像素的累加频数:khc1kc: 1kkc图 3-4 图 3-3 直方图对应的累加直方图可见,在累加直方图中,相邻颜色在频数上是相关的
34、。累加直方图消除了一般直方图中常见的零值,也克服了一般直方图量化过细过粗检索效果都会下降的缺陷。3.3 颜色矩另一种非常简单而有效的颜色特征表示方法是由 Stricker 和 Rengo 所提出的颜色矩(ColorMoments)。这种方法的基础在于图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此仅采用颜色的一阶矩、二阶矩和三阶矩就足以表达图像的颜色分布。与颜色直方图相比,该方法的另一个好处在于无需对特征进行向量化。颜色的三个低阶矩在数学上可以用公式 , , 表达:iii= (3.4)iNjif1河南理工大学毕业设计(论文)说明书16= (3.5)iNj
35、iijf12= (3.6)i313jiijf其中 f 表示像素 j 的颜色值为 i 的概率,N 为图像中像素点的个数。ij若用 Q,I 表示两幅图像,则它们矩的距离公式为:= ID, 31 32 |i IiQiiIiQiiIiQii (3.7)其中 是用户指定的加权系数,i 表示颜色通道。ij3,10ji颜色矩己经成功地应用于许多基于内容的图像检索系统(如 QBIC),特别是对于图像中只包括一个目标的时候非常有效,由于采用 9 个数值(三个颜色坐标轴,每个坐标轴包括三个颜色矩),所以相对于其它颜色特征而言,采用颜色矩表示颜色特征是一个非常有效的表示方法。虽然传统的颜色直方图方法与其他方法相比不
36、能很好的表达图像的空间特征,但却是最简单、最广泛使用的方法。河南理工大学毕业设计(论文)说明书174 颜色特征检索匹配算法基于文本的检索方法采用的是文本的精确匹配,而基于颜色特征的图像检索则是通过计算查询图像(示例图像)和数据库图像在视觉特征上的相似程度进行匹配。因此,定义一个合适的相似性度量方法对于图像检索的效果有很大影响。常用的相似度方法是向量空间模型(VectorsPacemodel),即将视觉特征看作是向量空间中的点,通过计算两个点之间的接近程度来衡量图像特征间的相似度。在基于颜色特征的图像检索中,经常用到的相似性度量方法,即特征匹配算法有以下方法: 直方图相交法、欧氏距离法和二次式距
37、离方法。4.1 直方图相交法令 H (K)和 H (K)分别为查询图像 和数据库图像 的某一特征统计直方QDQD图,则两幅图像之间的相似度 可借助直方图相交来计算,即公式:),(DP= ),(10)(minLKQkH(4.1) 该算法于1990年由Swain和Ballad提出, 由于它比二次型距离算法简便,因此,这一算法目前仍被广泛采用。4.2 欧式距离法直方图间的距离可使用一般的欧式距离函数 来衡量,即公式:),(DQME= (4.2),(DQMELi DQiHi12)(也可以适用加权距离来衡量,即公式:= (4.3),(ELi DQi iW12)(如果采用归一化直方图,则 =l,即加权距离
38、要小于欧式距离。i河南理工大学毕业设计(论文)说明书184.3 二次式距离二次式(quadratic distance)距离(Hafner J.et 1995)考虑到了不同颜色之间存在的相似度。所以在颜色直方图的比较上一般比使用欧式距离或是直方图相交距离更为有效。二次式距离的计算方式如下,两个颜色直方图Q之间的二次式距离可以表示为:D=(Q-I) A(Q-I) (4.4)T这种方法通过引入颜色相似性矩阵A,其中A=a 表示直方图中下标为i 和j的j两个灰度值之间的相似度。颜色相似性矩阵A可以通过对色彩心理学的研究中获得。因为颜色直方图本身就包含了不同颜色之间的相似性因素,因此可以直接地使用欧式
39、距离或直方图相交距离。而本文中主要运用了欧式距离来度量其相似度。河南理工大学毕业设计(论文)说明书195 基于颜色特征的图像检索系统的设计和实现5.1 开发工具的选取软件开发越来越强调软件的可移植性、易修改、易维护、可扩充性、可复用性等特点,传统的结构设计思想己经不能适应强大的软件需要,取而代之的是面向对象设计思想的产生。相对于传统的结构化设计思想,面向对象的数据封装性、继承性和多态性等特点使得复杂的程序开发变得简单高效,充分体现了现代软件工程的需要,并己成为软件开发的必然趋势。本系统就是采用面向对象的技术设计完成的。根据对实验系统中的颜色模型、特征提取算法等方面的设计,基于颜色直方图的图像检
40、索实验系统。在具体的系统开发过程中,考虑到网络可扩展性与使用方便性,本文选用MATLAB程序设计语言,在 Windows XP下完成。MATLAB的功能非常强大,它可以用于完成以下工作:(1)数据的分析和可视化。(2)数值的符号计算。(3)工程与科学绘图。(4)控制系统设计。(5)数字图像信号处理。(6)变成、应用开发、图形用户界面设计。MATLAB语言有如下特点:(1)编程效率高,扩充能力强。(2)用户使用方便,方便绘图。(3)语句简单,内涵丰富。(4)高效方便的矩阵和数组运算。5.2 系统框架该系统支持用户以给定示例图的方式检索本地图像库中的相似图片,用户只需根据提示选择示例图和想要检索的
41、图像库,系统会自动对示例图和图像库进行特征提取,生成直方图,并计算示例图与图像库中每幅图片的相似度,最河南理工大学毕业设计(论文)说明书20后按相似度大小排序输出显示给用户。本系统主要包括特征提取,特征匹配,结果显示三大模块,特征匹配和结果显示可以看作一个模块,总体框图 5-1 所示:。图 5-1 基于颜色特征检索的系统框架(1)特征提取模块特征提取算法应简单易用,且具有自动提取的功能,所选择的特征应尽可能表达原始图像的信息。同时,可以借助一些先进的数学工具来提取图像特征,如基于泛函分析和小波分析的特征数据表示等。总之,特征提取是检索方法成功与否的关键步骤。如图5-2所示:河南理工大学毕业设计
42、(论文)说明书21图 5-2 特征提取流程图通过 Matlab 程序实现对输入一幅彩色图像,绘制直方图,最后输出原来的输入图像和原图像的直方图。下图 5-35-5 分别给出了实验结果: 河南理工大学毕业设计(论文)说明书22图 5-3 输入的原来图像图 5-4 RGB 三原色颜色直方图图 5-5 颜色直方图河南理工大学毕业设计(论文)说明书23(2)特征匹配模块关键图与图像库中的一幅图片通过特征提取模块分别得到其直方图后,通过特征匹配模块计算相似度,再将图片库中每幅图片与关键图的相似度传递给图像显示模块排序输出。如图 5-6 所示:图 5-6 颜色特征匹配河南理工大学毕业设计(论文)说明书24
43、(3)图像显示模块该模块从特征匹配模块的匹配结果中获得与关键图最为匹配的几幅图像的路径信息,根据该信息将图像显示给用户,如图 5-7 所示:图 5-7 所示检索结果在对系统进行了多次调试运行后,系统基本达到设计目标,下图 5-85-11所示为四次检索结果的实例。可以看到,根据用户提供的查询关键图,系统从用户选择的图像库中检索到与关键图相似的图片并排序返回给用户。实验中选择了 600 多幅图像作为测试图像,基本达到了预期效果。左边一幅为待查询图,其余从左到右相似度依次减小。以大海为范例的检索结果为:河南理工大学毕业设计(论文)说明书25图 5-8 以大海为范例的检索结果以沙滩为范例的检索结果为:图 5-9 以沙滩为范例的检索结果河南理工大学毕业设计(论文)说明书26以绿树为范例的检索结果:图 5-10 以绿草为范例的检索结果以河流为范例的检索结果:图 5-11 以河流为范例的检索结果