收藏 分享(赏)

毕业答辩——Web中图像的检索技术研究 (2).ppt

上传人:wo7103235 文档编号:6354139 上传时间:2019-04-09 格式:PPT 页数:19 大小:314.50KB
下载 相关 举报
毕业答辩——Web中图像的检索技术研究 (2).ppt_第1页
第1页 / 共19页
毕业答辩——Web中图像的检索技术研究 (2).ppt_第2页
第2页 / 共19页
毕业答辩——Web中图像的检索技术研究 (2).ppt_第3页
第3页 / 共19页
毕业答辩——Web中图像的检索技术研究 (2).ppt_第4页
第4页 / 共19页
毕业答辩——Web中图像的检索技术研究 (2).ppt_第5页
第5页 / 共19页
点击查看更多>>
资源描述

1、杭 州 师 范 学 院 电 子 工 程 系,Web中图像的检索技术研究,毕业论文,作 者: 指导老师:,摘 要,随着网络技术和计算机技术的飞速发展,网络搜索技术越来越受到人们的重视。如今,虽然网络检索技术已走向成熟和完善,但还是不能满足人们的需求。在本文,我首先要向大家介绍一般网络搜索技术的基本原理、发展现状和它的发展趋势。在第二章我们则讲述基于Web的图像检索技术,解析搜索过程中分词技术的应用、检索模型和相似度他们之间的具体关系。,上一张,引 言,研究现状:随着网络传送速度与计算机信息处理速度的提高,网页中对多媒体信息的使用变得十分普及,特别是图像信息,己经成为表示网页内容不可缺少的组成部分

2、。因此人们对多媒体信息的检索需求也就随之随之变得特别迫切。但由于图像检索系统涉及了多学科的知识,实现和应用的难度相当高,所以已有的图像检索系统都有这样或那样的缺陷。 而传统的信息检索主要集中于文字的检索,在多媒体方面的研究并不是很多。互联网上的多媒体以图像为主,因此图像的检索就成为了目前研究的热点。 图像检索经历了两个阶段:第一阶段是以文本为基础的检索。第二阶段是以图像自身的内容为基础的检索。,上一张,引 言,发展趋势立足于文本,对图像进行检索。试图将传统的文本检索技术移植于对多媒体信息的检索上 立足于图像内容,对图像进行分析和检索。 结合文本和内容,进行融合性研究。发挥各自的优势促进图像的高

3、效、简单检索方式的实现,上一张,引 言,存在的问题: 由于搜索引擎技术的开发牵涉到信息检索、人工智能等许多基础研究领域的理论和技术,中文搜索引擎的开发就更涉及到语言习惯的差异、智能切分词等棘手的问题,而且中文搜索引擎技术的起步也较晚,还远没能满足中国网民的需求。因此我们现在要做的是研究出适合中国大众的简单有效的搜索技术。,上一张,基于Web的图象搜索,引擎的搜索途径 :1. 关键词检索(1)基于图像外部信息进行检索(2) 基于手工标注的检索2.图象可视属性的检索,上一张,基于Web的图象搜索,文本图像间关系在文本检索中,搜索引擎主要考虑Web页中相关文字信息以及它的语义,这些文本信息反映出网页

4、的内容,但不完全与网页中图片的内容一致。在HTML网页中,根据HTML语言的格式,捕获反映图片信息的文字信息,分析这些文本的语义具有重要的意义。,上一张,基于Web的图象搜索,图像的文本标记 (1)图像的说明 :图像说明文本(2)图像的标题 :图像关键词(3)图像的标签 :说明图片摘要信息的短语 (4)网页的标题 :反映网页中心内容,上一张,基于Web的图象搜索,文本权值间的关系在图像的检索中,首先是要建立描述图片内容特征的查询语句,然后比较、区分它们之间的异同,获取需要检索的图像。但它们对图像描述时侧重不同,同时与图像信息的联系程度也不同。如图像标题和网页标题是简单的词条,两者中相对来说图像

5、标题更接近图像的主题内容。所以在比较、区分各类文本信息以决定是否符合检索要求时,它们所占的权值应该是有所不同的。根据信息的重要程度,他们所占的权值大小按次序如下:Image CaptionImage TitleImage AlternatePage Title,上一张,基于Web的图象搜索,图像检索模型Web搜索引擎采用何种检索模型,它所提供检索质量将直接影响到检索的效果。这里采用向量空间模型。,上一张,基于Web的图象搜索,向量模型中权值计算在这里我们一般采用比较简单的统计法来计算它的权值。公式如下:在信息检索中常用的词条权值计算方法为 TF-IDF 函数:,上一张,基于Web的图象搜索,相

6、似度算法两文档di,dj之间的相似度可以用其对应的向量之间的夹角余弦来表示:,上一张,基于Web的图象搜索,进行查询的过程中,先将查询条件Q进行向量化,主要依据布尔模型:当ti在查询条件Q中时,将对应的第i坐标置为1,否则置为0,即也就是说当两词条完全相同时,这一项为1,其余情况为0。可以看出文档含有完全相同的词条时,相似度=1;而其中无相同时的词条时,相似度=0。,上一张,基于Web的图象搜索,从而文档d与查询Q的相似度为:根据文档之间的相似度在查询过程中,可以计算出每个文档与查询的相似度,进而可以根据相似度的大小,将查询的结果进行排序。,上一张,基于Web的图象搜索,分词技术和匹配方法1.

7、 常用的切词算法如下:(1)最大正向匹配法 (2)逆向最大匹配法 (3)基于词频的统计方法 由于这些设计思想都不怎么好,所以这里我们将提出改良的匹配法。,上一张,基于Web的图象搜索,词典存储格式:第一层存储所有单字,第二层保存所有的双字词和多字词的前两个字,第三层存储以某一双字为首的所有词。,上一张,基于Web的图象搜索,匹配方法假设对一个句子C1C2进行分词处理,算法描述如下:1) 两个字(开始时为C1C2),在词典中查询C1C2是否存在2) 不存在,则C1为单字词,一次分词结束,返回1。3) 存在,判断C1C2是否为词,并从词典中获取该词下层节点汉字的最大长度,设为n4) 若n=0,一次

8、分词结束,保存结果。5) 否则,i=2,转6)。6 ) i=i+1,若i=n+3,转8);否则,转7)。7) 再取一个字(此处为Ci),判断第三层中是否有以C3Ci开始的字(不需要恰好匹配,只要匹配开始的i个字就可以了)。8) 若存在,分词结束,返回最近一次能够恰好匹配的C3Cj(ji),并与C1C2组合成词。如果是C1C2,则根据C1C2的标记判断是双字词还是分为两个单字词。9) 否则,转6)。,上一张,基于Web的图象搜索,从以上的搜索类型得到的搜索系统已经能得到我们需要的信息,但效率和准确率却不高,所以本文再引进反馈系统,它的重新生成查询公式如下:当合适地选取相似度临界值时可以提高检索精度与检索完全度。当相似度临界值取0.6时,本搜索模型可以保证检索精度80%,而检索完全度60%。,上一张,结 论,在了解了搜索引擎的搜索原理公式和反馈原理之后,我们可以根据其理论做出相应的搜索引擎,并能作出比较搜索效果。但为了能更好的使用,还得去仔细更好的给文档进行分类,更多的对此引擎进行反馈训练查询等,使得Web搜索引擎具有更好的智能性和个性化的特点。,上一张,结束,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 实用文档 > PPT模板素材

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报