1、第九章多媒体数据库及基于内容检索,9.1多媒体数据的管理问题,9.1.1 传统的数据管理,层次型 网络型 关系型 采用关系框架来描述数据之间的关系,通过把数据抽象成不同的属性和相互的关系,建立起数据的管理机制 在数据库市场上占有明显的主导地位,9.1.2 多媒体带来的问题,数据量巨大且媒体之间量的差异也极大,从而影响数据库的组织和存储方法 媒体种类的增多增加了数据处理的困难 数据库的多解查询,非精确匹配和相似性查询将占相当大的比重 用户接口的支持,9.1.2 多媒体带来的问题,多媒体信息的分布对多媒体数据库体系带来了巨大的影响。 短事务处理与长事务处理 服务质量的要求 多媒体数据管理还有考虑版
2、本控制的问题,9.1.3 多媒体数据与数据库管理,在数据库中,一般常用的多媒体数据有字符、数值、文本、图像、图形一类的静态数据,也有像声音、视频、动画等基于时间的媒体类型。 字符数值 文本数据 关键字检索 全文检索 声音数据 MIDI、波形,9.1.3 多媒体数据与数据库管理,图形数据 描述图形数据的关键是要有可以描述层次结构的数据模型。 图形数据可以分解为点、线、弧等基本图形元素 图像数据 图像数据库较早就有研究,已提出许多方法,包括属性描述法、特征提取、分割、纹理识别、颜色检索等。 视频数据 对视频的管理还要在时间空间上进行。检索和查询的内容可以包括镜头、场景、内容等许多方面,,9.2多媒
3、体数据库体系结构,9.2.1 多媒体数据库的一般结构形式,联邦型结构 针对各种媒体单独建立数据库,每一种媒体的数据库都有自己独立的数据库管理系统。虽然它们是相互独立的,但可以通过相互通信来进行协调和执行相应的操作。,9.2.1 多媒体数据库的一般结构形式,联邦型结构,9.2.1 多媒体数据库的一般结构形式,集中统一型结构 只存在一个单一的多媒体数据库和单一的多媒体数据库管理系统; 各种媒体被统一地建模; 对各种媒体的管理与操纵被集中到一个数据库管理系统之中; 各种用户的需求被统一到一个多媒体用户接口上; 多媒体的查询检索结果可以统一地表现。,9.2.1 多媒体数据库的一般结构形式,集中统一型结
4、构,9.2.1 多媒体数据库的一般结构形式,客户/服务型结构 各种单媒体数据仍然相对独立,系统将每一种媒体的管理与操纵各用一个服务器来实现; 所有服务器的综合和操纵也用一个服务器完成; 与用户的接口采用客户进程实现; 客户与服务器之间通过特定的中件系统连接。,9.2.1 多媒体数据库的一般结构形式,客户/服务型结构,9.2.1 多媒体数据库的一般结构形式,超媒体型结构 这种多媒体数据库体系结构强调对数据时空索引的组织,在它看来世界上所有的计算机中的信息和其它系统中的信息都应该连接一体,而且信息也要能够随意扩展和访问。 不必建立一个统一的多媒体数据库系统,而是把数据库分散到网络上,把它看成为一个
5、信息空间,只要设计好访问工具就能够访问和使用这些信息。,9.2.2 多媒体数据库的层次结构,多媒体数据库可划分为四个层次,9.2.2 多媒体数据库的层次结构,多媒体数据库可划分为四个层次 媒体支持层 针对各种媒体的特殊性质,在该层中要对媒体进行相应的分割、识别、变换等操作,并确定物理存储的位置和方法,以实现对各种媒体的最基本数据的管理和操纵。 存取与存储数据模型层 完成多媒体数据的逻辑存储与存取。 在该层中,各种媒体数据的逻辑位置安排、相互的内容关联、特征与数据的关系以及超链的建立等都需要通过合适的存取与存储数据模型进行描述。,9.2.2 多媒体数据库的层次结构,多媒体数据库可划分为四个层次
6、概念数据模型层 对现实世界用多媒体数据信息进行的描述,也是多媒体数据库中在全局概念下的一个整体视图。 在该层中,通过概念数据模型为上层的用户接口、下层的多媒体数据存储和存取建立起一个在逻辑上统一的通道。 存取与存储数据模型层和概念数据模型层也可以通称为数据模型层。,9.2.2 多媒体数据库的层次结构,多媒体数据库可划分为四个层次 多媒体用户接口层 完成用户对多媒体信息的查询描述和得到多媒体信息的查询结果。 用户首先要能够把他的思想通过恰当的方法描述出来,并能使多媒体系统所接受。 次之,查询和检索到的结果需要按用户的需求进行多媒体化的表现,甚至构造出“叙事”效果。,9.3 多媒体数据模型,概述,
7、数据模型由三种基本要素组成: 数据对象类型的集合 描述了数据库的构造 操作的集合 通用完整性规则的集合 通用完整性规则给出了一般性的语义约束。 这里仅介绍部分的数据模型,相当于多媒体数据库系统层次结构的第二和第三层。,9.3.1 NF2数据模型,所有的关系数据库中的关系必须满足最低的要求,这个要求就是第一范式,简称1NF 满足在表中不能有表 但由于多媒体数据库中具有各种各样的媒体数据,这些媒体数据又要统一地在关系表中加以表现和处理,就不能不打破关系数据库中关于范式的要求,要允许在表中可以有表,这就是所谓的NF2(Non First Normal Form)方法。,9.3.1 NF2数据模型,N
8、F2数据模型是在关系数据库中引入抽象数据类型,使得用户能够定义和表示多媒体信息对象。 FoxPro的General字段,Paradox for Windows的动态注释、格式注释、图形和大二进制对象(BLOB)等。 具有很大的局限性。主要是建模能力不够强,9.3.2 面向对象数据模型,面向对象方法论的一些基本概念 对象:现实世界中所有概念实体被模型化为对象 属性:组成对象的数据 方法:定义在对象属性上的一组操作 消息:对象间的通讯和请求对象完成某种处理工作是通过消息传递的 对象类:类似的对象组合在一起形成对象类 类层次:具有概括关系的对象类型成一个层次结构 继承性:子类可以继承超类的部分或全部
9、属性,9.3.2 面向对象数据模型,语义关联的描述 聚集关联(Aggregation association,简称A关联): 定义一个实体类的一组属性,这些属性的域既可以是实体类也可以是域类 概括关联(Generalization association,简称G关联): 表示实体之间的子类与超类的继承性关系。 相互作用关联(Interaction association,简称I关联): 类似于ER模型中的实体间的relation关系,用来表示两个实体类之间的相互作用或关系。 示例关联(Instance association): has_method和has_rule关联:,9.3.2 面向对
10、象数据模型,运算体系 在数据库系统中运算基本上有三种:定义、查询和操纵。 定义包括类的创建和对象的创建两部分。 查询包括通过类名查询类结构、通过对象名或对象标识查询对象或对象的属性值、通过类名查询该类中满足某些约束条件的对象或对象的属性、对对象操作的查询等。 操纵运算包括插入、删除和修改,其中每种都有类和对象两个操纵对象。,9.3.3 其它数据模型,超媒体数据模型 文献模型 文献模型的基本结构是层次状的,其主结构是树形的。 专有媒体数据模型 象图像数据库、视频数据库、全文数据库等针对特定领域的数据库,往往根据自己的需要建立符合自己特性的体系结构和数据模型,以完成特定的任务。,9.3.3 其它数
11、据模型,专有媒体数据模型,9.4 多媒体数据库基于内容检索,9.4.1 什么是基于内容检索,所谓基于内容检索,就是从媒体数据中提取出特定的信息线索,然后根据这些线索从大量存储在数据库中的媒体中进行查找,检索出具有相似特征的媒体数据出来。,9.4.2基于内容检索系统的体系结构,插入子系统 该子系统负责将媒体输入到系统之中,同时根据需要为用户提供一种工具,以全自动或半自动(即需用户部分干预)的方式对媒体进行分割或节段化,标识出需要的对象或内容关键点,以便有针对性的对目标进行特征提取。 特征提取子系统 对用户或系统标明的媒体对象进行特征提取处理。在提取特征时,往往需要知识处理模块的辅助,由知识库提供
12、有关的领域知识。,9.4.2基于内容检索系统的体系结构,数据库 媒体数据和插入时得到的特征数据分别存入媒体数据库和特征数据库 媒体库包含各种媒体数据,如图像、视频、音频、文本等。 特征库包含这种媒体用户输入的特征和预处理自动提取的特征。 查询子系统 主要以示例查询的方式向用户提供检索接口。,9.4.2基于内容检索系统的体系结构,9.4.2基于内容检索系统的体系结构,检索过程 初始检索说明:用户开始检索时,要形成一个检索的格式,最初可以用QBE或特定的查询语言来形成。 相似性匹配:将特征与特征库中的特征按照一定的匹配算法进行匹配。 特征调整:用户对系统返回的一组满足初始特征的检索结果进行浏览,挑选出满意的结果,检索过程完成;或者从候选结果中选择一个最接近的示例,进行特征调整,然后形成一个新的查询。 重新检索:逐步缩小查询范围,重新开始。该过程直到用户放弃或得到满意的查询结果时为止。,