1、1.8 四种数据模型,非关系模型 (以图论为理论基础)层次模型(Hierarchical Model)网状模型 (Network Model ),在非关系模型中,实体用记录表示,实体属性对应记录的数据项(或字段)实体之间的联系转化为记录之间的两两联系。 数据结构:以基本层次联系为基本单位 基本层次联系:两个记录以及它们之间的一对多(包括一对一)的联系,(注意与E-R图的形式区别;联系由指针链接完成),关系模型(Relational Model) 数据结构:表面向对象模型(Object Oriented Model)数据结构:对象,1. 层次数据模型的数据结构,层次模型: 满足下面两个条件的基本
2、层次联系的集合 为层次模型 1. 有且只有一个结点没有双亲结点,这个结点称为根结点2. 根以外的其它结点有且只有一个双亲结点 层次模型中的几个术语:根结点,双亲结点,子节点,兄弟结点,叶结点,1.8.1 层次模型,典型代表:1968年 IBM公司 IMS (Information Management System),R1,R2,R3,R4,R5,根节点,兄弟节点,叶节点,叶节点,叶节点,图示:,表示方法实体型:用记录类型描述。 每个结点表示一个记录类型。 属性:用字段描述。每个记录类型可包含 若干个字段。 联系:用结点之间的连线表示记录(类) 型之间的一对多的联系,层次模型,例:教员-学生数
3、据模型 (P26),系编号 系名 办公地点,职工号 姓名 研究方向,教研室编号 教研室,学号 姓名 成绩,系D,教研室R,教师T,学生S,特点结点的双亲是唯一的只能直接处理一对多的实体联系每个记录类型定义一个排序字段,也称为码字段任何记录值只有按其路径查看时,才能显出它的全部意义没有一个子女记录值能够脱离双亲记录值而独立存在,多对多联系在层次模型中的表示用层次模型间接表示多对多联系方法将多对多联系分解成一对多联系分解方法冗余结点法虚拟结点法,多对多关系,冗余结点法,虚拟结点法,2. 层次模型的数据操纵与完整性约束,查询、 插入、 删除、 更新,要满足层次模型的完整性约束条件无相应的双亲结点值就
4、不能插入子女结点值如果删除双亲结点值,则相应的子女结点值也被同时删除更新操作时,应更新所有相应记录,以保证数据的一致性,3.层次数据模型的存储结构,邻接法按照层次树前序遍历的顺序把所有记录值依次邻接存放,即通过物理空间的位置相邻来实现层次顺序,链接法用指引元来反映数据之间的层次联系子女兄弟链接法 层次序列链接法 (即邻接法),5. 层次模型的优缺点,优点层次数据模型简单,对具有一对多的层次关系的部门描述自然、直观,容易理解性能优于关系模型,不低于网状模型层次数据模型提供了良好的完整性支持缺点多对多联系表示不自然对插入和删除操作的限制多查询子女结点必须通过双亲结点,1.8.2 网状模型,网状数据
5、库系统采用网状模型作为数据的组织方式,典型代表 DBTG系统 70年代数据系统语言研究会 CODASYL ( Conference On Data System Language) 下属的数据库任务组 DBTG (Data Base Task Grupe) 提出的系统方案。(不是具体的软件系统.DBTG奠定了基本概念、方法、技术其它公司开发的软件系统都采用了DBTG模型),实际系统Cullinet Software Inc.公司的 IDMSUnivac公司的 DMS1100Honeywell公司的IDS/2HP公司的IMAGE,1.网状数据模型的数据结构,网状模型满足下面两个条件的基本层次联系
6、的集合为网状模型。1. 允许一个以上的结点无双亲;2. 一个结点可以有多于一个的双亲。,表示方法(与层次数据模型相同)实体型:用记录类型描述。 每个结点表示一个记录类型。属性:用字段描述。 每个记录类型可包含若干个字段。联系:用结点之间的连线表示记录(类)型之 间的一对多的父子联系。,网状模型与层次模型的区别网状模型允许多个结点没有双亲结点网状模型允许结点有多个双亲结点网状模型允许两个结点之间有多种联系(复合联系)网状模型可以更直接地去描述现实世界层次模型实际上是网状模型的一个特例,网状模型的例:,网状模型的例:,实际的商品网状DBMS对数据结构有很多限制, 例如HP公司的IMAGE3000限
7、制网状结构只有两层,不能直接表示多对多关系。多对多联系在网状模型中的表示 用网状模型间接表示多对多联系方法 将多对多联系直接分解成一对多联系,例:学生与课程是多对多关系,引进了学生选课的联接记录,分解成一对多关系。,2.网状数据模型的操纵和完整性约束,(一般网状模型没有层次模型那样严格的完整性约束条件,例如允许插入尚未确定双亲结点值的子女结点值,允许只删除双亲结点值,但具体的系统都加了一定的限制)网状数据库系统(如DBTG)对数据操纵加了一些限制,提供了一定的完整性约束 支持记录码:唯一标识记录的数据项的集合,不重复保证双亲结点与子女结点之间是一对多联系支持双亲记录和子女记录的某些约束条件 (
8、例如有些子女记录要求双亲记录存在方可插入; 双亲记录删除时子记录一并删除),3.网状数据模型的存储结构,关键实现记录之间的联系常用方法单向链接双向链接环状链接向首链接,单向链接法,4.网状模型的优缺点,优点 能够更为直接地描述现实世界,如一个结点可以有多个双亲 具有良好的性能,存取效率较高缺点结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握DDL、DML语言复杂,用户不容易使用,1.8.3 关系模型,最重要的一种数据模型。也是目前主要采用的数据模型1970年由美国IBM公司San Jose研究室的研究员E.F.Codd提出 A Relation Model
9、 of Data for Large Shared Data Bank (大型共享数据银行数据的关系模型) 是本课程的重点,1.关系数据模型的数据结构和基本概念,关系模型的基本概念,关系(Relation) 一个关系对应通常说的一张表。元组(Tuple) 表中的一行即为一个元组。属性(Attribute) 表中的一列即为一个属性,给每一个属性起一个名称即属性名。 特征-属性名、类型、长度,主码(Key 关键字、关系键、主键) 表中的某个属性组,它可以唯一确定一个元组。域(Domain) 属性的取值范围。分量 元组中的一个属性值。关系模式 对关系的描述 关系名(属性1,属性2,属性n) 例:学生
10、(学号,姓名,年龄,性别,系,年级)关系实例 关系模式的值,即关系的数据、表中数据 见P29例),实体及实体间的联系的表示方法实体型:直接用关系(表)表示。属性:用属性名表示。一对一联系:隐含在实体对应的关系中。一对多联系:隐含在实体对应的关系中。多对多联系:直接用关系表示。,例1学生、系(实体):系与学生之间的一对多联系学生(学号,姓名,年龄,性别,系号,年级)系 (系号,系名,办公地点)例2系、系主任(实体):系与系主任间的一对一联系,例3学生、课程(实体):学生与课程之间的多对多联系: 学生(学号,姓名,年龄,性别,系号,年级)课程(课程号,课程名,学分)选修(学号,课程号,成绩),关系
11、必须是规范化的,满足一定的规范条件最基本的规范条件:关系的每一个分量必须是一个不可分的数据项。 (不允许表中还有表),术语对比,要求熟知,2.关系模型的数据操纵,查询、插入、删除、更新数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”,3.关系模型的完整性约束,实体完整性参照完整性用户定义的完整性,4.关系数据模型的存储结构,实体及实体之间的联系都用表来表示表以文件形式存储有的DBMS一个表对应一个操作系统文件有的DBMS自己设计文件结构,5.关系模型的优缺点,优点建立在严格的数学概念的基础上概念单一。数据结构简单
12、、清晰,用户易懂易用实体和各类联系都用关系来表示。对数据的检索结果也是关系。关系模型的存取路径对用户透明具有更高的数据独立性,更好的安全保密性简化了程序员的工作和数据库开发建立的工作,关系模型和层次、网状模型的最大差别是用主键而不是用指针导航数据,其表格简单,用户易懂,用户只需用简单的查询语句就可以对数据库进行操作,并不涉及存储结构、访问技术等细节。关系模型是数学化的模型。由于把表格看成一个集合,因此集合论、数理逻辑等知识可引入到关系模型中来。,缺点存取路径对用户透明导致查询效率往往不如非关系数据模型为提高性能,必须对用户的查询请求进行优化增加了开发数据库管理系统的难度,1.8.4 面向对象模
13、型,对象和对象标识对象是现实世界中实体的模型化。 对象标识独立于对象的内容和存储位置,是一种逻辑标识符,通常由系统产生,它在整个系统范围内是惟一的。 两个对象即使内部状态值和方法都相同,如标识符不同,仍认为是两个相等而不同的对象。 每个对象都包含一组属性和一组方法。,一个学生一门课程一次考试记录,对象,属性,方法,对象,属性,方法,类(Class)和继承(Inheritance) 具有同样属性和方法集的所有对象构成了一个对象类 ,一个对象是某一类的实例 。类的属性域可以是基本数据类型(如整型、实型、字符型等),也可以是类 。类的表示具有层次性和继承性。,对象,类,型,值,面向对象模型的优缺点,
14、能完整地描述现实世界的数据结构,具有丰富的表达能力,优点,模型相对比较复杂,缺点,涉及的知识比较多,因此,面向对象数据库尚未达到关系数据库的普及程度,1.9 数据库系统的发展,关系数据模型,格式化数据模型(层次数据模型和网状数据模型),面向对象的数据模型,支持三级模式的体系结构; 用存取路径来表示数据之间的联系; 独立的数据定义语言; 导航的数据操纵语言。,概念单一,实体以及实体之间的联系都用关系来表示;以关系代数为基础,形式化基础好;数据独立性强,数据的物理存取路径对用户隐蔽;关系数据库语言是非过程化的,大大降低了用户编程的难度。,支持面向对象的数据模型; 保持或继承第二代数据库系统的优点;
15、 具有开放性。,第一代,第二代,第三代,传统数据库缺点:面向机器的语法数据模型;数据类型简单、固定 ;结构与行为完全分离 ;被动响应 ;事务处理能力较差。,四种逻辑模型的比较,1.10 数据库技术与其他相关技术的结合,数据库技术与分布处理技术相结合,出现了分布式数据库;数据库技术与人工智能技术相结合,出现了演绎数据库、主动数据库和知识库等;数据库技术与多媒体技术相结合,出现了多媒体数据库。1.10.1 分布式数据库集中式系统和分布式系统 集中式数据库就是集中在一个中心场地的电子计算机上,以统一处理方式所支持的数据库。 集中控制处理效率高,可靠性好;数据冗余少,数据独立性高;易于支持复杂的物理结
16、构去获得对数据的有效访问。,分布式数据库系统,分布式数据库的定义 分布式数据库是一组结构化的数据集合,它们在逻辑上属于同一系统而在物理上分布在计算机网络的不同结点上。 分布式数据库的特点,自治与共享,冗余的控制,分布事务执行的复杂性,数据的独立性,数据冗余的透明性,数据分布透明性,物理数据透明性,逻辑数据透明性,1.10.2 主动数据库,主动数据库的定义 在实际应用领域中,主动数据库系统在紧急情况下能够根据数据库的当前状态,主动、适时地作出反应,执行某些操作,向用户提供某些信息。主动数据库的实现 系统提供一个“自动监视”机构,它主动地不时地检查着这些规则中包含的各种事件是否已经发生,一旦某事件
17、被发现,系统就主动触发执行相应的If-Then规则(或规则组)。,格式化数据:,非格式化数据:,1.10.3 多媒体数据库,多媒体数据库目前有三种结构 第一种结构:由单独一个多媒体数据库管理系统来管理不同媒体的数据库以及对象空间。 第二种结构:主辅DBMS体系结构 。第三种结构:协作DBMS体系结构。,文本,声音,图形,视频,图像,字符,数字,多媒体数据,多媒体数据库系统能够有效实现对格式化和非格式化的多媒体数据进行存储、管理和操纵。,1.10.4 数据库技术的研究领域,数据库管理系统软件的研制,数据库设计,数据库理论,提高系统的性能和提高用户的生产率。,在 DBMS 的支持下,按照应用的要求,为某一部门或组织设计一个结构合理、使用方便、效率较高的数据库及其应用系统。,关系规范化理论、关系数据理论的研究。,1.11 小结,信息、数据、数据处理与数据管理的基本概念;数据管理技术发展的三个阶段及各自的优缺点;整个数据库系统主要包括数据库、数据库用户、计算机硬件系统和计算机软件系统等几部分;数据库系统内部的体系结构:三级模式结构;数据库系统的三级抽象和二级映象保证了数据库系统的逻辑独立性和物理独立性;层次模型、网状模型、关系模型和面向对象模型。,