1、1.3.1 数据模型的组成及其分类 1.3.2 概念模型 1.3.3 逻辑模型,1.3 数据模型,数据模型是数据库的框架,该框架描述了数据及其联系的组织方式、表达方式和存取路径。因此,数据模型是数据库系统的核心和基础,各种机器上实现的DBMS软件都是基于某种数据模型。本节先介绍数据模型的组成、分类,然后介绍几种主要的数据模型。,1.3 数据模型,1数据模型的组成通常,一个单位的数据很多,而且数据之间的关系错综复杂,那么如何表示和组织这些数据呢?数据模型是解决这一问题的有力工具。数据模型是现实世界中的事物间联系的一种模拟和抽象表示,是一种形式化描述数据、数据间联系以及有关语义约束规则的方法。数据
2、库专家E.F.Codd认为,一个基本数据模型是一组规则,这些规则规定数据结构如何组织以及允许进行何种操作。,1.3.1 数据模型的组成及其分类,1.3.1 数据模型的组成及其分类,一个数据库的数据模型常由数据结构、数据操作和数据的约束条件三部分组成。(1)数据结构 数据结构或数据组织结构,是指数据对象的集合,它描述数据对象的类型、内容、属性,以及数据对象之间的联系,也即描述了数据库的静态特性,是数据模型中最基础的部分。不同的数据模型采用不同的数据结构。例如,在实体联系模型中,数据对象用实体、属性和联系来描述,并用E-R图来组织。在关系模型中,用字段、记录、关系(二维表)等来描述数据对象,并以关
3、系结构的形式进行数据组织。因此,在数据库中,人们常按数据结构的类型来命名数据模型。例如,层次数据结构、网状数据结构、关系数据结构分别被命名为层次数据模型、网状数据模型和关系数据模型,或者简称为层次模型、网状模型和关系模型。,(2)数据操作 数据操作是指对数据库的数据允许执行的操作的集合,包括操作及有关的操作规则,描述了数据库的动态特性。数据库主要由检索(即查询)和更新(含插入、删除和修改)两类操作。数据模型应对其详细定义,包括这些操作的确切含义、操作符号、操作规则及其实现语言。(3)数据的完整性约束 数据的完整性约束是数据完整性规则的集合,它是对数据以及数据之间关系的制约和依存关系规则,用以保
4、证数据的完整性和一致性。数据模型应反映和规定其必须遵守的完整性约束条件。例如,在关系模型中,任何关系必须满足实体完整性和参照完整性两个约束条件。,1.3.1 数据模型的组成及其分类,2数据模型分类数据模型按应用层次不同可分为两类:一类是概念数据模型,也称概念模型或信息模型,也有文献称为基于对象的逻辑模型(Object-Based Logical Models),另一类是逻辑数据模型,又称结构数据模型或逻辑模型,也有文献称为基于记录的逻辑模型(Record-Based Logical Models)。,1.3.1 数据模型的组成及其分类,概念模型是一种面向客观世界、面向用户的模型,是一种独立于计
5、算机系统的数据模型,完全不涉及数据在计算机中的表示,只是用来描述某个特定组织所关心的信息结构,即按用户的观点对数据和信息建模,用于数据库的逻辑设计。概念模型的表示方法较多,其中最常用的是P.P.S.Chen于1976年提出的实体-联系方法(Entity-Relationship Approach)。该方法用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。,1.3.2 概念模型,1E-R图的基本成份及其表示 E-R图的基本成份实体、属性和联系已在上一节介绍,这里仅介绍其表示方法。(1)实体型:用矩形表示,矩形框内标明实体名。(2)属性:用椭圆形表示,并用无向边将其与相应的实体相连。
6、(3)联系:用菱形表示,菱形框内标出联系名,并用无向边与有关实体相连,同时在无向边旁标上联系的类型,即1:1或1:N或M:N。,1.3.2 概念模型,图1.7表示学生选修课程的E-R图。,图1.7 学生选修课程的E-R图,1.3.2 概念模型,2E-R图的设计过程E-R图的设计一般先设计局部E-R图,然后将局部E-R图综合成系统的总体E-R图,并且进行优化。我们先介绍一个较简单的E-R图的设计过程,只设计一个局部E-R图,然后介绍一个稍复杂一点的E-R图设计。(1)示例1:仓库管理E-R图设计仓库管理是工厂物资管理系统中的一个子系统。由系统分析可知,物资管理系统主要包括计划管理、采购管理、仓库
7、管理、综合管理、核算管理、统计分析、系统初始化管理等子系统。这里仅以仓库管理为例介绍其E-R图的设计过程。,1.3.2 概念模型,确定实体型仓库管理主要有三个实体型:仓库(仓库情况表)、物资(物资编码表)、用料单位(单位编码表)。 确定实体型的属性及其标识符(标识符用下划线标出)仓库(仓库编码,仓库名称)物资(物资编码,物资名称,型号规格,计量单位,价格)用料单位(单位编码,单位名称) 确定实体之间的联系及其联系的属性物资、仓库和用料单位之间具有M:N:P的出库联系。即一个用料单位可以从若干仓库提取多种物资,每个仓库可以供应不同单位的物资,每种物资可被不同单位领用。,1.3.2 概念模型,物资
8、和仓库之间具有M:N的入库联系。即每种物资可以存入不同的仓库,每个仓库可以放置不同的物资。物资和仓库之间还有M:N的库存联系。即每种物资存放在于不同的仓库中,每个仓库可存放多种物资。三个实体之间的联系及其属性如下:入库(入库单号,入库日期,仓库编码,物资编码,采购数量,实收数量,购买价格,验收人)出库(出库单号,出库日期,仓库编码,单位编码,物资编码,请领数量,实发数量,单价)库存(日期,仓库编码,物资编码,单价,库存量),1.3.2 概念模型,将实体与联系组合成E-R图。E-R图如图1.8所示(实体的属性略):,1.3.2 概念模型,(2)示例二:学生管理E-R图设计学校管理信息系统一般包括
9、教师管理、学生管理、后勤管理等子系统。学生管理子系统又包括学籍管理和课程管理两个子系统。下面对学生管理子系统进行E-R图设计。 课程管理子系统E-R图仍按照上述示例中的步骤,即确定实体型、实体型的属性及标识符、实体型之间的联系,以及将实体型和联系类型组成E-R图,可以得到如下结果:,1.3.2 概念模型,课程管理子系统主要包括的实体型、联系类型、属性以及标识符如下:学生(学号,姓名,性别,年龄,出生日期,所在系,年级,平均成绩)课程(课程号,课程名,学分,课时)教师(职工号,姓名,性别,职称,联系电话)教科书(书号,书名,单价,主编,出版社,出版日期)教室(教室编号,座位个数,教室类别),1.
10、3.2 概念模型,联系类型以及课程管理子系统的E-R图如图1.9所示:,1.3.2 概念模型,学籍管理子系统E-R图设计用同样的方法,可以得到学籍管理子系统实体型属性以及联系。档案资料(档案号,主要内容)宿舍(宿舍编号,居住人数)班级(班级编号,班长,班级名,人数)教室(教室编号,座位数),1.3.2 概念模型,联系类型以及学籍管理子系统的E-R图如图1.10所示。图中,学生、教室、教师实体型与课程管理子系统中的相同。,图1.10 学籍管理子系统E-R图,1.3.2 概念模型,将课程管理子系统的局部E-R图与学籍管理子系统的局部E-R图进行合并,组成学生管理子系统的E-R图。这时要调整冲突的实
11、体属性,消除冗余数据和冗余联系。例如,学生实体中的年龄属性可由出生日期推算出来,属于冗余数据,应该去掉。教室实体型与班级实体型之间的上课联系可以由教室与课程之间的开设联系、课程与学生之间的选修联系、学生与班级之间的组成联系三者推导出来,因此属于冗余联系,可以消除。,1.3.2 概念模型,两个局部E-R图修改与重构后进行合并,可得到图1.11,1.3.2 概念模型,图1.11 学生管理子系统E-R图,为了简明起见,图中没有列出实体及联系的属性。实体的属性前面已给出,这里给出联系的属性:归档(档案号,学号)住宿(学号,宿舍编号)开课(教室编号,课程号,时间)组成(学号,班级编号)选修(学号,课程号
12、,成绩)教学(职工号,学号,内容)讲授(课程号,职工号,书号)管理(职工号,时间,班级号,内容)学生管理子系统的基本E-R图还必须进一步和教师管理子系统以及后勤管理子系统的基本E-R图合并及优化,才能构成整个学校管理的E-R图。,1.3.2 概念模型,目前,常见的数据库逻辑模型包括层次模型、网络模型、关系模型和面向对象模型。层次、网络模型是20世纪70年代至80年代初期广泛流行的逻辑数据类型,而关系模型在70年代初才开始出现,但其发展十分迅速,是目前使用最广泛的逻辑数据模型。这里简要介绍层次及网络模型,关系模型和面向对象数据模型将在后面介绍。,1.3.3 逻辑模型,1.层次模型(1)层次模型的
13、概念与特点如果用结点表示记录型,记录型之间的联系用边来表示,则由结点和边组成的树型层次结构称为层次模型(Hierarchical Model)。 层次模型有如下特点:每棵树有且仅有一个结点无双亲,该结点称为树的根(Root)结点;其它记录型有且只有一个父结点(双亲结点)。,1.3.3 逻辑模型,在层次模型中,结点之间的层次关系表示相连接的两个实体之间1:N的联系。在树结构中,无子女的结点称为叶(Leaf)结点;除叶结点外,任何一个结点可有任意个子女结点;同一个双亲的子女结点称为兄弟结点。而且在层次模型中,必须按照从根开始的某条路径提出询问,否则就不能直接回答。,1.3.3 逻辑模型,图1.12
14、为层次模型的示意图。图中,R1为根结点,R2与R3为兄弟结点,R3与R4为叶结点。,(2)层次模型的优缺点 层次模型的优点有:结构简单,层次分明,便于在计算机内实现。从根结点到树中任一结点均存在一条唯一的层次路径,为有效的进行数据操作提供了条件。由于除根结点外,所有结点均有且仅有一个双亲,所以实体集之间的联系可用双亲结点唯一地表示。提供了良好的完整性支持。,1.3.3 逻辑模型,层次模型的不足之处是:缺乏直接表达现实世界中非层次结构的复杂联系,如多对多联系只能通过引入冗余数据或引入虚拟纪录的方法来解决;对插入或删除操作有较多限制。查询子女结点必须通过双亲结点。,1.3.3 逻辑模型,2.网状模
15、型(1)网状模型的概念与特点网状模型(Network Model)是用有向图结构表示记录型与记录型之间联系的数据模型。在有向图中,结点是记录型,箭头表示从箭尾的记录型到箭头的记录型之间的联系是1:N。网状模型的特点是:允许一个以上的结点无双亲。允许结点有多个双亲。允许两个结点间有两种或多种联系。,1.3.3 逻辑模型,网状模型去掉了层次模型的两个限制,允许多个结点没有双亲结点,允许结点有多个双亲结点,允许两个结点间有多种联系,因此它更能直接地描述现实世界。层次模型实际上是网状模型的一个特例。与层次模型一样,网状模型中的每个结点表示一个记录型,每个记录型包含若干字段,结点间的连线表示记录型之间一
16、对多的父子关系。,1.3.3 逻辑模型,层次模型中子女结点与双亲结点的联系是唯一的,而网状模型中这种联系可能不唯一,所以应为每个联系命名,并指出与该联系相关的双亲记录与子女记录。例如,图1.13 ,R3有两个双亲记录R1和R2,R1与R3以及R2与R3之间的联系分别命名为L1和L2,R1与R2均无双亲。,项目、零件和供应商所组成的E-R图及其相应的网状 模型分别如图1.14及图1.15所示:E-R图中的实体类型和联系类型都转换成网状模型中 的记录类型,每个M:N联系用两个1:N联系实现。,图1.14 项目、零件与供应商的E-R图,图1.15 项目、零件与供应商的网状模型,1.3.3 逻辑模型,
17、例如,项目与零件之间的M:N联系用两个1:N实现,即S1表示项目与组成之间的1:N联系,S2表示零件与组成之间的1:N联系。供应商与零件之间的M:N联系同样用两个1:N联系S3和S4实现。图中,组成结点与供应结点均有两个双亲,这是典型的网状模型示例,各记录型的内容如下:项目(项目号,项目名,开工日期)组成(项目号,零件号,数量)零件(零件号,零件名,规格,单价)供应(供应商号,零件号,供应量)供应商(供应商号,姓名,地址),1.3.3 逻辑模型,(2)网状模型的优缺点 网状模型的优点有:能够更直接地描述现实世界,如一个结点可以有多个双亲。具有存取效率高等良好的特性。 网状模型的不足之处:数据结构较复杂,而且其随应用环境的扩大而越来越复杂,不便于终端用户掌握。,1.3.3 逻辑模型,其数据定义语言(DDL)和数据操纵语言(DML)较复杂,用户不易使用。由于记录之间的联系是通过存取路径实现的,应用程序在访问数据库时必须选择适当的存取路径,即用户需要了解系统结构的细节,加重了编写应用程序的负担。由于上述层次系统和网状系统的固有缺点,因此自20世纪80年代中期起,其市场已被关系系统产品逐渐取代。,1.3.3 逻辑模型,