1、数据库原理与应用,教材及参考书(1), 教材 萨师煊,王珊:数据库系统概论(第三版) , 高等教育出版社,2000 中国人民大学 李红:数据库原理与应用高等教育出版社,2003,教材及参考书(2), 参考书崔巍:数据库系统与应用,高等教育出版社,2000 施伯乐:数据库系统教程高等教育出版社,第一章 绪论,1.1 数据库系统概述,1.1.1 数据库的地位1.1.2 四个基本概念1.1.3 数据管理技术的产生与发展,数据库的地位,为什么要学习数据库,数据库技术始于20世纪60年代,经历了最初的基于文件的初级系统、20世纪6070年代流行的层次系统和网状系统,而现在广泛使用的是关系数据库系统。数据
2、库应用也从简单的事务管理扩展到各个应用领域,如用于工程设计的工程数据库、用于因特网的Web数据库、用于决策支持的数据仓库技术、用于多媒体技术的多媒体数据库等,但应用最广泛的还是在基于事务管理的各类信息系统领域。,1.1 数据库系统概述,1.1.1 数据库的地位1.1.2 四个基本概念1.1.3 数据管理技术的产生与发展,1.1.2 四个基本概念,数据(Data) 数据库(Database) 数据库管理系统(DBMS) 数据库系统(DBS),一、数据,数据(Data)是数据库中存储的基本对象 数据的定义 描述事物的符号记录 数据的种类 文字、图形、图象、声音 数据的特点 数据与其语义是不可分的,
3、数据举例,学生档案中的学生记录 (李明,男,1972,江苏,计算机系,1990) 数据的形式不能完全表达其内容 数据的解释 语义:学生姓名、性别、出生年月、籍贯、所在系别、入学时间 解释:李明是个大学生,1972年出生,江苏人,1990年考入计算机系,二、数据库(举例),数据库是相互关联的数据的集合。 性质:用综合的方法组织数据,具有较小的数据冗余,可供多个用户共享,具有较高的数据独立性,具有安全控制机制,能够保证数据的安全、可靠,允许并发地使用数据库,能有效、及时地处理数据,并能保证数据的一致性和完整性。,什么是数据库,DataBase Management System 简称DBMS,三、
4、数据库管理系统,简单说DBMS就是管理数据库的系统软件,它应该具有如下功能:数据库定义功能数据库操纵功能数据库查询功能数据库控制功能数据库通讯功能,什么是数据库管理系统?,数据库管理的重要性数据库管理员DataBase AdministratorDBA的重要职责,数据库管理和数据库管理员,DBMS的主要功能,数据定义功能提供数据定义语言(DDL)定义数据库中的数据对象 数据操纵功能:提供数据操纵语言(DML)操纵数据实现对数据库的基本操作(查询、插入、删除和修改),DBMS的主要功能,数据库的运行管理保证数据的安全性、完整性、多用户对数据的并发使用发生故障后的系统恢复 数据库的建立和维护功能(
5、实用程序)数据库数据批量装载数据库转储介质故障恢复数据库的重组织性能监视等,四、数据库系统,数据库系统就是基于数据库的计算机应用系统,它包括: 以数据为主体的数据库 管理数据库的系统软件DBMS 支持数据库系统的计算机硬件环境和操作系统环境 管理和使用数据库系统的人,特别是负责设计、维护 数据库的技术人员数据库管理员 方便使用和管理系统的各种技术说明书和使用说明书,数据库系统(续),数据库系统构成图示 参看教材page_5 图1.1数据库系统在计算机系统中的位置图示 参看教材page_ 5 图1.2,1.1 数据库系统概述,1.1.1 数据库的地位1.1.2 四个基本概念1.1.3 数据管理技
6、术的产生与发展,1.1.3 数据管理技术的产生和发展,什么是数据管理 对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题 数据管理技术的发展过程 人工管理阶段(40年代中-50年代中) 文件系统阶段(50年代末-60年代中) 数据库系统阶段(60年代末-现在),数据管理技术的产生和发展(续),数据管理技术的发展动力 应用需求的推动 计算机硬件的发展 计算机软件的发展,一、人工管理,时期 40年代中-50年代中产生的背景 应用需求 科学计算 硬件水平 无直接存取存储设备 软件水平 没有操作系统 处理方式 批处理,人工管理(续),特点 数据的管理者:应用程序,数据不保存。 数据面向
7、的对象:某一应用程序 数据的共享程度:无共享、冗余度极大 数据的独立性:不独立,完全依赖于程序 数据的结构化:无结构 数据控制能力:应用程序自己控制,人工管理阶段,二、文件系统,时期 50年代末-60年代中产生的背景 应用需求 科学计算、管理 硬件水平 磁盘、磁鼓 软件水平 有文件系统 处理方式 联机实时处理、批处理,文件系统(续),特点 数据的管理者:文件系统,数据可长期保存 数据面向的对象:某一应用程序 数据的共享程度:共享性差、冗余度大 数据的结构化:记录内有结构,整体无结构 数据的独立性:独立性差,数据的逻辑结构改变必须修改应用程序 数据控制能力:应用程序自己控制,应用程序与数据的对应
8、关系(文件系统),文件系统中数据的结构,记录内有结构。 数据的结构是靠程序定义和解释的。 数据只能是定长的。 可以间接实现数据变长要求,但访问相应数据的应用程序复杂了。 文件间是独立的,因此数据整体无结构。 可以间接实现数据整体的有结构,但必须在应用程序中对描述数据间的联系。 数据的最小存取单位是记录。,三、数据库系统,时期 60年代末以来产生的背景 应用背景 大规模管理 硬件背景 大容量磁盘 软件背景 有数据库管理系统 处理方式 联机实时处理,分布处理,批处理,数据库系统(续),特点 数据的管理者:DBMS 数据面向的对象:现实世界 数据的共享程度:共享性高 数据的独立性:高度的物理独立性和
9、一定的逻辑独立性 数据的结构化:整体结构化 数据控制能力:由DBMS统一管理和控制,应用程序与数据的对应关系(数据库系统),数据的高共享性的好处,降低数据的冗余度,节省存储空间 避免数据间的不一致性 使系统易于扩充,数据独立性,物理独立性 指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的。当数据的物理存储改变了,应用程序不用改变。 逻辑独立性 指用户的应用程序与数据库的逻辑结构是相互独立的。数据的逻辑结构改变了,用户程序也可以不变。,数据结构化,整体数据的结构化是数据库的主要特征之一。数据库中实现的是数据的真正结构化 数据的结构用数据模型描述,无需程序定义和解释。 数据可以变长。 数据
10、的最小存取单位是数据项。,DBMS对数据的控制功能,数据的安全性(Security)保护 使每个用户只能按指定方式使用和处理指定数据,保护数据以防止不合法的使用造成的数据的泄密和破坏。数据的完整性(Integrity)检查 将数据控制在有效的范围内,或保证数据之间满足一定的关系。,DBMS对数据的控制功能,并发(Concurrency)控制 对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。数据库恢复(Recovery) 将数据库从错误状态恢复到某一已知的正确状态。,第一章 绪论,1.1 数据库系统概述 1.2 数据模型 1.3 数据库系统结构 1.4 数据库系统的组成 1.5
11、数据库技术的研究领域 1.6 小结,数据模型,在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。通俗地讲数据模型就是现实世界的模拟 数据模型应满足三方面要求 能比较真实地模拟现实世界 容易为人所理解 便于在计算机上实现,数据模型(续),数据模型分成两个不同的层次 (1) 概念模型 也称信息模型,它是按用户的观点来对数据和信息建模。 (2) 数据模型 主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模。,数据模型(续),客观对象的抽象过程-两步抽象 现实世界中的客观对象抽象为概念模型; 把概念模型转换为某一DBMS支持的数据模型。概念模型是现实世界到机器
12、世界的一个中间层次。,1.2 数据模型,1.2.1 数据模型的组成要素1.2.2 概念模型1.2.3 常用数据模型1.2.4 层次模型1.2.5 网状模型1.2.6 关系模型,1.2.1 数据模型的组成要素,数据结构 数据操作 数据的约束条件,1. 数据结构,什么是数据结构 对象类型的集合两类对象 与数据类型、内容、性质有关的对象 与数据之间联系有关的对象数据结构是对系统静态特性的描述,2.数据操作,数据操作 对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则 数据操作的类型 检索 更新(包括插入、删除、修改),数据操作(续),数据模型对操作的定义 操作的确切含义 操作符号 操
13、作规则(如优先级) 实现操作的语言数据操作是对系统动态特性的描述。,3.数据的约束条件,数据的约束条件 一组完整性规则的集合。 完整性规则是给定的数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。,数据的约束条件(续),数据模型对约束条件的定义 反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。 提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。,1.2.2 概念模型,1. 概念模型 2. 信息世界中的基本概念
14、3. 概念模型的表示方法,1. 概念模型,概念模型的用途 概念模型用于信息世界的建模 是现实世界到机器世界的一个中间层次 是数据库设计的有力工具 数据库设计人员和用户之间进行交流的语言 对概念模型的基本要求 较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识 简单、清晰、易于用户理解。,2. 信息世界中的基本概念,(1) 实体(Entity) 客观存在并可相互区别的事物称为实体。 可以是具体的人、事、物或抽象的概念。 (2) 属性(Attribute) 实体所具有的某一特性称为属性。 一个实体可以由若干个属性来刻画。 (3) 码(Key) 唯一标识实体的属性集称为码。,信息世界中的基
15、本概念(续),(4) 域(Domain) 属性的取值范围称为该属性的域。 (5) 实体型(Entity Type) 用实体名及其属性名集合来抽象和刻画 同类实体称为实体型 (6) 实体集(Entity Set) 同型实体的集合称为实体集,信息世界中的基本概念(续),(7) 联系(Relationship) 现实世界中事物内部以及事物之间的联系在信息世界 中反映为实体内部的联系和实体之间的联系 实体型间联系 两个实体型 一对一联系(1:1) 三个实体型 一对多联系(1:n) 一个实体型 多对多联系(m:n),两个实体型间的联系,两个实体型间的联系,一对一联系 如果对于实体集A中的每一个实体,实体
16、集B中至多有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系。记为1:1。 实例 班级与班长之间的联系: 一个班级只有一个正班长 一个班长只在一个班中任职,两个实体型间的联系 (续),一对多联系 如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系记为1:n 实例 班级与学生之间的联系: 一个班级中有若干名学生, 每个学生只在一个班级中学习,两个实体型间的联系 (续),多对多联系(m:n) 如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系
17、,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m0)与之联系,则称实体集A与实体B具有多对多联系。记为m:n 实例 课程与学生之间的联系: 一门课程同时有若干个学生选修 一个学生可以同时选修多门课程,多个实体型间的联系(续),多个实体型间的一对多联系 若实体集E1,E2,.,En存在联系,对于实体集Ej(j=1,2,.,i-1,i+1,.,n)中的给定实体,最多只和Ei中的一个实体相联系,则我们说Ei与E1,E2,.,Ei-1,Ei+1,.,En之间的联系是一对多的。,多个实体型间的联系(续),实例课程、教师与参考书三个实体型 如果一门课程可以有若干个教师讲授,使用若干 本参考书
18、,每一个教师只讲授一门课程,每一本 参考书只供一门课程使用 课程与教师、参考书之间的联系是一对多的 多个实体型间的一对一联系 多个实体型间的多对多联系,同一实体集内各实体间的联系,一对多联系 实例职工实体集内部具有领导与被领导的联系 某一职工(干部)“领导”若干名职工 一个职工仅被另外一个职工直接领导 这是一对多的联系 一对一联系 多对多联系,3. 概念模型的表示方法,概念模型的表示方法很多实体联系方法(E-R方法) 用E-R图来描述现实世界的概念模型 E-R方法也称为E-R模型,E-R图,实体型 用矩形表示,矩形框内写明实体名。,学生,教师,E-R图(续),属性 用椭圆形表示,并用无向边将其
19、与相应的实体连接起来,E-R图(续),联系 联系本身:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n) 联系的属性:联系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来,联系的表示方法,联系的表示方法(续),联系的表示方法示例,联系的表示方法示例(续),联系属性的表示方法,E-R图(续),E-R图实例:P19-P20某工厂物资管理E-R图,1.2.3 常用数据模型,非关系模型 层次模型(Hierarchical Model) 网状模型(Network Model )数据结构:以
20、基本层次联系为基本单位基本层次联系:两个记录以及它们之间的一对多(包括一对一)的联系,常用数据模型(续),关系模型(Relational Model) 数据结构:表面向对象模型(Object Oriented Model) 数据结构:对象,1.2 数据模型,1.2.1 数据模型的组成要素1.2.2 概念模型1.2.3 常用数据模型1.2.4 层次模型1.2.5 网状模型1.2.6 关系模型,1.2.4 层次模型,1. 层次数据模型的数据结构 2. 层次数据模型的数据操纵 3. 层次数据模型的与完整性约束 4. 层次数据模型的存储结构 5. 层次数据模型的优缺点 6. 典型的层次数据库系统,1.
21、 层次数据模型的数据结构,层次模型满足下面两个条件的基本层次联系的集合为层次模型。 1. 有且只有一个结点没有双亲结点,这个结点称为根结点 2. 根以外的其它结点有且只有一个双亲结点 层次模型中的几个术语 根结点,双亲结点,兄弟结点,叶结点,层次数据模型的数据结构(续),层次数据模型的数据结构(续),表示方法 实体型:用记录类型描述。每个结点表示一个记录类型。 属性:用字段描述。每个记录类型可包含若干个字段。 联系:用结点之间的连线表示记录(类)型之间的一对多的联系 实例:教员-学生数据模型(P23),层次数据模型的数据结构(续),特点 结点的双亲是唯一的 只能直接处理一对多的实体联系 每个记
22、录类型定义一个排序字段,也称为码字段 任何记录值只有按其路径查看时,才能显出它的全部意义 没有一个子女记录值能够脱离双亲记录值而独立存在,层次数据模型的数据结构(续),多对多联系在层次模型中的表示 用层次模型间接表示多对多联系 方法 将多对多联系分解成一对多联系 分解方法 冗余结点法 虚拟结点法,2. 层次模型的数据操纵,查询插入删除更新,3. 层次模型的完整性约束,无相应的双亲结点值就不能插入子女结点值 如果删除双亲结点值,则相应的子女结点值也被同时删除 更新操作时,应更新所有相应记录,以保证数据的一致性,4.层次数据模型的存储结构,邻接法 按照层次树前序遍历的顺序把所有记录值依次邻接存 放
23、,即通过物理空间的位置相邻来实现层次顺序 链接法 用指引元来反映数据之间的层次联系 子女兄弟链接法 P26 层次序列链接法 P26,5. 层次模型的优缺点,优点 层次数据模型简单,对具有一对多的层次关系的部门描述自然、直观,容易理解 性能优于关系模型,不低于网状模型 层次数据模型提供了良好的完整性支持 缺点 多对多联系表示不自然 对插入和删除操作的限制多 查询子女结点必须通过双亲结点 层次命令趋于程序化,6. 典型的层次数据库系统,IMS数据库管理系统 第一个大型商用DBMS 1968年推出 IBM公司研制,第二章 关系数据库,第二章 关系数据库,2.1 关系模型概述 2.2 关系数据结构 2
24、.3 关系的完整性 2.4 关系代数 2.5 关系演算 2.6 小结,关系数据库系统概述,关系数据库的发展 CODASYL于1962年发表的“信息代数”一文 E.F.Codd从1970年起发表了一系列的论文 20世纪70年代末的实验系统System R和Ingres 从20世纪80年代逐步走向成熟,关系数据库简介,关系数据库应用数学方法来处理数据库中的数据80年代后,关系数据库系统成为最重要、最流行的数据库系统,关系数据库简介,典型实验系统 System R University INGRES 典型商用系统 ORACLE SYBASE INFORMIX DB2 INGRES,第二章 关系数据库
25、,2.1 关系模型概述 2.2 关系数据结构 2.3 关系的完整性 2.4 关系代数 2.5 关系演算 2.6 小结,2.1 关系模型概述,关系数据库系统 是支持关系模型的数据库系统 关系模型的组成 关系数据结构 关系操作集合 关系完整性约束,1. 关系数据结构,单一的数据结构-关系 现实世界的实体以及实体间的各种联系均用关系来表示 数据的逻辑结构-二维表 从用户角度,关系模型中数据的逻辑结构是一张二维表。,2. 关系操作集合,1) 常用的关系操作 2) 关系操作的特点 3) 关系数据语言的种类 4) 关系数据语言的特点,关系操作集合(续),1) 常用的关系操作 查询 选择、投影、连接、除、并
26、、交、差 数据更新 插入、删除、修改 查询的表达能力是其中最主要的部分,关系操作集合(续),2) 关系操作的特点 集合操作方式,即操作的对象和结果都是集合。 非关系数据模型的数据操作方式:一次一记录 文件系统的数据操作方式,关系操作集合(续),3) 关系数据语言的种类 关系代数语言 用对关系的运算来表达查询要求 典型代表:ISBL,关系操作集合(续),关系数据语言的种类(续) 关系演算语言:用谓词来表达查询要求 元组关系演算语言 谓词变元的基本对象是元组变量 典型代表:APLHA, QUEL 域关系演算语言 谓词变元的基本对象是域变量 典型代表:QBE 具有关系代数和关系演算双重特点的语言 典
27、型代表:SQL,关系操作集合(续),4) 关系数据语言的特点 关系语言是一种高度非过程化的语言 存取路径的选择由DBMS的优化机制来完成 用户不必用循环结构就可以完成数据操作 能够嵌入高级语言中使用 关系代数、元组关系演算和域关系演算三种语言在表达能力上完全等价,3.关系完整性约束,在数据库中数据完整性是指保证数据正确的特性。它包括两方面的内容: 与现实世界中应用需求的数据的相容性和正确性; 数据库内数据之间的相容性和正确性。 在关系数据模型中一般将数据完整性分为三类 实体完整性 参照完整性 用户定义完整性,第二章 关系数据库,2.1 关系模型概述 2.2 关系数据结构 2.3 关系的完整性
28、2.4 关系代数 2.5 关系演算 2.6 小结,2.2 关系数据结构,关系数据结构非常简单,在关系数据模型中,现实世界中的实体及实体与实体之间的联系均用关系来表示。从逻辑或用户的观点来看,关系就是二维表。,2.2 关系数据结构,2.2.1 关系 2.2.2 关系模式 2.2.3 关系数据库,2.2.1 关系, 域(Domain)2. 笛卡尔积(Cartesian Product)3. 关系(Relation), 域(Domain),域是一组具有相同数据类型的值的集合。例: 整数 实数 介于某个取值范围的整数 长度指定长度的字符串集合 男,女 介于某个取值范围的日期,2. 笛卡尔积(Carte
29、sian Product),1) 笛卡尔积 给定一组域D1,D2,Dn,这些域中可以有相同的。D1,D2,Dn的笛卡尔积为: D1D2Dn(d1,d2,dn)diDi,i1,2,n所有域的所有取值的一个组合 不能重复,笛卡尔积(续),例 给出三个域:D1=SUPERVISOR = 张清玫,刘逸 D2=SPECIALITY=计算机专业,信息专业D3=POSTGRADUATE=李勇,刘晨,王敏 则D1,D2,D3的笛卡尔积为: D1D2D3 (张清玫,计算机专业,李勇),(张清玫,计算机专业,刘晨),(张清玫,计算机专业,王敏),(张清玫,信息专业,李勇), (张清玫,信息专业,刘晨),(张清玫,
30、信息专业,王敏), (刘逸,计算机专业,李勇),(刘逸,计算机专业,刘晨),(刘逸,计算机专业,王敏),(刘逸,信息专业,李勇), (刘逸,信息专业,刘晨),(刘逸,信息专业,王敏) ,笛卡尔积(续),2) 元组(Tuple) 笛卡尔积中每一个元素(d1,d2,dn)叫作一个n元组(n-tuple)或简称元组。3) 分量(Component) 笛卡尔积元素(d1,d2,dn)中的每一个值di叫作一个分量。,笛卡尔积(续),4) 基数(Cardinal number) 若Di(i1,2,n)为有限集,其基数为mi(i1,2,n),则D1D2Dn的基数M为:在上例中,基数:22312,即D1D2D
31、3共有22312个元组,笛卡尔积(续),5)笛卡尔积的表示方法 笛卡尔积可表示为一个二维表。表中的每行对应一个元组,表中的每列对应一个域。在上例中,12个元组可列成一张二维表,笛卡尔积(续),3. 关系(Relation),1) 关系 D1D2Dn的子集叫作在域D1,D2,Dn上的关系,表示为R(D1,D2,Dn)R:关系名n:关系的目或度(Degree),关系(续),注意: 关系是笛卡尔积的有限子集。无限关系在数据库系统中是无意义的。 由于笛卡尔积不满足交换律,即(d1,d2,dn )(d2,d1,dn )但关系满足交换律,即 (d1,d2 ,di ,dj ,dn)=(d1,d2 ,dj,d
32、i ,dn) (i,j = 1,2,n)解决方法:为关系的每个列附加一个属性名以取消关系元组的有序性,关系(续),例 在表2.1 的笛卡尔积中取出有实际意义的元组来构造关系 关系:SAP(SUPERVISOR,SPECIALITY,POSTGRADUATE) 关系名,属性名 假设:导师与专业:1:1,导师与研究生:1:n 于是:SAP关系可以包含三个元组 (张清玫,信息专业,李勇),(张清玫,信息专业,刘晨),(刘逸,信息专业,王敏) ,关系(续),2) 元组 关系中的每个元素是关系中的元组,通常用t表示。 3) 单元关系与二元关系 当n=1时,称该关系为单元关系(Unary relation
33、)。 当n=2时,称该关系为二元关系(Binary relation)。,关系(续),4) 关系的表示 关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。,关系(续),5) 属性 关系中不同列可以对应相同的域,为了加以区分,必须对每列起一个名字,称为属性(Attribute)。 n目关系必有n个属性。,关系(续),6) 码 候选码(Candidate key) 若关系中的某一属性组的值能唯一地标识 一个元组,则称该属性组为候选码 在最简单的情况下,候选码只包含一个属性。 称为全码(All-key) 在最极端的情况下,关系模式的所有属性组 是这个关系模式的候选码,称为全码(All-
34、key),关系(续),码(续) 主码 若一个关系有多个候选码,则选定其中一个 为主码(Primary key) 主码的诸属性称为主属性(Prime attribute)。 不包含在任何侯选码中的属性称为非码属性 (Non-key attribute),关系(续),7) 三类关系 基本关系(基本表或基表) 实际存在的表,是实际存储数据的逻辑表示 查询表 查询结果对应的表 视图表 由基本表或其他视图表导出的表,是虚表,不对 应实际存储的数据,8) 基本关系的性质, 列是同质的(Homogeneous) 每一列中的分量是同一类型的数据,来自同 一个域 不同的列可出自同一个域 其中的每一列称为一个属性
35、 不同的属性要给予不同的属性名,基本关系的性质(续),上例中也可以只给出两个域: 人(PERSON)=张清玫,刘逸,李勇,刘晨,王敏 专业(SPECIALITY)=计算机专业,信息专业 SAP关系的导师属性和研究生属性都从PERSON域中取值 为了避免混淆,必须给这两个属性取不同的属性名,而不能直接使 用域名。 例如定义: 导师属性名为SUPERVISOR-PERSON(或SUPERVISOR) 研究生属性名为POSTGRADUATE-PERSON(或POSTGRADUATE),基本关系的性质(续), 列的顺序无所谓 列的次序可以任意交换 遵循这一性质的数据库产品(如ORACLE), 增加新属
36、性时,永远是插至最后一列 但也有许多关系数据库产品没有遵循这一 性质,例如FoxPro仍然区分了属性顺序,基本关系的性质(续), 任意两个元组不能完全相同 由笛卡尔积的性质决定 但许多关系数据库产品没有遵循这一性质。 例如: Oracle,FoxPro等都允许关系表中存在两个完全相同 的元组,除非用户特别定义了相应的约束条件。,基本关系的性质(续), 行的顺序无所谓 行的次序可以任意交换 遵循这一性质的数据库产品(如ORACLE), 插入一个元组时永远插至最后一行 但也有许多关系数据库产品没有遵循这一性 质,例如FoxPro仍然区分了元组的顺序,基本关系的性质(续), 分量必须取原子值 每一个
37、分量都必须是不可分的数据项。 这是规范条件中最基本的一条,2.2 关系数据结构,2.2.1 关系 2.2.2 关系模式 2.2.3 关系数据库,2.2.2 关系模式,1什么是关系模式 2定义关系模式 3. 关系模式与关系,1什么是关系模式,关系模式(Relation Schema)是型-静态稳定 关系是值-动态变化,因为操作更新数据库中数据 关系模式需要描述: 域:元组语义以及完整性约束条件 元组:该关系所涉及的属性集的笛卡尔积的一个元素 关系是元组的集合,笛卡尔积的子集。关系模式必须指出这个元组集合的结构,由哪些属性构成,这些属性来自哪些域,属性与域之间的映像关系。关系由元组语义-n目谓词确
38、定, n目谓词为真的笛卡尔积中的元素的全体就构成了该关系模式的关系。,2定义关系模式,定义:关系的描述称为关系模式,可以形式化地表示为:R(U,D,dom,F)R 关系名U 组成该关系的属性名集合D 属性组U中属性所来自的域dom 属性向域的映象集合F 属性间的数据依赖关系集合,定义关系模式 (续),例: 导师和研究生出自同一个域人, 必须取不同的属性名,并在模式中定义属性向域的映象,即说明它们分别出自哪个域:dom(SUPERVISOR-PERSON) = dom(POSTGRADUATE-PERSON) =PERSON,定义关系模式 (续),关系模式通常可以简记为R (U) 或 R (A1
39、,A2,An)R 关系名 A1,A2,An 属性名 注:域名及属性向域的映象常常直接说明为属性的类型、长度,3. 关系模式与关系,关系模式 对关系的描述 静态的、稳定的 关系 关系模式在某一时刻的状态或内容 动态的、随时间不断变化的 关系模式和关系往往统称为关系 通过上下文加以区别,2.2 关系数据结构,2.2.1 关系 2.2.2 关系模式 2.2.3 关系数据库,2.2.3 关系数据库,1. 关系数据库 2. 关系数据库的型与值,1. 关系数据库,在一个给定的应用领域中,所有实体及实 体之间联系的关系的集合构成一个关系数 据库。,2. 关系数据库的型与值,关系数据库也有型和值之分 关系数据
40、库的型称为关系数据库模式,是对关系数据库的描述 若干域的定义 在这些域上定义的若干关系模式 关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常简称为关系数据库,第二章 关系数据库,2.1 关系模型概述 2.2 关系数据结构 2.3 关系的完整性 2.4 关系代数 2.5 关系演算 2.6 小结,2.3 关系的完整性,关系模型的完整性规则是对关系的某种约束条件。 关系模型中三类完整性约束: 实体完整性 参照完整性 用户定义的完整性 实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性,应该由关系系统自动支持。,关系的完整性(续),2.3.1 实体完整性 2
41、.3.2. 参照完整性 2.3.3. 用户定义的完整性,2.3.1 实体完整性,实体完整性规则(Entity Integrity) 若属性A是基本关系R的主属性,则属性 A不能取空值 例 SAP(SUPERVISOR,SPECIALITY,POSTGRADUATE) 如果POSTGRADUATE属性为主码,因为前两个属性一定会重,(假设研究生不会重名),则其不能取空值,实体完整性规则,实体完整性是要保证关系中的每个元组都是可识别和唯一的。 实体完整性规则的具体内容是:若属性A是关系R的主属性,则属性A不可以为空值。 实体完整性是关系模型必须满足的完整性约束条件,也称作是关系的不变性。 关系数据
42、库管理系统可以用主关键字实现实体完整性,这是由关系系统自动支持的。,对实体完整性规则的几点说明,实体完整性规则是针对关系而言的,而关系则对应一个现实世界中的实体集。例如,仓库关系对应现实世界中的仓库实体集。 现实世界中的实体是可区分的,它们具有某种标识特征;相应地,关系中的元组也是可区分的,在关系中用主关键字做唯一性标识。 主关键字中的属性、即主属性不能取空值。如果主属性取空值,则意味着关系中的某个元组是不可标识的,即存在不可区分的实体,这与实体的定义也是矛盾的。,关系的完整性,2.3.1 实体完整性 2.3.2. 参照完整性 2.3.3. 用户定义的完整性,2.3.2 参照完整性,1. 关系
43、间的引用 2. 外码 3. 参照完整性规则,1. 关系间的引用,在关系模型中实体及实体间的联系都是用 关系来描述的,因此可能存在着关系与关 系间的引用。 例1 学生实体、专业实体以及专业与学生间的一对多联系学生(学号,姓名,性别,专业号,年龄)专业(专业号,专业名),两个关系间存在属性的引用,即学生关系引用了专业关系的主码“专业号”。学生关系中的专业号值必须是确实存在的专业,即,学生关系中的某个属性的取值需要参照专业关系的属性取值。,学生(学号,姓名,性别,专业号,年龄) 专业(专业号,专业名),关系间的引用(续),例2 学生、课程、学生与课程之间的多对多联系学生(学号,姓名,性别,专业号,年
44、龄)课程(课程号,课程名,学分)选修(学号,课程号,成绩),例2要说明的也是属性间存在引用。同样,选修关系中的学号必须是学生关系中有记录的学生,选修关系中的课程号值必须是课程关系中确实存在的。选修关系中某些属性的取值需要参照其他关系中属性的取值。,学生,学生选课,课程,关系间的引用(续),例3 学生实体及其内部的领导联系(一对多) 学生(学号,姓名,性别,专业号,年龄,班长)班长引用了本关系中“学号”属性,即必须是确实存在的学生的学号,2外码(Foreign Key),设F是基本关系R的一个或一组属性,但不 是关系R的码。如果F与基本关系S的主码 Ks相对应,则称F是基本关系R的外码 基本关系
45、R称为参照关系(ReferencingRelation) 基本关系S称为被参照关系(Referenced Relation)或目标关系(Target Relation)。,外码(续),说明 关系R和S不一定是不同的关系 目标关系S的主码Ks 和参照关系的外码F必须定义在同一个(或一组)域上 外码并不一定要与相应的主码同名当外码与相应的主码属于不同关系时,往往 取相同的名字,以便于识别,3. 参照完整性规则,若属性(或属性组)F是基本关系R的外码 它与基本关系S的主码Ks相对应(基本关 系R和S不一定是不同的关系),则对 于R中每个元组在F上的值必须为: 或者取空值(F的每个属性值均为空值) 或
46、者等于S中某个元组的主码值。,参照完整性规则(续),学生关系中每个元组的“专业号”属性只 取下面两类值: (1)空值,表示尚未给该学生分配专业 (2)非空值,这时该值必须是专业关系中某个元组的“专业号”值,表示该学生不可能分配到一个不存在的专业中,例1中“专业号”为学生关系的外码,专业关系为被参照关系专业号 学生关系 专业关系 例2中(略)学号 课程号 学生关系 选修关系 课程关系,参照完整性规则(续),选修(学号,课程号,成绩) “学号”和“课程号”是选修关系中的主属性 按照实体完整性和参照完整性规则,它们 只能取相应被参照关系中已经存在的主码 值,参照完整性规则(续),学生(学号,姓名,性
47、别,专业号,年龄,班长) “班长”属性值可以取两类值: (1)空值,表示该学生所在班级尚未选出班长,或该学生本人即是班长; (2)非空值,这时该值必须是本关系中某个元组的学号值,关系的完整性(续),2.3.1 实体完整性 2.3.2. 参照完整性 2.3.3. 用户定义的完整性,2.3.3 用户定义的完整性,一种与应用密切相关的数据完整性约束,如 某个属性的值必须唯一 某个非主属性不能取空值 某个属性的取值必须在某个范围内 某些属性值之间应该满足一定的函数关系等 类似以上的约束不是关系数据模型本身所要求的,而是为了满足具体应用必须的语义要求 在用户定义完整性中最常见的是限定属性的取值范围,即对
48、值域的约束,所以在用户定义完整性中最常见的是域完整性约束。,用户定义完整性约束的作用,执行插入操作时检查完整性 执行插入操作时需要分别检查实体完整性规则、参照完整性规则和用户定义完整性规则。 执行删除操作时检查完整性 执行删除操作时一般只需要检查参照完整性规则。 执行更新操作时检查完整性 执行更新操作可以看作是先删除旧的元组,然后再插入新的元组。所以执行更新操作时的完整性检查综合了上述两种情况。,用户定义的完整性(续),例:课程(课程号,课程名,学分) “课程名”属性必须取唯一值 非主属性“课程名”也不能取空值 “学分”属性只能取值1,2,3,4,2.4关系代数,是一种抽象的查询语言,是关系数据操纵语言的一种传统表达方式,是用对关系的运算表达查询的。 三大要素:运算对象、运算符、运算结果 运算符:集合运算符,-,专门的关系运算符算术比较符逻辑运算符,引入记号,关系模式R (A1,A2,An),tR表示R的一个元组t。tAi 表示属性元组t 中相应于属性Ai的分量 若A=Ai1,Ai2,Aik,其中Ai1,Ai2, ,Aik是A1,A2,An的一部分A称作属性列或域列。 元组的连接给定关系R(X,Z), 定义当tX=x时,x在R中的象集为 表示R中属性组X上值为x的诸元组在Z上分量的集合。,