1、数据库系统概论笔记数据(Data) :是数据库中存储的基本对象数据的定义:描述事物的符号记录数据的种类:文字、图形、图象、声音等数据的特点:数据与其语义是不可分的数据库(Database,简称 DB):是长期储存在计算机内、有组织的、可共享的大量数据集合数据库的特征: 数据按一定的数据模型组织、描述和储存 可为各种用户共享 冗余度较小 数据独立性较高 易扩展数据库管理系统(Database Management System,简称 DBMS):是位于用户与操作系统之间的一层数据管理软件。DBMS 的用途:科学地组织和存储数据、高效地获取和维护数据DBMS 的主要功能:数据库的运行管理保证数据的
2、安全性、完整性、多用户对数据的并发使用发生故障后的系统恢复 数据库的建立和维护功能(实用程序)数据库数据批量装载数据库转储介质故障恢复数据库的重组织性能监视等数据库系统(Database System,简称 DBS)是指在计算机系统中引入数据库后的系统构成。 数据库系统的构成 由数据库、数据库管理系统(及其开发工具) 、应用系统、数据库管理员(和用户)构成。 数据管理 对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。 数据模型应满足三方面要求 能比较真实地模拟现实世界 容易为人所理解 便于在计算机上实现 数据模型分成两
3、个不同的层次(1) 概念模型 也称信息模型,它是按用户的观点来对数据和信息建模。 (2) 数据模型 主要包括网状模型、层次模型、关系模型等,它是按计算机系统的观点对数据建模 。 客观对象的抽象过程-两步抽象 现实世界中的客观对象抽象为概念模型; 把概念模型转换为某一 DBMS 支持的数据模型。 数据结构 对象类型的集合数据结构是对系统静态特性的描述 两类对象 与数据类型、内容、性质有关的对象 与数据之间联系有关的对象 数据操作 对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则 数据操作的类型 检索 更新(包括插入、删除、修改) 数据模型对操作的定义 操作的确切含义 操作符号
4、操作规则(如优先级) 实现操作的语言 数据操作是对系统动态特性的描述。 数据模型对约束条件的定义 反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。信息世界中的基本概念(1) 实体(Entity) 客观存在并可相互区别的事物称为实体。(2) 属性(Attribute) 实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。 (3) 码(Key) 唯一标识实体的属性集称为码。 (4) 域(Domain) 属性的取值范围称为该属性的域。 (5) 实体型(Entity Type ) 用实体名及其属性
5、名集合来抽象和刻画同类实体称为实体型(6) 实体集(Entity Set) 同型实体的集合称为实体集联系(Relationship ) 现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系实体型间联系 两个实体型 一对一联系(1:1) 三个实体型 一对多联系(1:n) 一个实体型 多对多联系(m:n ) 两个实体型间的联系 一对一联系 如果对于实体集 A 中的每一个实体,实体集 B 中至多有一个实体与之联系,反之亦然,则称实体集 A 与实体集 B 具有一对一联系。记为 1:1。 一对多联系 如果对于实体集 A 中的每一个实体,实体集 B 中有 n 个实体(n0)
6、与之联系,反之,对于实体集 B 中的每一个实体,实体集 A 中至多只有一个实体与之联系,则称实体集 A 与实体集 B 有一对多联系记为 1:n 多对多联系(m:n) 如果对于实体集 A 中的每一个实体,实体集 B 中有 n 个实体(n0)与之联系,反之,对于实体集 B 中的每一个实体,实体集 A 中也有 m 个实体(m 0)与之联系,则称实体集 A 与实体 B 具有多对多联系。记为 m:n概念模型的表示方法 实体联系方法(E-R 方法) 用 E-R 图来描述现实世界的概念模型 E-R 方法也称为 E-R 模型常用数据模型 非关系模型 层次模型(Hierarchical Model) 网状模型(
7、Network Model ) 数据结构:以基本层次联系为基本单位基本层次联系:两个记录以及它们之间的一对多(包括一对一)的联系 关系模型(Relational Model) 数据结构:表 面向对象模型(Object Oriented Model) 数据结构:对象 层次模型满足下面两个条件的基本层次联系的集合为层次模型。1. 有且只有一个结点没有双亲结点,这个结点称为根结点2. 根以外的其它结点有且只有一个双亲结点 表示方法实体型:用记录类型描述。每个结点表示一个记录类型。属性:用字段描述。每个记录类型可包含若干个字段。联系:用结点之间的连线表示记录(类)型之间的一对多的联系网状数据模型的数据
8、结构 网状模型满足下面两个条件的基本层次联系的集合为网状模型。1. 允许一个以上的结点无双亲;2. 一个结点可以有多于一个的双亲。 表示方法(与层次数据模型相同)实体型:用记录类型描述。每个结点表示一个记录类型。属性:用字段描述。每个记录类型可包含若干个字段。联系:用结点之间的连线表示记录(类)型之间的一对多的父子联系。关系模型的基本概念 关系(Relation )一个关系对应通常说的一张表。 元组(Tuple)表中的一行即为一个元组。 属性(Attribute)表中的一列即为一个属性,给每一个属性起一个名称即属性名。 关系必须是规范化的,满足一定的规范条件最基本的规范条件:关系的每一个分量必
9、须是一个不可分的数据项。 查询、插入、删除、更新 数据操作是集合操作,操作对象和操作结果都是关系,即若干元组的集合 存取路径对用户隐蔽,用户只要指出“干什么”,不必详细说明“怎么干”关系模型的完整性约束 实体完整性 参照完整性 用户定义的完整性关系数据模型的存储结构 表以文件形式存储 有的 DBMS 一个表对应一个操作系统文件 有的 DBMS 自己设计文件结构关系模型的优缺点 优点 建立在严格的数学概念的基础上 概念单一。数据结构简单、清晰,用户易懂易用 实体和各类联系都用关系来表示。 对数据的检索结果也是关系。 关系模型的存取路径对用户透明 具有更高的数据独立性,更好的安全保密性 简化了程序
10、员的工作和数据库开发建立的工作 缺点存取路径对用户透明导致查询效率往往不如非关系数据模型为提高性能,必须对用户的查询请求进行优化增加了开发数据库管理系统的难度数据库系统外部的体系结构 单用户结构 主从式结构 分布式结构 客户/服务器结构 浏览器/应用服务器/数据库服务器结构分布式结构的数据库系统 数据库中的数据在逻辑上是一个整体,但物理地分布在计算机网络的不同结点上。 网络中的每个结点都可以独立处理本地数据库中的数据,执行局部应用 同时也可以同时存取和处理多个异地数据库中的数据,执行全局应用 优点 适应了地理上分散的公司、团体和组织对于数据库应用的需求。 缺点 数据的分布存放给数据的处理、管理
11、与维护带来困难。 当用户需要经常访问远程数据时,系统效率会明显地受到网络传输的制约数据库管理员(DBA) 决定数据库中的信息内容和结构 决定数据库的存储结构和存取策略 定义数据的安全性要求和完整性约束条件关系数据库 关系模型的组成 关系数据结构 关系操作集合 关系完整性约束 1) 常用的关系操作 查询 选择、投影、连接、除、并、交、差 数据更新 插入、删除、修改 查询的表达能力是其中最主要的部分 2) 关系操作的特点 集合操作方式,即操作的对象和结果都是集合。 非关系数据模型的数据操作方式:一次一记录 文件系统的数据操作方式 3) 关系数据语言的种类 关系代数语言 用对关系的运算来表达查询要求
12、 4) 关系数据语言的特点 关系语言是一种高度非过程化的语言 存取路径的选择由 DBMS 的优化机制来完成 用户不必用循环结构就可以完成数据操作 能够嵌入高级语言中使用 关系代数、元组关系演算和域关系演算三种语言在表达能力上完全等价关系 域(Domain) 2. 笛卡尔积(Cartesian Product) 3. 关系(Relation ) 域是一组具有相同数据类型的值的集合。例: 整数 实数 介于某个取值范围的整数 长度指定长度的字符串集合 男, 女 介于某个取值范围的日期 笛卡尔积给定一组域 D1,D2,Dn,这些域中可以有相同的。D1,D2,Dn 的笛卡尔积为:D1D2Dn(d1,d2
13、,dn)di Di,i 1,2,n 所有域的所有取值的一个组合 不能重复 2) 元组(Tuple) 笛卡尔积中每一个元素(d1,d2,dn)叫作一个 n 元组(n-tuple)或简称元组。 3) 分量(Component) 笛卡尔积元素(d1,d2,dn)中的每一个值 di 叫作一个分量。 4) 基数(Cardinal number) 若 Di(i1,2,n)为有限集,其基数为 mi(i 1,2,n) ,则D1D2Dn 的基数 M 为: 5)笛卡尔积的表示方法 笛卡尔积可表示为一个二维表。表中的每行对应一个元组,表中的每列对应一个域。关系(Relation )1) 关系D1D2Dn 的子集叫作
14、在域 D1,D 2,Dn 上的关系,表示为R(D1, D2,Dn)R: 关系名n: 关系的目或度(Degree)2) 元组关系中的每个元素是关系中的元组,通常用 t 表示。3) 单元关系与二元关系当 n=1 时,称该关系为单元关系(Unary relation) 。当 n=2 时,称该关系为二元关系(Binary relation)4) 关系的表示关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。5) 属性关系中不同列可以对应相同的域,为了加以区分,必须对每列起一个名字,称为属性(Attribute) 。n 目关系必有 n 个属性。6) 码候选码(Candidate key )若关
15、系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码在最简单的情况下,候选码只包含一个属性。称为全码(All-key )在最极端的情况下,关系模式的所有属性组是这个关系模式的候选码,称为全码(All-key)主码若一个关系有多个候选码,则选定其中一个为主码(Primary key )主码的诸属性称为主属性(Prime attribute ) 。不包含在任何侯选码中的属性称为非码属性(Non-key attribute) 7) 三类关系基本关系(基本表或基表)实际存在的表,是实际存储数据的逻辑表示查询表查询结果对应的表视图表由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据基本
16、关系的性质 列是同质的(Homogeneous)每一列中的分量是同一类型的数据,来自同一个域 不同的列可出自同一个域其中的每一列称为一个属性不同的属性要给予不同的属性名 列的顺序无所谓列的次序可以任意交换遵循这一性质的数据库产品(如 ORACLE),增加新属性时,永远是插至最后一列但也有许多关系数据库产品没有遵循这一性质,例如 FoxPro 仍然区分了属性顺序 任意两个元组不能完全相同由笛卡尔积的性质决定但许多关系数据库产品没有遵循这一性质。例如:Oracle,FoxPro 等都允许关系表中存在两个完全相同的元组,除非用户特别定义了相应的约束条件。 行的顺序无所谓行的次序可以任意交换遵循这一性
17、质的数据库产品(如 ORACLE),插入一个元组时永远插至最后一行但也有许多关系数据库产品没有遵循这一性质,例如 FoxPro 仍然区分了元组的顺序 分量必须取原子值每一个分量都必须是不可分的数据项。这是规范条件中最基本的一条关系模式(Relation Schema)是型关系是值关系模式是对关系的描述元组集合的结构属性构成属性来自的域 属性与域之间的映象关系元组语义以及完整性约束条件属性间的数据依赖关系集合 定义关系模式关系模式可以形式化地表示为:R(U,D,dom,F)R 关系名U 组成该关系的属性名集合D 属性组 U 中属性所来自的域dom 属性向域的映象集合F 属性间的数据依赖关系集合关
18、系模式通常可以简记为R (U) 或 R (A1, A2,An)R 关系名A1,A2,An 属性名注:域名及属性向域的映象常常直接说明为属性的类型、长度关系模式对关系的描述静态的、稳定的关系关系模式在某一时刻的状态或内容动态的、随时间不断变化的关系模式和关系往往统称为关系通过上下文加以区别1. 关系数据库在一个给定的应用领域中,所有实体及实体之间联系的关系的集合构成一个关系数据库。2. 关系数据库的型与值关系数据库也有型和值之分关系数据库的型称为关系数据库模式,是对关系数据库的描述若干域的定义在这些域上定义的若干关系模式关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常简称为关系数据库
19、3 关系的完整性关系模型的完整性规则是对关系的某种约束条件。关系模型中三类完整性约束:实体完整性参照完整性用户定义的完整性实体完整性和参照完整性是关系模型必须满足的完整性约束条件,被称作是关系的两个不变性,应该由关系系统自动支持。实体完整性实体完整性规则(Entity Integrity)若属性 A 是基本关系 R 的主属性,则属性A 不能取空值关系模型必须遵守实体完整性规则的原因(1) 实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集或多对多联系。(2) 现实世界中的实体和实体间的联系都是可区分的,即它们具有某种唯一性标识。(3) 相应地,关系模型中以主码作为唯一性
20、标识。关系模型必须遵守实体完整性规则的原因(续)(4) 主码中的属性即主属性不能取空值。空值就是“不知道” 或“ 无意义 ”的值。主属性取空值,就说明存在某个不可标识的实体,即存在不可区分的实体,这与第(2)点相矛盾,因此这个规则称为实体完整性。注意实体完整性规则规定基本关系的所有主属性都不能取空值参照完整性1. 关系间的引用2. 外码3. 参照完整性规则1. 关系间的引用在关系模型中实体及实体间的联系都是用关系来描述的,因此可能存在着关系与关系间的引用。2外码(Foreign Key)设 F 是基本关系 R 的一个或一组属性,但不是关系 R 的码。如果 F 与基本关系 S 的主码Ks 相对应
21、,则称 F 是基本关系 R 的外码基本关系 R 称 为参照关系(ReferencingRelation)基本关系 S 称 为被参照关系(ReferencedRelation)或目标关系( Target Relation) 。说明 关系 R 和 S 不一定是不同的关系 目标关系 S 的主码 Ks 和参照关系的外码 F 必须定义在同一个(或一组)域上 外码并不一定要与相应的主码同名当外码与相应的主码属于不同关系时,往往 取相同的名字,以便于识别3. 参照完整性规则若属性(或属性组)F 是基本关系 R 的外码它与基本关系 S 的主码 Ks 相对应(基本关系 R 和 S 不一定是不同的关系) ,则对于
22、 R 中每个元组在 F 上的值必须为: 或者取空值(F 的每个属性值均为空值) 或者等于 S 中某个元组的主码值。2.3.3 用户定义的完整性 用户定义的完整性是针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求。 关系模型应提供定义和检验这类完整性的机制,以便用统一的系统的方法处理它们,而不要由应用程序承担这一功能。Operation 运算,操作Operator 算子Operand 操作数1.关系代数一种抽象的查询语言用对关系的运算来表达查询2关系代数运算的三个要素运算对象:关系运算结果:关系运算符:四类关系代数运算符 集合运算符-并差交广义笛卡尔积比较运算符
23、大于大于等于小于小于等于等于不等于专门的关系运算符 选择投影连接除逻辑运算符 非与或4关系代数运算的分类传统的集合运算并、差、交、广义笛卡尔积专门的关系运算选择、投影、连接、除5表示记号 (1) R,tR,tAi设关系模式为 R(A1,A2,An)它的一个关系设为 R。tR 表示 t 是 R 的一个元组tAi则表示元组 t 中相应于属性 Ai 的一个分量 (2) A,tA , A若 A=Ai1,Ai2,Aik,其中 Ai1,Ai2,Aik 是 A1,A2,An 中的一部分,则 A 称为属性列或域列。tA=(tAi1,tAi 2,tAik)表示元组 t 在属性列 A 上诸分量的集合。A 则表示A
24、1,A2,An中去掉Ai1,Ai 2,Aik后剩余的属性组。 (3) tr tsR 为 n 目关系,S 为 m 目关系。 tr R,tsS, tr ts 称为元组的连接。它是一个 n + m 列的元组,前 n 个分量为 R 中的一个 n 元组,后 m 个分量为 S 中的一个 m 元组。 4)象集 Zx给定一个关系 R(X,Z) ,X 和 Z 为属性组。当 tX=x 时,x 在 R 中的象集(Images Set)为:Zx=tZ|t R,t X=x它表示 R 中属性组 X 上值为 x 的诸元组在 Z 上分量的集合。 1. 并(Union) R 和 S 具有相同的目 n(即两个关系都有 n 个属性
25、) 相应的属性取自同一个域 RS 仍为 n 目关系,由属于 R 或属于 S 的元组组成RS = t|t Rt S R 和 S 具有相同的目 n 相应的属性取自同一个域 R - S 仍为 n 目关系,由属于 R 而不属于 S 的所有元组组成R -S = t|tRtS R 和 S 具有相同的目 n 相应的属性取自同一个域 RS 仍为 n 目关系,由既属于 R 又属于 S 的元组组成RS = t|t Rt S RS = R (R- S)4. 广义笛卡尔积(Extended Cartesian Product) R n 目关系,k1 个元组 S m 目关系,k2 个元组 RS 列:(n+m )列的元组
26、的集合 元组的前 n 列是关系 R 的一个元组 后 m 列是关系 S 的一个元组 行:k1k2 个元组 RS = tr ts |tr R tsS 专门的关系运算1. 选择(Selection) 1) 选择又称为限制(Restriction) 2) 选择运算符的含义 在关系 R 中选择满足给定条件的诸元组F(R) = t|tRF (t)= 真 F:选择条件,是一个逻辑表达式,基本形式为:( X1Y 1 ) ( X2Y 2 ) :比较运算符(,或,=,!,!, NOT IN :用逗号分隔的一组取值(4) 字符串匹配 NOT LIKE ESCAPE :指定匹配模板匹配模板:固定字符串或含通配符的字符
27、串当匹配模板为固定字符串时,可以用 = 运算符取代 LIKE 谓词用 != 或 运算符取代 NOT LIKE 谓词通配符 % (百分号) 代表任意长度(长度可以为 0)的字符串 例:a%b 表示以 a 开头,以 b 结尾的任意长度的字符串。如 acb,addgb,ab 等都满足该匹配串 _ (下横线) 代表任意单个字符 例:a_b 表示以 a 开头,以 b 结尾的长度为 3 的任意字符串。如 acb,afb 等都满足该匹配串查询 DB_Design 课程的课程号和学分。SELECT Cno,CcreditFROM CourseWHERE Cname LIKE DB_Design ESCAPE
28、(5) 涉及空值的查询 使用谓词 IS NULL 或 IS NOT NULL “IS NULL” 不能用 “= NULL” 代替(6) 多重条件查询用逻辑运算符 AND 和 OR 来联结多个查询条件 AND 的优先级高于 OR 可以用括号改变优先级可用来实现多种其他谓词 NOT IN NOT BETWEEN AND 三、对查询结果排序 使用 ORDER BY 子句 可以按一个或多个属性列排序 升序:ASC;降序:DESC;缺省值为升序当排序列含空值时 ASC:排序列为空值的元组最后显示 DESC:排序列为空值的元组最先显示 四、使用集函数 5 类主要集函数 计数COUNT(DISTINCT|A
29、LL *)COUNT(DISTINCT|ALL ) 计算总和SUM( DISTINCT|ALL ) 计算平均值AVG(DISTINCT|ALL )求最大值MAX(DISTINCT|ALL )求最小值MIN(DISTINCT|ALL ) DISTINCT 短语:在计算时要取消指定列中的重复值 ALL 短语:不取消重复值 ALL 为缺省值五、对查询结果分组 使用 GROUP BY 子句分组 细化集函数的作用对象 未对查询结果分组,集函数将作用于整个查询结果 对查询结果分组后,集函数将分别作用于每个组 GROUP BY 子句的作用对象是查询的中间结果表 分组方法:按指定的一列或多列值分组,值相等的为
30、一组 使用 GROUP BY 子句后,SELECT 子句的列名列表中只能出现分组属性和集函数使用 HAVING 短语筛选最终输出结果 只有满足 HAVING 短语指定条件的组才输出 HAVING 短语与 WHERE 子句的区别:作用对象不同 WHERE 子句作用于基表或视图,从中选择满足条件的元组。 HAVING 短语作用于组,从中选择满足条件的组。 连接查询 同时涉及多个表的查询称为连接查询用来连接两个表的条件称为连接条件或连接谓词 一般格式: . .比较运算符:=、 、=、. BETWEEN . AND . 连接字段 连接谓词中的列名称为连接字段 连接条件中的各连接字段类型必须是可比的,但
31、不必是相同的连接操作的执行过程 嵌套循环法(NESTED-LOOP) 首先在表 1 中找到第一个元组,然后从头开始扫描表 2,逐一查找满足连接件的元组,找到后就将表 1 中的第一个元组与该元组拼接起来,形成结果表中一个元组。 表 2 全部查找完后,再找表 1 中第二个元组,然后再从头开始扫描表 2,逐一查找满足连接条件的元组,找到后就将表 1 中的第二个元组与该元组拼接起来,形成结果表中一个元组。 重复上述操作,直到表 1 中的全部元组都处理完毕 排序合并法(SORT-MERGE)常用于=连接 首先按连接属性对表 1 和表 2 排序 对表 1 的第一个元组,从头开始扫描表 2,顺序查找满足连接
32、条件的元组,找到后就将表 1 中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表 2 中第一条大于表 1 连接字段值的元组时,对表 2 的查询不再继续 找到表 1 的第二条元组,然后从刚才的中断点处继续顺序扫描表 2,查找满足连接条件的元组,找到后就将表 1 中的第一个元组与该元组拼接起来,形成结果表中一个元组。直接遇到表 2 中大于表 1 连接字段值的元组时,对表 2 的查询不再继续 重复上述操作,直到表 1 或表 2 中的全部元组都处理完毕为止 索引连接(INDEX-JOIN) 对表 2 按连接字段建立索引 对表 1 中的每个元组,依次根据其连接字段值查询表 2 的索引,从中找
33、到满足条件的元组,找到后就将表 1 中的第一个元组与该元组拼接起来,形成结果表中一个元组 SQL 中连接查询的主要类型 广义笛卡尔积 等值连接(含自然连接) 非等值连接查询 自身连接查询 外连接查询 复合条件连接查询一、广义笛卡尔积 不带连接谓词的连接 很少使用二、等值与非等值连接查询 等值连接 连接运算符为 = 的连接操作 . = . 任何子句中引用表 1 和表 2 中同名属性时,都必须加表名前缀。引用唯一属性名时可以加也可以省略表名前缀。 自然连接 等值连接的一种特殊情况,把目标列中重复的属性列去掉。非等值连接查询连接运算符 不是 = 的连接操作三、自身连接 一个表与其自己进行连接,称为表
34、的自身连接 需要给表起别名以示区别 由于所有属性名都是同名属性,因此必须使用别名前缀四、外连接(Outer Join ) 外连接与普通连接的区别 普通连接操作只输出满足连接条件的元组 外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出 在表名后面加外连接操作符(*)或(+) 指定非主体表 非主体表有一“万能” 的虚行,该行全部由空值组成 虚行可以和主体表中所有不满足连接条件的元组进行连接 由于虚行各列全部是空值,因此与虚行连接的结果中,来自非主体表的属性值全部是空值 左外连接 外连接符出现在连接条件的左边 右外连接 外连接符出现在连接条件的右边 五、复合条件连接WHERE 子
35、句中含多个连接条件时,称为复合条件连接 嵌套查询概述 一个 SELECT-FROM-WHERE 语句称为一个查询块 将一个查询块嵌套在另一个查询块的 WHERE 子句或 HAVING 短语的条件中的查询称为嵌套查询 子查询的限制 不能使用 ORDER BY 子句 层层嵌套方式反映了 SQL 语言的结构化 有些嵌套查询可以用连接运算替代 不相关子查询子查询的查询条件不依赖于父查询 相关子查询子查询的查询条件依赖于父查询 不相关子查询是由里向外逐层处理。即每个子查询在上一级查询处理之前求解,子查询的结果用于建立其父查询的查找条件。 相关子查询 首先取外层查询中表的第一个元组,根据它与内层查询相关的
36、属性值处理内层查询,若 WHERE 子句返回值为真,则取此元组放入结果表; 然后再取外层表的下一个元组; 重复这一过程,直至外层表全部检查完为止引出子查询的谓词 带有 IN 谓词的子查询 带有比较运算符的子查询 带有 ANY 或 ALL 谓词的子查询 带有 EXISTS 谓词的子查询一、带有 IN 谓词的子查询二、带有比较运算符的子查询 当能确切知道内层查询返回单值时,可用比较运算符(,= ,) 。 与 ANY 或 ALL 谓词配合使用三、带有 ANY 或 ALL 谓词的子查询谓词语义 ANY:任意一个值 ALL:所有值需要配合使用比较运算符 ANY 大于子查询结果中的某个值 ALL 大于子查
37、询结果中的所有值= ANY 大于等于子查询结果中的某个值 = ALL 大于等于子查询结果中的所有值)ANY 不等于子查询结果中的某个值!=(或 值的个数 值的类型2. 插入子查询结果 语句格式INSERT INTO ( , )子查询; 功能将子查询结果插入指定表中INSERTINTO Deptage(Sdept,Avgage)SELECT Sdept,AVG(Sage)FROM StudentGROUP BY Sdept; INTO 子句(与插入单条元组类似) 指定要插入数据的表名及属性列 属性列的顺序可与表定义中的顺序不一致 没有指定属性列:表示要插入的是一条完整的元组 指定部分属性列:插入
38、的元组在其余属性列上取空值 子查询 SELECT 子句目标列必须与 INTO 子句匹配 值的个数 值的类型3.4.2 修改数据 语句格式UPDATE SET =,=WHERE ; 功能修改指定表中满足 WHERE 子句条件的元组 三种修改方式 修改某一个元组的值 修改多个元组的值 带子查询的修改语句UPDATE SCSET Grade=0WHERE CS=(SELETE SdeptFROM StudentWHERE Student.Sno = SC.Sno); SET 子句指定修改方式要修改的列修改后取值 WHERE 子句指定要修改的元组缺省表示要修改表中的所有元组DBMS 在执行修改语句时会
39、检查修改操作是否破坏表上已定义的完整性规则 实体完整性 主码不允许修改 用户定义的完整性 NOT NULL 约束 UNIQUE 约束 值域约束DELETEFROM WHERE ; 功能 删除指定表中满足 WHERE 子句条件的元组 WHERE 子句 指定要删除的元组 缺省表示要修改表中的所有元组 三种删除方式 删除某一个元组的值 删除多个元组的值 带子查询的删除语句DBMS 在执行插入语句时会检查所插元组是否破坏表上已定义的完整性规则 参照完整性 不允许删除 级联删除更新数据与数据一致性DBMS 在执行插入、删除、更新语句时必须保证数据库一致性 必须有事务的概念和原子性 完整性检查和保证3.5
40、 视 图视图的特点 虚表,是从一个或几个基本表(或视图)导出的表 只存放视图的定义,不会出现数据冗余 基表中的数据发生变化,从视图中查询出的数据也随之改变基于视图的操作 查询 删除 受限更新 定义基于该视图的新视图1. 建立视图 语句格式CREATE VIEW ( ,)AS WITH CHECK OPTION;DBMS 执行 CREATE VIEW 语句时只是把视图的定义存入数据字典,并不执行其中的 SELECT 语句。在对视图查询时,按视图的定义从基本表中将数据查出。组成视图的属性列名全部省略或全部指定 省略: 由子查询中 SELECT 目标列中的诸字段组成 明确指定视图的所有列名:(1)
41、某个目标列是集函数或列表达式(2) 目标列为 *(3) 多表连接时选出了几个同名列作为视图的字段(4) 需要在视图中为某个列启用新的更合适的名字 WITH CHECK OPTION透过视图进行增删改操作时,不得破坏视图定义中的谓词条件(即子查询中的条件表达式)带表达式的视图定义一个反映学生出生年份的视图。CREATE VIEW BT_S(Sno,Sname,Sbirth)AS SELECT Sno, Sname,2000-SageFROM Student设置一些派生属性列, 也称为虚拟列-Sbirth 带表达式的视图必须明确定义组成视图的各个属性列名 一类不易扩充的视图 以 SELECT *
42、方式创建的视图可扩充性差,应尽可能避免2. 删除视图 DROP VIEW ; 该语句从数据字典中删除指定的视图定义 由该视图导出的其他视图定义仍在数据字典中,但已不能使用,必须显式删除 删除基表时,由该基表导出的所有视图定义都必须显式删除3.5.2 查询视图 从用户角度:查询视图与查询基本表相同 DBMS 实现视图查询的方法 实体化视图(View Materialization ) 有效性检查:检查所查询的视图是否存在 执行视图定义,将视图临时实体化,生成临时表 查询视图转换为查询临时表 查询完毕删除被实体化的视图(临时表) 视图消解法(View Resolution) 进行有效性检查,检查查
43、询的表、视图等是否存在。如果存在,则从数据字典中取出视图的定义 把视图定义中的子查询与用户的查询结合起来,转换成等价的对基本表的查询 执行修正后的查询 视图实体化法 视图消解法3.5.3 更新视图 用户角度:更新视图与更新基本表相同 DBMS 实现视图更新的方法 视图实体化法(View Materialization ) 视图消解法(View Resolution) 指定 WITH CHECK OPTION 子句后DBMS 在更新视图时会进行检查,防止用户通过视图对不属于视图范围内的基本表数据进行更新更新视图的限制 一些视图是不可更新的,因为对这些视图的更新不能唯一地有意义地转换成对相应基本表
44、的更新(对两类方法均如此) 允许对行列子集视图进行更新 对其他类型视图的更新不同系统有不同限制DB2 对视图更新的限制:(1) 若视图是由两个以上基本表导出的,则此视图不允许更新。(2) 若视图的字段来自字段表达式或常数,则不允许对此视图执行 INSERT 和 UPDATE 操作,但允许执行 DELETE 操作。若视图的字段来自集函数,则此视图不允许更新。(4) 若视图定义中含有 GROUP BY 子句,则此视图不允许更新。(5) 若视图定义中含有 DISTINCT 短语,则此视图不允许更新。(6) 若视图定义中有嵌套查询,并且内层查询的 FROM 子句中涉及的表也是导出该视图的基本表,则此视
45、图不允许更新。(7) 一个不允许更新的视图上定义的视图也不允许更新视图对重构数据库提供了一定程度的逻辑独立性 物理独立性与逻辑独立性的概念 视图在一定程度上保证了数据的逻辑独立性 视图只能在一定程度上提供数据的逻辑独立性 由于对视图的更新是有条件的,因此应用程序中修改数据的语句可能仍会因基本表结构的改变而改变。视图能够对机密数据提供安全保护 对不同用户定义不同视图,使每个用户只能看到他有权看到的数据 通过 WITH CHECK OPTION 对关键数据定义操作时间限制3.6 数据控制 3.6.1 授权 3.6.2 收回权限数据控制亦称为数据保护,包括数据的: 安全性控制 完整性控制 并发控制
46、恢复SQL 语言的数据控制功能SQL 语言提供了数据控制功能,能够在一定程度上保证数据库中数据的完全性、完整性,并提供了一定的并发控制及恢复能力。1. 完整性 数据库的完整性是指数据库中数据的正确性与相容性。 SQL 语言定义完整性约束条件CREATE TABLE 语句ALTER TABLE 语句 码 取值唯一的列 参照完整性 其他约束条件2. 并发控制 并发控制: 当多个用户并发地对数据库进行操作时,对他们加以控制、协调,以保证并发操作正确执行,保持数据库的一致性。 SQL 语言并发控制能力:提供事务、事务开始、事务结束、提交等概念3. 恢复 恢复: 当发生各种类型的故障导致数据库处于不一致
47、状态时,将数据库恢复到一致状态的功能。 SQL 语言恢复功能:提供事务回滚、重做等概念(UNDO、REDO)4. 安全性 安全性:保护数据库,防止不合法的使用所造成的数据泄露和破坏。 保证数据安全性的主要措施存取控制:控制用户只能存取他有权存取的数据规定不同用户对于不同数据对象所允许执行的操作DBMS 实现数据安全性保护的过程 用户或 DBA 把授权决定告知系统 SQL 的 GRANT 和 REVOKE DBMS 把授权的结果存入数据字典 当用户提出操作请求时,DBMS 根据授权定义进行检查,以决定是否执行操作请求3.6.1 授 权 GRANT 语句的一般格式:GRANT ,. ON TO ,.WITH GRANT OPTION; 谁定义?DBA 和表的建立者(即表的属主) REVOKE 功能:将对指定操作对象的指定操作权限授予指定的用户。(1) 操作权限 对 象 对 象 类 型 操 作 权 限 属 性 列 TABLE SELECT,INSERT,UPDATE,DELETE,AL