1、,数据库系统概论 An Introduction to Database System,xx大学信息学院,第三章 关系数据库标准语言SQL (续1),第三章 关系数据库标准语言SQL,3.1 SQL概述 3.2 学生-课程数据库 3.3 数据定义 3.4 数据查询 3.5 数据更新 3.6 空值的处理 3.7 视图 3.8 小结,3.4 数据查询,3.4.1 单表查询 3.4.2 连接查询 3.4.3 嵌套查询 3.4.4 集合查询 3.4.5基于派生表的查询 3.4.5 Select语句的一般形式,3.4.2 连接查询,连接查询:同时涉及两个以上的表的查询 连接条件或连接谓词:用来连接两个表
2、的条件一般格式: . . . BETWEEN . AND . 连接字段:连接谓词中的列名称 连接条件中的各连接字段类型必须是可比的,但名字不必相同,连接查询(续),1.等值与非等值连接查询 2.自身连接 3.外连接 4.多表连接,1. 等值与非等值连接查询,等值连接:连接运算符为=例 3.49 查询每个学生及其选修课程的情况SELECT Student.*, SC.*FROM Student, SCWHERE Student.Sno = SC.Sno;,等值与非等值连接查询(续),查询结果:,连接操作的执行过程,(1)嵌套循环法(NESTED-LOOP) 首先在表1中找到第一个元组,然后从头开
3、始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。 表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,逐一查找满足连接条件的元组,找到后就将表1中的第二个元组与该元组拼接起来,形成结果表中一个元组。 重复上述操作,直到表1中的全部元组都处理完毕 注:连接操作的执行过程,在第九章 关系查询处理和查询优化中将比较详细 地讲解,在爱课程网9.1节中还有连接操作的实现 的 动画。这里只是先 简单介绍一下。,连接操作的执行过程(续),(2)排序合并法(SORT-MERGE) 常用于=连接 首先按连接属性对表1和表2排序 对表1的第一个
4、元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不再继续,连接操作的执行过程(续),(2)排序合并法(续) 找到表1的第二条元组,然后从刚才的中断点处继续顺序扫描表2,查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。直接遇到表2中大于表1连接字段值的元组时,对表2的查询不再继续 重复上述操作,直到表1或表2中的全部元组都处理完毕为止,连接操作的执行过程(续),(3)索引连接(INDEX-JOIN) 对表2按连接字段建立索引
5、 对表1中的每个元组,依次根据其连接字段值查询表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组,等值与非等值连接查询(续),自然连接例 3.50 对例 3.49用自然连接完成。SELECT Student.Sno,Sname,Ssex,Sage,Sdept,Cno,GradeFROM Student,SCWHERE Student.Sno = SC.Sno;,等值与非等值连接查询(续),一条SQL语句可以同时完成选择和连接查询,这时WHERE子句是由连接谓词和选择谓词组成的复合条件。 例 3.51 查询选修2号课程且成绩在90分以上的所有学
6、生的学号和姓名。SELECT Student.Sno, SnameFROM Student, SCWHERE Student.Sno=SC.Sno AND SC.Cno= 2 AND SC.Grade90; 执行过程: 先从SC中挑选出Cno=2并且Grade90的元组形成一个中间关系 再和Student中满足连接条件的元组进行连接得到最终的结果关系,连接查询(续),1.等值与非等值连接查询 2.自身连接 3.外连接 4.多表连接,2. 自身连接,自身连接:一个表与其自己进行连接 需要给表起别名以示区别 由于所有属性名都是同名属性,因此必须使用别名前缀 例 3.52查询每一门课的间接先修课(即
7、先修课的先修课)SELECT FIRST.Cno, SECOND.CpnoFROM Course FIRST, Course SECONDWHERE FIRST.Cpno = SECOND.Cno;,自身连接(续),FIRST表(Course表) SECOND表(Course表),自身连接(续),查询结果:,连接查询(续),1.等值与非等值连接查询 2.自身连接 3.外连接 4.多表连接,3. 外连接,外连接与普通连接的区别 普通连接操作只输出满足连接条件的元组 外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出左外连接 列出左边关系中所有的元组 右外连接 列出右边关系中所有
8、的元组,外连接(续),例 3. 53 改写例 3.49SELECT Student.Sno,Sname,Ssex,Sage,Sdept,Cno,GradeFROM Student LEFT OUT JOIN SC ON (Student.Sno=SC.Sno);,外连接(续),执行结果:,连接查询(续),1.等值与非等值连接查询 2.自身连接 3.外连接 4.多表连接,4. 多表连接,多表连接:两个以上的表进行连接例3.54查询每个学生的学号、姓名、选修的课程名及成绩SELECT Student.Sno, Sname, Cname, GradeFROM Student, SC, Course
9、/*多表连接*/WHERE Student.Sno = SC.Sno AND SC.Cno = Course.Cno;,3.4 数据查询,3.4.1 单表查询 3.4.2 连接查询 3.4.3 嵌套查询 3.4.4 集合查询 3.4.5基于派生表的查询 3.4.5 Select语句的一般形式,嵌套查询(续),嵌套查询概述 一个SELECT-FROM-WHERE语句称为一个查询块 将一个查询块嵌套在另一个查询块的WHERE子句或HAVING短语的条件中的查询称为嵌套查询SELECT Sname /*外层查询/父查询*/FROM StudentWHERE Sno IN( SELECT Sno /*
10、内层查询/子查询*/FROM SCWHERE Cno= 2 );,嵌套查询(续),上层的查询块称为外层查询或父查询 下层查询块称为内层查询或子查询 SQL语言允许多层嵌套查询 即一个子查询中还可以嵌套其他子查询 子查询的限制 不能使用ORDER BY子句,嵌套查询求解方法,不相关子查询:子查询的查询条件不依赖于父查询 由里向外 逐层处理。即每个子查询在上一级查询处理之前求解,子查询的结果用于建立其父查询的查找条件。,嵌套查询求解方法(续),相关子查询:子查询的查询条件依赖于父查询 首先取外层查询中表的第一个元组,根据它与内层查询相关的属性值处理内层查询,若WHERE子句返回值为真,则取此元组放
11、入结果表 然后再取外层表的下一个元组 重复这一过程,直至外层表全部检查完为止,3.4.3 嵌套查询,1.带有IN谓词的子查询 2.带有比较运算符的子查询3.带有ANY(SOME)或ALL谓词的子查询4.带有EXISTS谓词的子查询,1. 带有IN谓词的子查询,例 3.55 查询与“刘晨”在同一个系学习的学生。此查询要求可以分步来完成 确定“刘晨”所在系名 SELECT Sdept FROM Student WHERE Sname= 刘晨 ;结果为: CS,带有IN谓词的子查询(续), 查找所有在CS系学习的学生。 SELECT Sno, Sname, Sdept FROM Student WH
12、ERE Sdept= CS ; 结果为:,带有IN谓词的子查询(续),将第一步查询嵌入到第二步查询的条件中SELECT Sno, Sname, SdeptFROM StudentWHERE Sdept IN(SELECT SdeptFROM StudentWHERE Sname= 刘晨 );此查询为不相关子查询。,带有IN谓词的子查询(续),用自身连接完成例 3.55查询要求SELECT S1.Sno, S1.Sname,S1.SdeptFROM Student S1,Student S2WHERE S1.Sdept = S2.Sdept ANDS2.Sname = 刘晨;,带有IN谓词的子查
13、询(续),例 3.56查询选修了课程名为“信息系统”的学生学号和姓名SELECT Sno,Sname 最后在Student关系中FROM Student 取出Sno和SnameWHERE Sno IN(SELECT Sno 然后在SC关系中找出选FROM SC 修了3号课程的学生学号WHERE Cno IN(SELECT Cno 首先在Course关系中找出FROM Course “信息系统”的课程号,为3号WHERE Cname= 信息系统 );,带有IN谓词的子查询(续),用连接查询实现例 3.56 :SELECT Sno,SnameFROM Student,SC,CourseWHERE
14、Student.Sno = SC.Sno ANDSC.Cno = Course.Cno ANDCourse.Cname=信息系统;,3.4.3 嵌套查询,1.带有IN谓词的子查询 2.带有比较运算符的子查询3.带有ANY(SOME)或ALL谓词的子查询4.带有EXISTS谓词的子查询,2. 带有比较运算符的子查询,当能确切知道内层查询返回单值时,可用比较运算符(,=,)。 在例 3.55中,由于一个学生只可能在一个系学习,则可以用 = 代替IN :SELECT Sno,Sname,SdeptFROM StudentWHERE Sdept =(SELECT SdeptFROM StudentWH
15、ERE Sname= 刘晨);,带有比较运算符的子查询(续),例 3.57 找出每个学生超过他选修课程平均成绩的课程号。SELECT Sno, CnoFROM SC xWHERE Grade =(SELECT AVG(Grade) FROM SC yWHERE y.Sno=x.Sno);,相关子查询,带有比较运算符的子查询(续),可能的执行过程 从外层查询中取出SC的一个元组x,将元组x的Sno值(201215121)传送给内层查询。SELECT AVG(Grade)FROM SC yWHERE y.Sno=201215121;,带有比较运算符的子查询(续),可能的执行过程(续) 执行内层查询
16、,得到值88(近似值),用该值代替内层查询,得到外层查询:SELECT Sno,CnoFROM SC xWHERE Grade =88;,带有比较运算符的子查询(续),可能的执行过程(续) 执行这个查询,得到(201215121,1)(201215121,3) 然后外层查询取出下一个元组重复做上述至步骤,直到外层的SC元组全部处理完毕。结果为:(201215121,1)(201215121,3)(201215122,2),3.4.3 嵌套查询,1.带有IN谓词的子查询 2.带有比较运算符的子查询3.带有ANY(SOME)或ALL谓词的子查询4.带有EXISTS谓词的子查询,带有ANY(SOME
17、)或ALL谓词的子查询 (续),使用ANY或ALL谓词时必须同时使用比较运算 语义为: ANY 大于子查询结果中的某个值 ALL 大于子查询结果中的所有值 = ANY 大于等于子查询结果中的某个值 = ALL 大于等于子查询结果中的所有值,带有ANY(SOME)或ALL谓词的子查询 (续),使用ANY或ALL谓词时必须同时使用比较运算 语义为(续) )ANY 不等于子查询结果中的某个值 !=(或)ALL 不等于子查询结果中的任何一个值,带有ANY(SOME)或ALL谓词的子查询 (续),例 3.58 查询非计算机科学系中比计算机科学系任意一个学生年龄小的学生姓名和年龄SELECT Sname,
18、SageFROM StudentWHERE Sage CS ; /*父查询块中的条件 */,带有ANY(SOME)或ALL谓词的子查询 (续),结果:执行过程:(1)首先处理子查询,找出CS系中所有学生的年龄,构成一个集合(20,19)(2)处理父查询,找所有不是CS系且年龄小于 20 或 19的学生,带有ANY(SOME)或ALL谓词的子查询 (续),用聚集函数实现例 3.58 SELECT Sname,SageFROM StudentWHERE Sage CS ;,带有ANY(SOME)或ALL谓词的子查询 (续),例 3.59 查询非计算机科学系中比计算机科学系所有学生年龄都小的学生姓名
19、及年龄。方法一:用ALL谓词SELECT Sname,SageFROM StudentWHERE Sage CS ;,带有ANY(SOME)或ALL谓词的子查询 (续),方法二:用聚集函数SELECT Sname,SageFROM StudentWHERE Sage CS ;,带有ANY(SOME)或ALL谓词的子查询 (续),表3.7 ANY(或SOME),ALL谓词与聚集函数、IN谓词的等价转换关系,3.4.3 嵌套查询,1.带有IN谓词的子查询 2.带有比较运算符的子查询3.带有ANY(SOME)或ALL谓词的子查询4.带有EXISTS谓词的子查询,带有EXISTS谓词的子查询,EXIS
20、TS谓词 存在量词 带有EXISTS谓词的子查询不返回任何数据,只产生逻辑真值“true”或逻辑假值“false”。 若内层查询结果非空,则外层的WHERE子句返回真值 若内层查询结果为空,则外层的WHERE子句返回假值 由EXISTS引出的子查询,其目标列表达式通常都用 * ,因为带EXISTS的子查询只返回真值或假值,给出列名无实际意义。,NOT EXISTS谓词 若内层查询结果非空,则外层的WHERE子句返回假值 若内层查询结果为空,则外层的WHERE子句返回真值,带有EXISTS谓词的子查询(续),带有EXISTS谓词的子查询(续),例 3.60查询所有选修了1号课程的学生姓名。思路分
21、析: 本查询涉及Student和SC关系 在Student中依次取每个元组的Sno值,用此值去检查SC表 若SC中存在这样的元组,其Sno值等于此Student.Sno值,并且其Cno= 1,则取此Student.Sname送入结果表SELECT SnameFROM StudentWHERE EXISTS(SELECT *FROM SCWHERE Sno=Student.Sno AND Cno= 1 );,带有EXISTS谓词的子查询(续),例 3.61 查询没有选修1号课程的学生姓名。SELECT SnameFROM StudentWHERE NOT EXISTS(SELECT *FROM
22、SCWHERE Sno = Student.Sno AND Cno=1);,带有EXISTS谓词的子查询(续),不同形式的查询间的替换 一些带EXISTS或NOT EXISTS谓词的子查询不能被其他形式的子查询等价替换 所有带IN谓词、比较运算符、ANY和ALL谓词的子查询都能用带EXISTS谓词的子查询等价替换用EXISTS/NOT EXISTS实现全称量词(难点) SQL语言中没有全称量词 (For all) 可以把带有全称量词的谓词转换为等价的带有存在量词的谓词:(x)P ( x( P),带有EXISTS谓词的子查询(续),例 3.55查询与“刘晨”在同一个系学习的学生。可以用带EXIS
23、TS谓词的子查询替换:SELECT Sno,Sname,SdeptFROM Student S1WHERE EXISTS(SELECT *FROM Student S2WHERE S2.Sdept = S1.Sdept ANDS2.Sname = 刘晨);,带有EXISTS谓词的子查询(续),例 3.62 查询选修了全部课程的学生姓名。SELECT SnameFROM StudentWHERE NOT EXISTS(SELECT *FROM CourseWHERE NOT EXISTS(SELECT *FROM SCWHERE Sno= Student.SnoAND Cno= Course.C
24、no); 参见爱课程网数据库系统概论数据查询节动画EXISTS子查询,带有EXISTS谓词的子查询(续),用EXISTS/NOT EXISTS实现逻辑蕴涵(难点)SQL语言中没有蕴涵(Implication)逻辑运算 可以利用谓词演算将逻辑蕴涵谓词等价转换为:p q pq,带有EXISTS谓词的子查询(续),例 3.63查询至少选修了学生201215122选修的全部课程的学生号码。解题思路: 用逻辑蕴涵表达:查询学号为x的学生,对所有的课程y,只要201215122学生选修了课程y,则x也选修了y。 形式化表示:用P表示谓词 “学生201215122选修了课程y”用q表示谓词 “学生x选修了课
25、程y”则上述查询为: (y) p q,带有EXISTS谓词的子查询(续),等价变换:(y)p q (y (p q ) (y ( p q) ) y(pq)变换后语义:不存在这样的课程y,学生201215122选修了y,而学生x没有选。,带有EXISTS谓词的子查询(续),用NOT EXISTS谓词表示: SELECT DISTINCT SnoFROM SC SCXWHERE NOT EXISTS(SELECT *FROM SC SCYWHERE SCY.Sno = 201215122 ANDNOT EXISTS(SELECT *FROM SC SCZWHERE SCZ.Sno=SCX.Sno A
26、NDSCZ.Cno=SCY.Cno);,3.4 数据查询,3.4.1 单表查询 3.4.2 连接查询 3.4.3 嵌套查询 3.4.4 集合查询 3.4.5基于派生表的查询 3.4.5 Select语句的一般形式,3.4.4 集合查询,集合操作的种类 并操作UNION 交操作INTERSECT 差操作EXCEPT 参加集合操作的各查询结果的列数必须相同;对应项的数据类型也必须相同,集合查询(续),例 3.64 查询计算机科学系的学生及年龄不大于19岁的学生。SELECT *FROM StudentWHERE Sdept= CSUNIONSELECT *FROM StudentWHERE Sag
27、e=19;UNION:将多个查询结果合并起来时,系统自动去掉重复元组 UNION ALL:将多个查询结果合并起来时,保留重复元组,集合查询(续),例 3.65 查询选修了课程1或者选修了课程2的学生。SELECT SnoFROM SCWHERE Cno= 1 UNIONSELECT SnoFROM SCWHERE Cno= 2 ;,集合查询(续),例3.66 查询计算机科学系的学生与年龄不大于19岁的学生 的交集。SELECT * FROM Student WHERE Sdept=CS INTERSECT SELECT * FROM Student WHERE Sage=19,集合查询(续),
28、例 3.66 实际上就是查询计算机科学系中年龄不大 于19岁的学生。SELECT *FROM StudentWHERE Sdept= CS AND Sage=19;,集合查询(续),例 3.67查询既选修了课程1又选修了课程2的学生。SELECT SnoFROM SCWHERE Cno= 1 INTERSECTSELECT SnoFROM SCWHERE Cno=2 ;,集合查询(续),例3.67也可以表示为:SELECT SnoFROM SCWHERE Cno= 1 AND Sno IN(SELECT SnoFROM SCWHERE Cno= 2 );,集合查询(续),例 3.68 查询计算
29、机科学系的学生与年龄不大于19岁的学生的差集。SELECT *FROM StudentWHERE Sdept=CSEXCEPTSELECT *FROM StudentWHERE Sage =19;,集合查询(续),例3.68实际上是查询计算机科学系中年龄大于19岁的学生SELECT *FROM StudentWHERE Sdept= CS AND Sage19;,3.4 数据查询,3.4.1 单表查询 3.4.2 连接查询 3.4.3 嵌套查询 3.4.4 集合查询 3.4.5基于派生表的查询 3.4.6 Select语句的一般形式,3.4.5 基于派生表的查询,子查询不仅可以出现在WHERE
30、子句中,还可以出现在FROM子句中,这时子查询生成的临时派生表(Derived Table)成为主查询的查询对象例3.57找出每个学生超过他自己选修课程平均成绩的课程号SELECT Sno, CnoFROM SC, (SELECTSno, Avg(Grade) FROM SCGROUP BY Sno)AS Avg_sc(avg_sno,avg_grade)WHERE SC.Sno = Avg_sc.avg_snoand SC.Grade =Avg_sc.avg_grade,基于派生表的查询(续),如果子查询中没有聚集函数,派生表可以不指定属性列,子查询SELECT子句后面的列名为其缺省属性。例
31、3.60查询所有选修了1号课程的学生姓名,可以用如下查询完成:SELECT SnameFROM Student, (SELECT Sno FROM SC WHERE Cno= 1 ) AS SC1WHERE Student.Sno=SC1.Sno;,3.4.1 单表查询 3.4.2 连接查询 3.4.3 嵌套查询 3.4.4 集合查询 3.4.5基于派生表的查询 3.4.6 SELECT语句的一般形式,3.4 数据查询,3.4.6 SELECT语句的一般格式,SELECT ALL|DISTINCT 别名 , 别名 FROM 别名 , 别名 |()ASWHERE GROUP BY HAVINGO
32、RDER BY ASC|DESC;,1. 目标列表达式的可选格式,目标列表达式格式 (1) * (2) .* (3) COUNT(DISTINCT|ALL* ) (4) .,.其中可以是由属性列、作用于属性列 的聚集函数和常量的任意算术运算(+,-,*,/)组成的 运算公式,2. 聚集函数的一般格式,COUNTSUMAVG (DISTINCT|ALL )MAXMIN,3. WHERE子句的条件表达式的可选格式,(1) ANY|ALL (SELECT语句)(2) NOT BETWEEN AND (SELECT语句) (SELECT语句),WHERE子句的条件表达式格式(续),(3) (, )NOT IN (SELECT语句)(4) NOT LIKE (5) IS NOT NULL(6) NOT EXISTS (SELECT语句),WHERE子句的条件表达式格式(续),(7)AND ANDOR OR,