1、数 据 库 基 础 并 发 控 制,汤 娜 中山大学计算机科学系 ,系统篇,数据库完整性 数据库恢复技术 并发控制 数据库安全性,并发控制,1 并发控制概述 2 封锁 3 封锁协议 4 活锁和死锁 5 并发调度的可串行性 6 两段锁协议 7 封锁的粒度 8 小结,并发控制概述,多事务执行方式 (1)事务串行执行 每个时刻只有一个事务运行,其他事务必须等到这个事务结束以后方能运行 不能充分利用系统资源,发挥数据库共享资源的特点,并发控制(续),(2)交叉并发方式(interleaved concurrency) 事务的并行执行是这些并行事务的并行操作轮流交叉运行 是单处理机系统中的并发方式,能够
2、减少处理机的空闲时间,提高系统的效率,并发控制(续),(3)同时并发方式(simultaneous concurrency) 多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行 最理想的并发方式,但受制于硬件环境 更复杂的并发方式机制,事务并发执行带来的问题,可能会存取和存储不正确的数据,破坏事务的隔离性和数据库的一致性 DBMS必须提供并发控制机制 并发控制机制是衡量一个DBMS性能的重要标志之一,1 并发控制概述,并发控制机制的任务 对并发操作进行正确调度 保证事务的隔离性 保证数据库的一致性,T1的修改被T2覆盖了!,数据不一致实例:飞
3、机订票系统,并发操作带来的数据不一致性,丢失修改(lost update) 不可重复读(non-repeatable read) 读“脏”数据(dirty read),1. 丢失修改,丢失修改是指事务1与事务2从数据库中读入同一数据并修改,事务2的提交结果破坏了事务1提交的结果,导致事务1的修改被丢失。,(a) 丢失修改,2. 不可重复读,不可重复读是指事务1读取数据后,事务2执行更新操作,使事务1无法再现前一次读取结果。,(b) 不可重复读,三类不可重复读,事务1读取某一数据后: 1。事务2对其做了修改,当事务1再次读该数据时,得到与前一次不同的值。 2. 事务2删除了其中部分记录,当事务1
4、再次读取数据时,发现某些记录神密地消失了。 3. 事务2插入了一些记录,当事务1再次按相同条件读取数据时,发现多了一些记录。 后两种不可重复读有时也称为幻影现象(phantom row),3. 读“脏”数据,事务1修改某一数据,并将其写回磁盘 事务2读取同一数据后 事务1由于某种原因被撤消,这时事务1已修改过 的数据恢复原值 事务2读到的数据就与数据库中的数据不一致, 是不正确的数据,又称为“脏”数据。,(c) 读“脏”数据,并发控制,1 并发控制概述 2 封锁 3 封锁协议 4 活锁和死锁 5 并发调度的可串行性 6 两段锁协议 7 封锁的粒度 8 小结,并发控制的两类方法,乐观并发控制 在
5、乐观并发控制中,用户读数据时不锁定数据。在执行更新时,系统进行检查,查看另一个用户读过数据后是否更改了数据。如果另一个用户更新了数据,将产生一个错误。一般情况下,接收错误信息的用户将回滚事务并重新开始。 该方法主要用在数据争夺少的环境内,以及偶尔回滚事务的成本超过读数据时锁定数据的成本的环境内,因此称该方法为乐观并发控制。,并发控制的两类方法,悲观并发控制 锁定系统阻止用户以影响其它用户的方式修改数据。如果用户执行的操作导致应用了某个锁,则直到这个锁的所有者释放该锁,其它用户才能执行与该锁冲突的操作。 该方法主要用在数据争夺激烈的环境中,以及出现并发冲突时用锁保护数据的成本比回滚事务的成本低的
6、环境中,因此称该方法为悲观并发控制。 一般默认的方法,2 封锁,一、什么是封锁 二、基本封锁类型 三、基本锁的相容矩阵,一、什么是封锁,封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁 加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。 封锁是实现并发控制的一个非常重要的技术,2 封锁,一、什么是封锁 二、基本封锁类型 三、基本锁的相容矩阵,二、基本封锁类型,DBMS通常提供了多种类型的封锁。一个事务对某个数据对象加锁后究竟拥有什么样的控制是由封锁的类型决定的。基本封锁类型 排它锁(eXclusive lock,
7、简记为X锁) 共享锁(Share lock,简记为S锁),排它锁,排它锁又称为写锁 若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁,共享锁,共享锁又称为读锁 若事务T对数据对象A加上S锁,则其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁,2 封锁,一、什么是封锁 二、基本封锁类型 三、基本锁的相容矩阵,三、锁的相容矩阵,并发控制,1 并发控制概述 2 封锁 3 封锁协议 4 活锁和死锁 5 并发调度的可串行性 6 两段锁协议 7 封锁的粒度 8 小结,3 封锁协议,在运用X锁和S锁对数据对象加锁时,需要约定一些规则
8、:封锁协议(Locking Protocol) 何时申请X锁或S锁 持锁时间、何时释放不同的封锁协议,在不同的程度上为并发操作的正确调度提供一定的保证 常用的封锁协议:三级封锁协议,1级封锁协议,事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放 正常结束(COMMIT) 非正常结束(ROLLBACK) 1级封锁协议可防止丢失修改 在1级封锁协议中,如果是读数据,不需要加锁的,所以它不能保证可重复读和不读“脏”数据。,1级封锁协议,没有丢失修改,1级封锁协议,读“脏”数据,1级封锁协议,不可重复读,2级封锁协议,1级封锁协议+事务T在读取数据R前必须先加S锁,读完后即可释放S锁 2级封
9、锁协议可以防止丢失修改和读“脏”数据。 在2级封锁协议中,由于读完数据后即可释放S锁,所以它不能保证可重复读。,2级封锁协议,不可重复读,3级封锁协议,1级封锁协议 + 事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放3级封锁协议可防止丢失修改、读脏数据和不可重复读。,3级封锁协议,可重复读,3级封锁协议,不读“脏”数据,4封锁协议小结,三级协议的主要区别 什么操作需要申请封锁 何时释放锁(即持锁时间),封锁协议小结(续),并发控制,1 并发控制概述 2 封锁 3 封锁协议 4 活锁和死锁 5 并发调度的可串行性 6 两段锁协议 7 封锁的粒度 8 小结,4 活锁和死锁,封锁技术可以
10、有效地解决并行操作的一致性问题,但也带来一些新的问题 死锁 活锁,4.1 活锁,如何避免活锁,采用先来先服务的策略: 当多个事务请求封锁同一数据对象时 按请求封锁的先后次序对这些事务排队 该数据对象上的锁一旦释放,首先批准申请队列中第一个事务获得锁。,4.2 死锁,T1 T2,Xlock R1 . . . Xlock R2 等待 等待 等待 .,. . Xlock R2 . . Xlock R1 等待 等待 .,解决死锁的方法,两类方法 1. 预防死锁 2. 死锁的诊断与解除,1. 死锁的预防,产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又都请求对已为其他事务封锁的数据对象加锁,
11、从而出现死等待。 预防死锁的发生就是要破坏产生死锁的条件,死锁的预防(续),预防死锁的方法一次封锁法顺序封锁法,(1)一次封锁法,要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行 一次封锁法存在的问题:降低并发度扩大封锁范围 将以后要用到的全部数据加锁,势必扩大了封锁的范围,从而降低了系统的并发度,一次封锁法(续),难于事先精确确定封锁对象 数据库中数据是不断变化的,原来不要求封锁的数据,在执行过程中可能会变成封锁对象,所以很难事先精确地确定每个事务所要封锁的数据对象 解决方法:将事务在执行过程中可能要封锁的数据对象全部加锁,这就进一步降低了并发度。,(2)顺序封锁法,顺序封
12、锁法是预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。 顺序封锁法存在的问题维护成本高 数据库系统中可封锁的数据对象极其众多,并且随数据的插入、删除等操作而不断地变化,要维护这样极多而且变化的资源的封锁顺序非常困难,成本很高,顺序封锁法(续),难于实现 事务的封锁请求可以随着事务的执行而动态地决定,很难事先确定每一个事务要封锁哪些对象,因此也就很难按规定的顺序去施加封锁。例:规定数据对象的封锁顺序为A,B,C,D,E。事务T3起初要求封锁数据对象B,C,E,但当它封锁了B,C后,才发现还需要封锁A,这样就破坏了封锁顺序.,死锁的预防(续),结论 在操作系统中广为采用的预防死锁的策
13、略并不很适合数据库的特点 DBMS在解决死锁的问题上更普遍采用的是诊断并解除死锁的方法,2. 死锁的诊断与解除,允许死锁发生 解除死锁 由DBMS的并发控制子系统定期检测系统中是否存在死锁 一旦检测到死锁,就要设法解除,检测死锁:超时法,如果一个事务的等待时间超过了规定的时限,就认为发生了死锁 优点:实现简单 缺点 有可能误判死锁 时限若设置得太长,死锁发生后不能及时发现,等待图法,用事务等待图动态反映所有事务的等待情况 事务等待图是一个有向图G=(T,U) T为结点的集合,每个结点表示正运行的事务 U为边的集合,每条边表示事务等待的情况 若T1等待T2,则T1,T2之间划一条有向边,从T1指
14、向T2 并发控制子系统周期性地(比如每隔1 min)检测事务等待图,如果发现图中存在回路,则表示系统中出现了死锁。,死锁的诊断与解除(续),解除死锁 选择一个处理死锁代价最小的事务,将其撤消,释放此事务持有的所有的锁,使其它事务能继续运行下去。,并发控制,1 并发控制概述 2 封锁 3 封锁协议 4 活锁和死锁 5 并发调度的可串行性 6 两段锁协议 7 封锁的粒度 8 小结,5 并发调度的可串行性,一、什么样的并发操作调度是正确的 二、如何保证并发操作的调度是正确的,5 并发调度的可串行性,一、什么样的并发操作调度是正确的 二、如何保证并发操作的调度是正确的,一、什么样的并发操作调度是正确的
15、,计算机系统对并行事务中并行操作的调度是的随机的,而不同的调度可能会产生不同的结果。将所有事务串行起来的调度策略一定是正确的调度策略。 如果一个事务运行过程中没有其他事务在同时运行,也就是说它没有受到其他事务的干扰,那么就可以认为该事务的运行结果是正常的或者预想的,什么样的并发操作调度是正确的(续),以不同的顺序串行执行事务也有可能会产生不同的结果,但由于不会将数据库置于不一致状态,所以都可以认为是正确的。几个事务的并行执行是正确的,当且仅当其结果与按某一次序串行地执行它们时的结果相同。这种并行调度策略称为可串行化(Serializable)的调度。,什么样的并发操作调度是正确的(续),可串行
16、性是并行事务正确性的唯一准则例:现在有两个事务,分别包含下列操作:事务1:读B;A=B+1;写回A;事务2:读A;B=A+1;写回B;假设A的初值为2,B的初值为2。,什么样的并发操作调度是正确的(续),对这两个事务的不同调度策略 串行执行 串行调度策略1 串行调度策略2 交错执行 不可串行化的调度 可串行化的调度,(a) 串行调度策略,正确的调度,Slock B Y=B=2 Unlock B Xlock A A=Y+1 写回A(=3) Unlock A,Slock A X=A=3 Unlock A Xlock B B=X+1 写回B(=4) Unlock B,T1,T2,(b) 串行调度策略
17、,正确的调度,Slock B Y=B=3 Unlock B Xlock A A=Y+1 写回A(=4) Unlock A,SlockA X=A=2 Unlock A Xlock B B=X+1 写回B(=3) Unlock B,T1,T2,(c) 不可串行化的调度,Slock B Y=B=2Unlock BXlock A A=Y+1 写回A(=3)Unlock A,Slock A X=A=2Unlock AXlock B B=X+1 写回B(=3)Unlock B,T1,T2,(c) 不可串行化的调度(续),由于其执行结果与(a)、(b)的结果都不同,所以是错误的调度。,(d) 可串行化的调度
18、,Slock B Y=B=2 Unlock B Xlock AA=Y+1 写回A(=3) Unlock A,Slock A等待等待等待 X=A=3 Unlock A Xlock B B=X+1 写回B(=4) Unlock B,T1,T2,(d) 可串行化的调度(续),由于其执行结果与串行调度(a)的执行结果相同,所以是正确的调度。,5 并发调度的可串行性,一、什么样的并发操作调度是正确的 二、如何保证并发操作的调度是正确的,二、如何保证并发操作的调度是正确的,为了保证并行操作的正确性,DBMS的并行控制机制必须提供一定的手段来保证调度是可串行化的。从理论上讲,在某一事务执行时禁止其他事务执行
19、的调度策略一定是可串行化的调度,这也是最简单的调度策略,但这种方法实际上是不可行的,因为它使用户不能充分共享数据库资源。,如何保证并发操作的调度是正确的(续),保证并发操作调度正确性的方法 封锁方法:两段锁(Two-Phase Locking,简称2PL)协议 时标方法 乐观方法,并发控制,1 并发控制概述 2 封锁 3 封锁协议 4 活锁和死锁 5 并发调度的可串行性 6 两段锁协议 7 封锁的粒度 8 小结,6 两段锁协议,两段锁协议的内容 1. 在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁 2. 在释放一个封锁之后,事务不再获得任何其他封锁。,两段锁协议(续),“两段”锁
20、的含义 事务分为两个阶段第一阶段是获得封锁,也称为扩展阶段;第二阶段是释放封锁,也称为收缩阶段。,两段锁协议(续),例: 事务1的封锁序列: Slock A . Slock B . Xlock C . Unlock B . Unlock A . Unlock C;事务2的封锁序列: Slock A . Unlock A . Slock B . Xlock C . Unlock C . Unlock B;事务1遵守两段锁协议,而事务2不遵守两段协议。,两段锁协议(续),并行执行的所有事务均遵守两段锁协议,则对这些事务的所有并行调度策略都是可串行化的。所有遵守两段锁协议的事务,其并行执行的结果一定
21、是正确的 事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件 可串行化的调度中,不一定所有事务都必须符合两段锁协议。,两段锁协议(续),T1 Slock B 读B=2 Y=B Xlock AA=Y+1 写回A=3 Unlock B Unlock A,T2Slock A等待等待等待等待等待 Slock A 读A=3 Y=A Xlock B B=Y+1 写回B=4 Unlock B Unlock A,T1 Slock B 读B=2 Y=B Unlock B Xlock AA=Y+1 写回A=3 Unlock A,T2Slock A 等待 等待 等待 等待 Slock A 读A=3 X=A
22、Unlock A Xlock B B=X+1 写回B=4 Unlock B,(a) 遵守两段锁协议,(b) 不遵守两段锁协议,T1Slock B 读B=2 Y=B Unlock BXlock A A=Y+1 写回A=3 Unlock A,T2Slock A 读A=2 X=A Unlock AXlock B 等待 Xlock B B=X+1 写回B=3 Unlock B,(c) 不遵守两段锁协议,两段锁协议(续),两段锁协议与防止死锁的一次封锁法 一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行,因此一次封锁法遵守两段锁协议 但是两段锁协议并不要求事务必须一次将所有要
23、使用的数据全部加锁,因此遵守两段锁协议的事务可能发生死锁,两段锁协议(续),图7 遵守两段锁协议的事务发生死锁,T1 Slock B 读B=2Xlock A 等待 等待,T2Slock A 读A=2Xlock A 等待,两段锁协议(续),两段锁协议与三级封锁协议 两类不同目的的协议 两段锁协议 保证并发调度的正确性 三级封锁协议 在不同程度上保证数据一致性 遵守第三级封锁协议必然遵守两段协议,并发控制,1 并发控制概述 2 封锁 3 封锁协议 4 活锁和死锁 5 并发调度的可串行性 6 两段锁协议 7 封锁的粒度 8 小结,7 封锁的粒度,7.1 封锁粒度 7.2 多粒度封锁 7.3 意向锁,
24、7.1 封锁粒度,一、什么是封锁粒度 二、选择封锁粒度的原则,一、什么是封锁粒度,X锁和S锁都是加在某一个数据对象上的 封锁的对象:逻辑单元,物理单元 例:在关系数据库中,封锁对象: 逻辑单元: 属性值、属性值集合、元组、关系、索引项、整个索引、整个数据库等 物理单元:页(数据页或索引页)、物理记录等,什么是封锁粒度(续),封锁对象可以很大也可以很小例: 对整个数据库加锁对某个属性值加锁封锁对象的大小称为封锁的粒度(Granularity)多粒度封锁(multiple granularity locking) 在一个系统中同时支持多种封锁粒度供不同的事务选择,7.1 封锁粒度,一、什么是封锁粒
25、度 二、选择封锁粒度的原则,二、选择封锁粒度的原则,封锁的粒度越 大,小, 系统被封锁的对象 少,多, 并发度 小,高, 系统开销 小,大, 选择封锁粒度: 考虑封锁机构和并发度两个因素 对系统开销与并发度进行权衡,选择封锁粒度的原则(续),需要处理多个关系的大量元组的用户事务:以数据库为封锁单位; 需要处理大量元组的用户事务:以关系为封锁单元; 只处理少量元组的用户事务:以元组为封锁单位,7 封锁的粒度,7.1 封锁粒度 7.2 多粒度封锁 7.3 意向锁,7.2 多粒度封锁,多粒度树 以树形结构来表示多级封锁粒度 根结点是整个数据库,表示最大的数据粒度 叶结点表示最小的数据粒度,多粒度封锁
26、(续),例:三级粒度树。根结点为数据库,数据库的子结点为关系,关系的子结点为元组。,多粒度封锁协议,允许多粒度树中的每个结点被独立地加锁 对一个结点加锁意味着这个结点的所有后裔结点也被加以同样类型的锁 在多粒度封锁中一个数据对象可能以两种方式封锁:显式封锁和隐式封锁,显式封锁和隐式封锁,显式封锁: 直接加到数据对象上的封锁 隐式封锁: 由于其上级结点加锁而使该数据对象加上了锁 显式封锁和隐式封锁的效果是一样的,对某个数据对象加锁时系统检查的内容,该数据对象 有无显式封锁与之冲突所有上级结点 检查本事务的显式封锁是否与该数据对象上的隐式封锁冲突:(由上级结点封锁造成的) 所有下级结点 看上面的显
27、式封锁是否与本事务的隐式封锁(将加到下级结点的封锁)冲突。,7 封锁的粒度,7.1 封锁粒度 7.2 多粒度封锁 7.3 意向锁,7.3 意向锁,引进意向锁(intention lock)目的 提高对某个数据对象加锁时系统的检查效率,什么是意向锁,对任一结点加基本锁,必须先对它的上层结点加意向锁 如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁,意向锁(续),例:对任一元组 r 加锁,先关系R加意向锁事务T要对关系R加X锁, 系统只要检查根结点数据库和关系R是否已加了不相容的锁, 不需要搜索和检查R中的每一个元组是否加了X锁,常用意向锁,意向共享锁(Intent Share Lock,
28、简称IS锁) 意向排它锁(Intent Exclusive Lock,简称IX锁) 共享意向排它锁(Share Intent Exclusive Lock,简称SIX锁),意向锁(续),IS锁 如果对一个数据对象加IS锁,表示它的后裔结点拟(意向)加S锁。例:要对某个元组加S锁,则要首先对关系和数据库加IS锁,意向锁(续),IX锁 如果对一个数据对象加IX锁,表示它的后裔结点拟(意向)加X锁。例:要对某个元组加X锁,则要首先对关系和数据库加IX锁。,意向锁(续),SIX锁 如果对一个数据对象加SIX锁,表示对它加S锁,再加IX锁,即SIX = S + IX。例:对某个表加SIX锁,则表示该事务
29、要读整个表(所以要对该表加S锁),同时会更新个别元组(所以要对该表加IX锁)。,意向锁(续),意向锁的相容矩阵 T1 T2 S X IS IX SIX - S Y N Y N N Y X N N N N N Y IS Y N Y Y Y Y IX N N Y Y N Y SIX N N Y N N Y - Y Y Y Y Y Y,意向锁(续),锁的强度 锁的强度是指它对其他锁的排斥程度 一个事务在申请封锁时以强锁代替弱锁是安全的,反之则不然,意向锁(续),具有意向锁的多粒度封锁方法 申请封锁时应该按自上而下的次序进行; 释放封锁时则应该按自下而上的次序进行例:事务T要对一个数据对象加锁,必须先
30、对它的上层结点加意向锁,事务必须运行于可重复读或更高的隔离级别以防止丢失更新。当两个事务检索相同的行,然后基于原检索的值对行进行更新时,会发生丢失更新。 如果两个事务使用一个 UPDATE 语句更新行,并且不基于以前检索的值进行更新,则在默认的提交读隔离级别不会发生丢失更新。,并发控制,1 并发控制概述 2 封锁 3 封锁协议 4 活锁和死锁 5 并发调度的可串行性 6 两段锁协议 7 封锁的粒度 8 小结,8 小结,数据共享与数据一致性是一对矛盾 数据库的价值在很大程度上取决于它所能提供的数据共享度。 数据共享在很大程度上取决于系统允许对数据并发操作的程度。 数据并发程度又取决于数据库中的并
31、发控制机制 另一方面,数据的一致性也取决于并发控制的程度。施加的并发控制愈多,数据的一致性往往愈好。,小结(续),数据库的并发控制以事务为单位数据库的并发控制通常使用封锁机制 两类最常用的封锁不同级别的封锁协议提供不同的数据一致性保证,提供不同的数据共享度。 三级封锁协议,小结(续),并发控制机制调度并发事务操作是否正确的判别准则是可串行性 并发操作的正确性则通常由两段锁协议来保证。 两段锁协议是可串行化调度的充分条件,但不是必要条件,小结(续),对数据对象施加封锁,带来问题 活锁: 先来先服务死锁: 预防方法 一次封锁法 顺序封锁法死锁的诊断与解除 超时法 等待图法,小结(续),不同的数据库管理系统提供的封锁类型、封锁协议、达到的系统一致性级别不尽相同。但是其依据的基本原理和技术是共同的。,