1、6.3 数据库的并发控制,6.3.1 并发控制概述 1、事务 事务(Transaction):用户定义的一个数据库操作序列,这些操作要么全做,要么全不做,是一个不可分割的工作单位。 事务和程序是两个概念 在关系数据库中,一个事务可以是一条SQL语句,一组SQL语句或整个程序 一个应用程序通常包含多个事务事务是恢复和并发控制的基本单位,定义事务的两种方式 显式方式 事务的开始由用户显式控制或DBMS自动隐含 事务结束由用户显式控制隐式方式 当用户没有显式地定义事务时,由DBMS按缺省规定自动划分事务,显式定义事务 1. 事务开始 BEGIN TRANSACTION2. 事务结束(1) COMMI
2、T 事务正常结束 提交事务的所有操作(读更新) 使事务中所有对数据库的更新永久生效(保存在物理数据库中)。,BEGIN TRANSACTION SQL 语句1SQL 语句2 。 COMMIT,2. 事务结束(2) ROLLBACK 事务异常终止 回滚事务的所有操作 在事务运行的过程中发生了某种故障,事务不能继续执行 系统将事务中对数据库的所有已完成的更新操作全部撤消,滚回到事务开始时的状态,BEGIN TRANSACTIONSQL 语句1 SQL 语句2。 ROLLBACK,事务的ACID特性原子性(Atomicity)一致性(Consistency)隔离性(Isolation)持续性(Dur
3、ability ),1)原子性事务是数据库的逻辑工作单位事务中包括的诸操作要么都做,要么都不做,2)一致性 事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。 一致性状态:数据库中只包含成功事务提交的结果 不一致状态:数据库中包含失败事务的结果 数据库系统运行中发生故障,有些事务尚未完成就被迫中断,这些未完成事务对数据库所做的修改有一部分已写入物理数据库中,一致性与原子性是密切相关的。例:银行转帐:从帐号A中取出一万元,存入帐号B。 定义一个事务,该事务包括两个操作 第一个操作是从帐号A中减去一万元 第二个操作是向帐号B中加入一万元 这两个操作要么全做,要么全不做 全做或者全不
4、做,数据库都处于一致性状态。 如果只做一个操作则用户逻辑上就会发生错误,少了一万元,这时数据库就处于不一致性状态。,3)隔离性一个事务的执行不能被其他事务干扰一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。,T1的修改被T2覆盖了!,4)持续性持续性也称永久性(Permanence)一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何影响。,保证事务ACID特性是事务处理的重要任务。 破坏事务ACID特性的因素 多个事务并行运行时,不同事务的操作交叉执行 DBMS必须保证多个事务的交叉运行不影响这些事
5、务ACID特性,特别是原子性和隔离性 事务在运行过程中被强行停止 DBMS必须保证被强行终止的事务对数据库和其他事务没有任何影响 这些就是DBMS中恢复机制和并发控制机制的责任。,2、并发操作与数据的不一致性,什么是数据的不一致性?,例:飞机订票系统中的一个活动序列: 1)甲售票员读出某航班的机票余额A,设A=16 2)乙售票员读出同一航班的机票余额A,也为16 3)甲售票点卖出一张机票,修改机票余额AA-1,所以A=15,把A写回数据库 4)乙售票点也卖出一张机票,修改机票余额AA-1,所以A=15,把A写回数据库 结果:卖出两张机票,但数据库中机票余额只减少1。 这种情况称为数据库的不一致
6、性。,产生原因 由甲乙两个售票员并发操作引起 在并发操作情况下,对甲、乙两个事务的操作序列的调度是随机的 若按上面的调度序列执行,甲事务的修改就被丢失。因为第4步中乙事务修改A并写回后覆盖了甲事务的修改。,并发操作带来的数据不一致性丢失修改(lost update)不可重复读(non-repeatable read)读“脏”数据(dirty read),1)丢失修改 事务1与事务2从数据库中读入同一数据并修改 事务2的提交结果破坏了事务1提交的结果导致事务1的修改被丢失。,(a) 丢失修改,2)不可重复读 事务1读取数据 之后,事务2执行更新操作从而使事务1无法再现前一次读取结果。,(b) 不
7、可重复读,三类不可重复读 读-更新 事务1读取某一数据 事务2对其做了修改 当事务1再次读该数据时,得到与前一次不同的值。,读-删除 事务1按一定条件从数据库中读取某些数据记录 事务2删除了其中部分记录 当事务1再次按相同条件读取数据时,发现某些记录神密地消失了。,读-插入 事务1按一定条件从数据库中读取某些数据记录 事务2插入了一些记录 当事务1再次按相同条件读取数据时,发现多了一些记录。 后两种不可重复读有时也称为幻行现象,3)读“脏”数据 事务1修改某一数据,并将其写回磁盘 事务2读取同一数据 之后,事务1由于某种原因被撤消,这时事务1已修改过的数据恢复原值 事务2读到的数据就与数据库中
8、的数据不一致,是不正确的数据,又称为“脏”数据。,(c) 读“脏”数据,6.3.2 并发操作的调度,多事务的执行方式 (1)事务串行执行 每个时刻只有一个事务运行,其他事务必须等到这个事务结束以后方能运行 不能充分利用系统资源、发挥数据库共享资源的特点,(2)交叉并发方式(interleaved concurrency) 事务的并行执行是这些并行事务的并行操作轮流交叉运行 是单处理机系统中的并发方式,能够减少处理机的空闲时间,提高系统的效率,(3)同时并发方式(simultaneous concurrency) 多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多
9、个事务真正的并行运行 最理想的并发方式,但受制于硬件环境 更复杂的并发方式机制,事务并发执行带来的问题 可能会存取和存储不正确的数据,破坏事务的隔离性和数据库的一致性 DBMS必须提供并发控制机制 并发控制机制是衡量一个DBMS性能的重要标志之一,计算机系统对并行事务中并行操作的调度是的随机的,而不同的调度可能会产生不同的结果。,将所有事务串行起来的调度策略一定是正确的调度策略。 如果一个事务运行过程中没有其他事务在同时运行,也就是说它没有受到其他事务的干扰,那么就可以认为该事务的运行结果是正常的或者预想的以不同的顺序串行执行事务也有可能会产生不同的结果,但由于不会将数据库置于不一致状态,都可
10、以认为是正确的。,可串行化(Serializable)的调度 几个事务的并行执行是正确的,当且仅当其结果与按某一次序串行地执行它们时的结果相同。,可串行性是并行事务正确性的唯一准则例:现在有两个事务,分别包含下列操作: 事务1:读B;A=B+1;写回A; 事务2:读A;B=A+1;写回B; 假设A的初值为10,B的初值为2。,对这两个事务的不同调度策略 串行执行 串行调度策略1 串行调度策略2交错执行 不可串行化的调度 可串行化的调度,(a) 串行调度策略,正确的调度,读B2 A B1 写回A3,读A3 B A1 写回B4,T1,T2,(b) 串行调度策略,正确的调度,读B11 A B1 写回
11、A12,读A10 B A1 写回B11,T1,T2,(c) 不可串行化的调度由于其执行结果与(a)、(b)的结果都不同,所以是错误的调度。,读B2A B1 写回A3,读A10B A1 写回B11,T1,T2,(d) 可串行化的调度由于其执行结果与串行调度(a)的执行结果相同,所以是正确的调度。,读B2A B1 写回A3,等待等待等待读A3 B A1 写回B4,T1,T2,为保证并行操作的正确性,DBMS的并行控制机制必须提供一定的手段来保证调度是可串行化的。从理论上讲,在某一事务执行时禁止其他事务执行的调度策略一定是可串行化的调度,这也是最简单的调度策略,但这种方法实际上是不可行的,因为它使用
12、户不能充分共享数据库资源。,保证并发操作调度正确性的方法 封锁方法 两段锁(Two-Phase Locking,简称2PL)协议 时标方法 乐观方法,6.3.3 封锁,1、封锁及封锁的类型封锁 事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁。加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。封锁是实现并发控制的一个非常重要的技术,DBMS通常提供了多种类型的封锁。 一个事务对某个数据对象加锁后究竟拥有什么样的控制是由封锁的类型决定的。基本封锁类型 排它锁(eXclusive lock,简记为X锁) 共享锁(Share
13、lock,简记为S锁),排它锁 排它锁又称为写锁。 若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁。,共享锁 共享锁又称为读锁。 若事务T对数据对象A加上S锁,则其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁。,2、封锁粒度,X锁和S锁都是加在某一个数据对象上的。封锁的对象可以是逻辑单元,也可以是物理单元。 例:在关系数据库中,封锁对象 逻辑单元 属性值、属性值集合、元组、关系、索引项、整个索引、整个数据库等 物理单元 页(数据页或索引页)、块等,封锁对象可以很大也可以很小 例:对整个数据库加锁对某个属性值加锁封锁
14、的粒度(Granularity):封锁对象的大小。,封锁粒度与系统的并发度和并发控制的开销密切相关。封锁的粒度越大,系统中能够被封锁的对象就越少,并发度也就越小,但同时系统开销也越小。封锁的粒度越小,并发度越高,但系统开销也就越大。,选择封锁粒度时必须同时考虑封锁机构和并发度两个因素,对系统开销与并发度进行权衡,以求得最优的效果。 一般原则 需要处理大量元组的用户事务:以关系为封锁单元 需要处理多个关系的大量元组的用户事务:以数据库为封锁单位 只处理少量元组的用户事务:以元组为封锁单位,多粒度封锁协议 允许多粒度树中的每个结点被独立地加锁 对一个结点加锁意味着这个结点的所有后裔结点也被加以同样
15、类型的锁在多粒度封锁中一个数据对象可能以两种方式封锁 显式封锁 隐式封锁,显式封锁 直接加到数据对象上的封锁 隐式封锁 由于其上级结点加锁而使该数据对象加上了锁显式封锁和隐式封锁的效果是一样的,对某个数据对象加锁时系统检查的内容 该数据对象 有无显式封锁与之冲突 所有上级结点 检查本事务的显式封锁是否与该数据对象上的隐式封锁冲突:(由上级结点封锁造成的) 所有下级结点 看上面的显式封锁是否与本事务的隐式封锁(将加到下级结点的封锁)冲突。,意向锁 引进意向锁(intention lock)目的 提高对某个数据对象加锁时系统的检查效率对任一结点加基本锁,必须先对它的上层结点加意向锁,如果对一个结点
16、加意向锁,则说明该结点的下层结点正在被加锁。,例:对任一元组 r 加锁,先关系R加意向锁事务T要对关系R加X锁, 系统只要检查根结点数据库和关系R是否已加了不相容的锁, 不需要搜索和检查R中的每一个元组是否加了X锁,常用意向锁 意向共享锁(Intent Share Lock,简称IS锁) 意向排它锁(Intent Exclusive Lock,简称IX锁) 共享意向排它锁(Share Intent Exclusive Lock,简称SIX锁),IS锁 如果对一个数据对象加IS锁,表示它的后裔结点拟(意向)加S锁。例:要对某个元组加S锁,则要首先对关系和数据库加IS锁,IX锁 如果对一个数据对象
17、加IX锁,表示它的后裔结点拟(意向)加X锁。例:要对某个元组加X锁,则要首先对关系和数据库加IX锁。,SIX锁 如果对一个数据对象加SIX锁,表示对它加S锁,再加IX锁,即SIX = S + IX。例:对某个表加SIX锁,则表示该事务要读整个表(所以要对该表加S锁),同时会更新个别元组(所以要对该表加IX锁)。,锁的强度 锁的强度是指它对其他锁的排斥程度 一个事务在申请封锁时以强锁代替弱锁是安全的,反之则不然,具有意向锁的多粒度封锁方法 申请封锁时应该按自上而下的次序进行; 释放封锁时则应该按自下而上的次序进行例:事务T要对一个数据对象加锁,必须先对它的上层结点加意向锁,3、封锁协议,封锁协议
18、(Locking Protocol) 在运用X锁和S锁对数据对象加锁时,需要约定的一些规则。 何时申请X锁或S锁 持锁时间 何时释放对封锁方式规定不同的规则,就形成了各种不同的封锁协议,它们分别在不同的程度上为并发操作的正确调度提供一定的保证。,一、保证数据一致性的封锁协议二、保证并行调度可串行性的封锁协议两段锁协议,一、保证数据一致性的封锁协议三级封锁协议三级封锁协议 1级封锁协议 2级封锁协议 3级封锁协议,1级封锁协议 事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。 正常结束(COMMIT) 非正常结束(ROLLBACK),1级封锁协议可防止丢失修改,并保证事务T是可恢复的
19、。 在1级封锁协议中,如果仅仅是读数据不对其进行修改,是不需要加锁的,所以它不能保证可重复读和不读“脏”数据。,(a) 没有丢失修改,(a.1) 读“脏”数据,(a.2) 不可重复读,2级封锁协议 1级封锁协议加上事务T在读取数据R之前必须先对其加S锁,读完后即可释放S锁。2级封锁协议可以防止丢失修改和读“脏”数据。在2级封锁协议中,由于读完数据后即可释放S锁,所以它不能保证可重复读。,(c) 不读“脏”数据,(c.1) 不可重复读,3级封锁协议 1级封锁协议加上事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。3级封锁协议可防止丢失修改、读脏数据和不可重复读。,(b) 可重复读,三
20、级协议的主要区别 什么操作需要申请封锁 何时释放锁(即持锁时间),二、两段锁协议 可串行性是并行调度正确性的唯一准则,两段锁(2PL)协议就是为保证并行调度可串行性而提供的封锁协议。两段锁协议的内容 1. 在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁 2. 在释放一个封锁之后,事务不再获得任何其他封锁。,“两段”锁的含义事务分为两个阶段第一阶段 获得封锁(扩展阶段)第二阶段 释放封锁(收缩阶段),例: 事务1的封锁序列: Slock A . Slock B . Xlock C . Unlock B . Unlock A . Unlock C;事务2的封锁序列: Slock A
21、. Unlock A . Slock B . Xlock C . Unlock C . Unlock B;事务1遵守两段锁协议,而事务2不遵守两段协议。,并行执行的所有事务均遵守两段锁协议,则对这些事务的所有并行调度策略都是可串行化的。所有遵守两段锁协议的事务,其并行执行的结果一定是正确的。事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。即可串行化的调度中,不一定所有事务都必须符合两段锁协议。,T1 Slock B 读B=2 Y=B Xlock AA=Y+1 写回A=3 Unlock B Unlock A,T2Slock A等待等待等待等待等待 Slock A 读A=3 Y=A X
22、lock B B=Y+1 写回B=4 Unlock B Unlock A,T1 Slock B 读B=2 Y=B Unlock B Xlock AA=Y+1 写回A=3 Unlock A,T2Slock A 等待 等待 等待 等待 Slock A 读A=3 X=A Unlock A Xlock B B=X+1 写回B=4 Unlock B,(a) 遵守两段锁协议,(b) 不遵守两段锁协议,T1Slock B 读B=2 Y=B Unlock BXlock A A=Y+1 写回A=3 Unlock A,T2Slock A 读A=2 X=A Unlock AXlock B 等待 Xlock B B=
23、X+1 写回B=3 Unlock B,(c) 不遵守两段锁协议,两段锁协议与三级封锁协议 两类不同目的的协议 两段锁协议 保证并发调度的正确性 三级封锁协议 在不同程度上保证数据一致性 遵守第三级封锁协议必然遵守两段协议,4、死锁和活锁,封锁技术可以有效地解决并行操作的一致性问题,但也带来一些新的问题 死锁 活锁,一、 活锁 什么是活锁,如何避免活锁采用先来先服务的策略 当多个事务请求封锁同一数据对象时,封锁子系统按请求封锁的先后次序对这些事务排队 该数据对象上的锁一旦释放,首先批准申请队列中第一个事务获得锁。,二、 死锁 什么是死锁T1 T2,Xlock R1 . . . Xlock R2
24、等待 等待 等待 .,. . Xlock R2 . . Xlock R1 等待 等待 .,如何解决死锁解决死锁的两类方法 1. 死锁的预防 2. 死锁的诊断与解除,1. 死锁的预防 预防死锁为何能解决死锁产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又都请求对已为其他事务封锁的数据对象加锁,从而出现死等待。预防死锁的发生就是要破坏产生死锁的条件。,预防死锁的方法一次封锁法顺序封锁法,(1)一次封锁法 一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行。,一次封锁法存在的问题:降低并发度 一次就将以后要用到的全部数据加锁,势必扩大了封锁的范围,从而降低了系统
25、的并发度。难于事先精确确定封锁对象 数据库中数据是不断变化的,原来不要求封锁的数据,在执行过程中可能会变成封锁对象,所以很难事先精确地确定每个事务所要封锁的数据对象 解决方法 将事务在执行过程中可能要封锁的数据对象全部加锁,这就进一步降低了并发度。,两段锁协议与防止死锁的一次封锁法 一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行,因此一次封锁法遵守两段锁协议 两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因此遵守两段锁协议的事务可能发生死锁,T1 Slock B 读B=2Xlock A 等待 等待,T2Slock A 读A=2Xlock A 等待,图
26、遵守两段锁协议的事务发生死锁,(2)顺序封锁法 顺序封锁法是预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。顺序封锁法存在的问题维护成本高 数据库系统中可封锁的数据对象极其众多,并且随数据的插入、删除等操作而不断地变化,要维护这样极多而且变化的资源的封锁顺序非常困难,成本很高。,难于实现 事务的封锁请求可以随着事务的执行而动态地决定,很难事先确定每一个事务要封锁哪些对象,因此也就很难按规定的顺序去施加封锁。 例:规定数据对象的封锁顺序为A,B,C,D,E。事务T3起初要求封锁数据对象B,C,E,但当它封锁了B,C后,才发现还需要封锁A,这样就破坏了封锁顺序.,结论 在操作系统中广
27、为采用的预防死锁的策略并不很适合数据库的特点DBMS在解决死锁的问题上更普遍采用的是诊断并解除死锁的方法,2. 死锁的诊断与解除方法 由DBMS的并发控制子系统定期检测系统中是否存在死锁,一旦检测到死锁,就要设法解除。,检测死锁超时法 如果一个事务的等待时间超过了规定的时限,就认为发生了死锁。 优点 实现简单 缺点 有可能误判死锁 时限若设置得太长,死锁发生后不能及时发现,等待图法 用事务等待图动态反映所有事务的等待情况 事务等待图是一个有向图G=(T,U) T为结点的集合,每个结点表示正运行的事务 U为边的集合,每条边表示事务等待的情况 若T1等待T2,则T1,T2之间划一条有向边,从T1指
28、向T2 并发控制子系统周期性地(比如每隔1 min)检测事务等待图,如果发现图中存在回路,则表示系统中出现了死锁。,解除死锁 选择一个处理死锁代价最小的事务,将其撤消,释放此事务持有的所有的锁,使其它事务能继续运行下去。,小结,如果数据库只包含成功事务提交的结果,就说数据库处于一致性状态。保证数据一致性是对数据库的最基本的要求。事务是数据库的逻辑工作单位 DBMS保证系统中一切事务的原子性、一致性、隔离性和持续性,数据共享与数据一致性是一对矛盾 数据库的价值在很大程度上取决于它所能提供的数据共享度。 数据共享在很大程度上取决于系统允许对数据并发操作的程度。 数据并发程度又取决于数据库中的并发控
29、制机制 数据的一致性也取决于并发控制的程度。施加的并发控制愈多,数据的一致性往往愈好。,数据库的并发控制以事务为单位数据库的并发控制通常使用封锁机制 两类最常用的封锁不同级别的封锁协议提供不同的数据一致性保证,提供不同的数据共享度。 三级封锁协议,并发控制机制调度并发事务操作是否正确的判别准则是可串行性 并发操作的正确性则通常由两段锁协议来保证。 两段锁协议是可串行化调度的充分条件,但不是必要条件,对数据对象施加封锁,带来问题 活锁: 先来先服务 死锁: 预防方法 一次封锁法 顺序封锁法死锁的诊断与解除 超时法 等待图法,不同的数据库管理系统提供的封锁类型、封锁协议、达到的系统一致性级别不尽相同。但是其依据的基本原理和技术是共同的。,