1、第9章 事务与并发控制,关于数据库保护9.1 事务9.2 并发控制,关于数据库保护,保护数据库工作是保护数据库内容正确、不受破坏和不被非法使用。主要包括4方面内容:完整性控制 静态完整性控制(4.4)动态完整性控制-触发器(12.3)并发控制 (第9章)安全性控制 (第14章)数据备份与恢复 (第15章),9.1 事务,事务(Transaction)是作为完整的工作单元执行的一系列操作。如果一个事务中的所有操作都成功,则事务成功,其对数据库的更改都会成为永久性的更改。如果事务中的任何一个操作失败,则整个事务失败,其中所完成的操作均被取消,所有对数据的更改均无效。即:一个事务内的所有语句被作为一
2、个整体,要么全部执行,要么全部不执行。一个事务可以是一组SQL语句、一条SQL语句或整个程序。通常情况下,一个应用程序包括多个事务。事务是数据库并发控制和恢复的基本单位。,事务概念(举例),例如:对于一个转帐活动:A帐户转帐给B帐户n元钱,这个活动包含两个动作:第一个动作:A帐户 n 第二个动作:B帐户 n假设第一个动作成功了,但第二个动作由于某种原因没有成功(比如突然停电等)。怎样保证在系统恢复之后,A帐户中的金额是减n前的值呢?这就需要用到事务的概念。当第二个动作没有成功时,系统自动将第一个动作也撤销掉,使第一个动作不做。这样当系统恢复正常时,A帐户和B帐户中的数值才是正确的。,9.1.2
3、 事务的特性(ACID特性),原子性(Atomicity) :指事务是数据库的逻辑工作单位,事务中的操作要么都做,要么都不做。 一致性(Consistency) :指事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。隔离性(Isolation) :指数据库中一个事务的执行不能被其它事务干扰。持久性(Durability) :也称为永久性指事务一旦提交,则其对数据库中数据的改变就是永久的。,举例:事务及其特征,问题:设银行数据库中有一转账事务T,从账号A转一笔款子($50)到账号B。相应的事务: T:read(A); A:=A50; write(A); read(B); B:=B
4、 + 50; write(B).,原子性(A,B同时被修改或同时保持原值)一致性(A+B的值不变)隔离性持久性,事务提交与撤销,事务中操作完成后,可以提交事务 (COMMIT),也可以撤销事务 (ROLLBACK)。,提交事务(COMMIT),如果事务成功,则提交。提交就是将事务中所有对数据库的更新写回到磁盘上的物理数据库中去,事务正常结束。 COMMIT语句保证事务的所有修改在数据库中都永久有效。,撤消事务(ROLLBACK),如果事务中出现错误,或者用户决定取消事务,可撤消(回滚)该事务。回滚是指在事务运行的过程中发生了某种故障,事务不能继续执行,系统将事务中对数据库的所有已完成的更新操作
5、全部撤销。即撤消在该事务中对数据库所做的更新操作,使数据库回滚到事务的起始点。ROLLBACK语句通过将数据返回到它在事务开始时所有的状态,来恢复在该事务中所做的所有修改。,9.1.3 事务处理模型,有两种类型事务:隐式事务,显式事务。隐式事务:隐式事务是每一条数据操作语句都自动地成为一个事务。显式事务:有显式的开始和结束标记的事务。 ISO事务处理模型 T-SQL事务处理模型,ISO事务处理模型,明尾暗头:事务的开头是隐含的,结束有明确标记。事务开始:程序的首条SQL语句或事务结束符后的第一条sql语句。事务结束在程序正常结束处或COMMIT语句处成功终止;在程序出错处或或ROLLBACK处
6、失败终止。事务提交方式自动提交:每条SQL语句为一个事务指定位置提交:在事务结束符或程序正常结束处提交,示例,UPDATE 支付表 SET 账户总额 账户总额 nWHERE 账户名 AUPDATE 支付表 SET 账户总额 账户总额 nWHERE 账户名 BCOMMIT,T-SQL事务处理模型,每个事务都有显式的开始和结束标记。事务的开始标记是:BEGIN TRANSACTION | TRAN事务的结束标记为:COMMIT TRANSACTIONTRANROLLBACK TRANSACTIONTRAN,示例,例如前边的转帐例子用Transact-SQL事务处理模型描述为:BEGIN TRANS
7、ACTION UPDATE 支付表 SET 账户总额 账户总额 nWHERE 账户名 AUPDATE 支付表 SET 账户总额 账户总额 nWHERE 账户名 BCOMMIT,SQL Server提供三种事务类型:自动提交事务:每一条单独的SQL语句都是一个事务。显式事务:每一个事务均以BEGIN TRANSACTION语句显式开始,以COMMIT或ROLLBACK语句显式结束。隐式事务:在前一个事务完成时新事务隐式启动,但每个事务仍以COMMIT或ROLLBACK语句显式结束。,SQL Server设置隐含事务方式的命令是: SET IMPLICIT_TRANSACTIONS ON取消隐含事
8、务方式的命令是: SET IMPLICIT_TRANSACTIONS OFF,事务应用举例1,对于单个的Transact-SQL语句,可以使用GO关键字指定一次事务的执行。 USE student GO SELECT * FROM S GO,事务应用举例2-银行转帐业务处理事务示意,USE 银行业务BEGIN TRANSACTION UPDATE 储蓄 SET 余额=余额-1000 WHERE 账号=123456789 UPDATE 储蓄 SET 余额=余额+1000 WHERE 账号= 987654321 IF ROWCOUNT=0 OR ERROR != 0 BEGIN ROLLBACK
9、TRANSACTION PRINT 发生错误,该操作被取消。 RETURN ENDCOMMIT TRANSACTION,全局变量ROWCOUNT返回查询结果记录集;ERROR返回当数据库操作失败时的错误代码。左侧代码表示,如果检索出的记录数为0,或者返回的错误代码不为0(出错),撤消事务,并提示用户,否则提交事务。,9.2 并发控制,9.2.1 并发控制概述 9.2.2 并发控制措施9.2.3 封锁协议 封锁粒度 SQL Server封锁机制9.2.4 活锁和死锁9.2.5 并发调度的可串行性9.2.6 两段锁协议,9.2.1 并发控制概述,数据库中的数据是一个共享的资源,因此会有很多用户同时
10、使用数据库中的数据,在多用户数据库系统中,允许多个用户同时使用的数据库系统,可能同时运行着多个事务,而事务的运行需要时间,并且事务中的操作是在一定的数据上进行的。当系统中同时有多个事务在运行时,特别是当这些事务是对同一段数据进行操作时,彼此之间就有可能产生相互干扰的情况。,并发控制概述,不同的多事务执行方式 事务串行执行每个时刻只有一个事务运行,其他事务必须等到这个事务结束以后方能运行不能充分利用系统资源,发挥数据库共享资源的特点,T1,T2,T3,事务的串行执行方式,并发控制概述,交叉并发方式在单处理机系统中,事务的并行执行是这些并行事务的并行操作轮流交叉运行单处理机系统中的并行事务并没有真
11、正地并行运行,但能够减少处理机的空闲时间,提高系统的效率,并发控制概述,事务的交叉并发执行方式,并发控制概述,同时并发方式多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行,并发控制概述,事务并发执行带来的问题会产生多个事务同时存取同一数据的情况 可能会存取和存储不正确的数据,破坏事务一致性和数据库的一致性,并发控制概述(续),并发操作带来数据的不一致性实例例1飞机订票系统中的一个活动序列 甲售票点(事务T1)读出某航班的机票余额A,设A=16; 乙售票点(事务T2)读出同一航班的机票余额A,也为16; 甲售票点卖出一张机票,修改余额AA-1
12、,所以A为15,把A写回数据库; 乙售票点也卖出一张机票,修改余额AA-1,所以A为15,把A写回数据库 结果明明卖出两张机票,数据库中机票余额只减少1,并发控制概述,并发控制概述,并发操作所带来的数据不一致情况大致可以概括:丢失修改读“脏”数据不可重复读,1.丢失数据修改,丢失数据的修改是指两个事务T1和T2读入同一数据并进行修改,T2提交的结果破坏T1了提交的结果,导致T1的修改被T2覆盖掉了。,丢失数据修改,这种情况称为数据库的不一致性,是由并发操作引起的。在并发操作情况下,对T1、T2两个事务的操作序列的调度是随机的。若按上面的调度序列执行, T1事务的修改就被丢失。原因:第4步中T2
13、事务修改A并写回后覆盖了T1事务的修改,丢失数据修改,2. 读“脏”数据,读“脏”数据是指:事务T1修改某一数据,并将其写回磁盘事务T2读取同一数据后,T1由于某种原因被撤销这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致T2读到的数据就为“脏”数据,即不正确的数据,读“脏”数据,读“脏”数据,T1将B值修改为200,T2读到B为200T1由于某种原因撤销,其修改作废,B恢复原值100这时T2读到的B为200,与数据库内容不一致,就是“脏”数据。,3. 不可重复读,不可重复读是指事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次读取结果。,不可重复读,不可重复
14、读包括三种情况:(1)事务T1读取某一数据后,事务T2对其做了修改,当事务T1再次读该数据时,得到与前一次不同的值,不可重复读,不可重复读,T1读取B=100进行运算T2读取同一数据B,对其进行修改后将B=200写回数据库。T1为了对读取值校对重读B,B已为200,与第一次读取值不一致,不可重复读,(2)事务T1按一定条件从数据库中读取了某些数据记录后,事务T2删除了其中部分记录,当T1再次按相同条件读取数据时,发现某些记录消失了 (3)事务T1按一定条件从数据库中读取某些数据记录后,事务T2插入了一些记录,当T1再次按相同条件读取数据时,发现多了一些记录。后两种不可重复读有时也称为幻影现象(
15、教材中称为“幽灵”数据。,并发控制概述,数据不一致性:由于并发操作破坏了事务的隔离性并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性,9.2.2 并发控制措施,商用的DBMS一般都采用封锁方法封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。,并发控制措施,一个事务对某个数据对象加锁后究竟拥有什么样的控制由封锁的类型决定。基本封锁类型排它锁(Exclusive Locks,简记为X锁)共享锁(Share Lo
16、cks,简记为S锁),并发控制措施,排它锁又称为写锁若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁保证其他事务在T释放A上的锁之前不能再读取和修改A,并发控制措施,共享锁又称为读锁若事务T对数据对象A加上S锁,则其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁保证其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改,锁的相容矩阵,在锁的相容矩阵中:最左边一列表示事务T1已经获得的数据对象上的锁的类型。最上面一行表示另一事务T2对同一数据对象发出的封锁请求。T2的封锁请求能否被满足用矩阵中的Y和N表示Y表示事务
17、T2的封锁要求与T1已持有的锁相容,封锁请求可以满足N表示T2的封锁请求与T1已持有的锁冲突,T2的请求被拒绝,9.2.3 封锁协议,在运用X锁和S锁对数据对象进行加锁时,还需要约定一些规则,如何时申请X锁或S锁、持锁时间、何时释放锁等。称这些规则为封锁协议或加锁协议(Locking Protocel)。对封锁方式规定不同的规则,就形成了各种不同级别的封锁协议。不同级别的封锁协议达到的系统一致性级别不同。,1. 一级封锁协议,对事务要修改的数据加X锁,直到事务结束(包括正常结束和非正常结束)时才释放。一级封锁协议可以防止丢失修改,并保证事务是可恢复的 但不能保证可重复读和不读“脏”数据。,一级
18、封锁协议示例,使用封锁机制解决丢失修改问题,没有丢失修改事务T1在读A进行修改之前先对A加X锁当T2再请求对A加X锁时被拒绝T2只能等待T1释放A上的锁后T2获得对A的X锁这时T2读到的A已经是T1更新过的值15T2按此新的A值进行运算,并将结果值A=11送回到磁盘。避免了丢失T1的更新15。,2. 二级封锁协议,在满足一级封锁协议的情况下,事务对要读取的数据加S锁,读完后即释放S锁。除了可以防止丢失修改外,还可以防止读“脏”数据。但不能保证可重复读数据。,二级封锁协议示例,使用封锁机制解决读“脏”数据问题,不读“脏”数据 事务T1在对C进行修改之前,先对C加X锁,修改其值后写回磁盘T2请求在
19、C上加S锁,因T1已在C上加了X锁,T2只能等待T1因某种原因被撤销,C恢复为原值50T1释放C上的X锁后T2获得C上的S锁,读C=50。避免了T2读“脏”数据100,3. 三级封锁协议,在满足一级封锁协议的情况下,事务对要读取的数据加S锁,并直到事务结束才释放。除了可以防止丢失修改和不读“脏”数据之外,还进一步防止了不可重复读。,三级封锁协议示例,使用封锁机制解决不可重复读问题,可重复读事务T1在读A,B之前,先对A,B加S锁其他事务只能再对A,B加S锁,而不能加X锁,即其他事务只能读A,B,而不能修改当T2为修改B而申请对B的X锁时被拒绝只能等待T1释放B上的锁T1为验算再读A,B,这时读
20、出的B仍是100,求和结果仍为150,即可重复读T1结束才释放A,B上的S锁。T2才获得对B的X锁,不同级别的封锁协议总结,封锁粒度(了解),封锁对象的大小称为封锁粒度(Granularity) 封锁的对象:逻辑单元,物理单元 例:在关系数据库中,封锁对象:逻辑单元: 属性值、属性值集合、元组、关系、索引项、整个索引、整个数据库等物理单元:页(数据页或索引页)、物理记录等,选择封锁粒度原则,封锁粒度与系统的并发度和并发控制的开销密切相关。封锁的粒度越大,数据库所能够封锁的数据单元就越少,并发度就越小,系统开销也越小;封锁的粒度越小,并发度较高,但系统开销也就越大,选择封锁粒度的原则,例若封锁粒
21、度是数据页,事务T1需要修改元组L1,则T1必须对包含L1的整个数据页A加锁。如果T1对A加锁后事务T2要修改A中元组L2,则T2被迫等待,直到T1释放A。如果封锁粒度是元组,则T1和T2可以同时对L1和L2加锁,不需要互相等待,提高了系统的并行度。又如,事务T需要读取整个表,若封锁粒度是元组,T必须对表中的每一个元组加锁,开销极大,选择封锁粒度的原则,多粒度封锁 在一个系统中同时支持多种封锁粒度供不同的事务选择选择封锁粒度 同时考虑封锁开销和并发度两个因素,适当选择封锁粒度需要处理多个关系的大量元组的用户事务:以数据库为封锁单位需要处理大量元组的用户事务:以关系为封锁单元只处理少量元组的用户
22、事务:以元组为封锁单位,SQL Server中与封锁有关的命令,SQL Server使用动态锁定策略确定最经济的锁,自动调整锁定,应用程序开发人员可以不作选择。如果需要,也可在应用程序中自定义锁来设计更有效的应用程序。SQL Server的封锁操作是在相关语句的“WITH ()”子句中完成的,该短语可以在SELECT、INSERT、UPDATE和DELETE等语句中指定表级锁定的方式和范围。,SQL Server中与封锁有关的命令,常用的封锁关键词有:TABLOCK:对表施行共享封锁,在读完数据后立刻释放封锁,此类封锁可以避免读“脏”数据,但不具有可重复读的特性。 HOLDLOCK:与TABL
23、OCK一起使用,可将共享锁保留到事务完成,而不是在读完数据后立即释放锁,这样可以保证数据的可重复独特性。 NOLOCK:不进行封锁,此关键词仅应用于SELECT语句,这样可能会读取未提交事务的数据,即有可能发生“脏”读。 TABLOCKX:对表实施独占封锁。 UPDLOCK:对表中的指定元组实施更新封锁;这时其他事务可以对同一表中的其他元组也实施更新封锁,但是不允许对表实施共享封锁和独占封锁。,SQL Server中与封锁有关的命令,DECLARE d datetime, t char(6), s char(2), n char(10)BEGIN TRANSACTIONSELECT n=座位号
24、 FROM R WITH (UPDLOCK)WHERE 日期 = d AND 车次 = t AND 座别 = s AND 状态 IS NULLIF UPDATE R SET 状态 = Y WHERE 座位号 = n AND 日期 = d AND 车次 = t AND 座别 = sCOMMIT TRANSACTIONELSEROLLBACK TRANSACTION,9.2.4 活锁和死锁,封锁技术可以有效地解决并行操作的一致性问题,但也带来一些新的问题活锁死锁,1.活锁,事务T1封锁了数据R事务T2又请求封锁R,于是T2等待。T3也请求封锁R,当T1释放了R上的封锁之后系统首先批准了T3的请求,
25、T2仍然等待。T4又请求封锁R,当T3释放了R上的封锁之后系统又批准了T4的请求T2有可能永远等待,这就是活锁的情形,活锁(续),活锁(续),避免活锁:采用先来先服务的策略当多个事务请求封锁同一数据对象时按请求封锁的先后次序对这些事务排队该数据对象上的锁一旦释放,首先批准申请队列中第一个事务获得锁,2.死锁,事务T1封锁了数据R1T2封锁了数据R2T1又请求封锁R2,因T2已封锁了R2,于是T1等待T2释放R2上的锁接着T2又申请封锁R1,因T1已封锁了R1,T2也只能等待T1释放R1上的锁这样T1在等待T2,而T2又在等待T1,T1和T2两个事务永远不能结束,形成死锁,死锁(续),死 锁,解
26、决死锁的方法,两类方法预防死锁死锁的诊断与解除,3.预防死锁,产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又都请求对已为其他事务封锁的数据对象加锁,从而出现死等待。预防死锁的发生就是要破坏产生死锁的条件,死锁的预防(续),预防死锁的方法 一次封锁法 顺序封锁法,一次封锁法,要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行存在的问题降低系统并发度难于事先精确确定封锁对象,顺序封锁法,顺序封锁法是预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。顺序封锁法存在的问题维护成本 数据库系统中封锁的数据对象极多,并且在不断地变化。难以实现:很难事先确定每一个事
27、务要封锁哪些对象,死锁的预防(续),结论在操作系统中广为采用的预防死锁的策略并不很适合数据库的特点DBMS在解决死锁的问题上更普遍采用的是诊断并解除死锁的方法,4. 死锁的诊断与解除,死锁的诊断超时法事务等待图法,(1) 超时法,如果一个事务的等待时间超过了规定的时限,就认为发生了死锁优点:实现简单缺点有可能误判死锁时限若设置得太长,死锁发生后不能及时发现,(2)等待图法,用事务等待图动态反映所有事务的等待情况事务等待图是一个有向图G=(T,U)T为结点的集合,每个结点表示正运行的事务U为边的集合,每条边表示事务等待的情况若T1等待T2,则T1,T2之间划一条有向边,从T1指向T2,等待图法(
28、续),事务等待图,图(a)中,事务T1等待T2,T2等待T1,产生了死锁图(b)中,事务T1等待T2,T2等待T3,T3等待T4,T4又等待T1,产生了死锁 图(b)中,事务T3可能还等待T2,在大回路中又有小的回路,等待图法(续),并发控制子系统周期性地(比如每隔数秒)生成事务等待图,检测事务。如果发现图中存在回路,则表示系统中出现了死锁。,死锁的诊断与解除(续),解除死锁选择一个处理死锁代价最小的事务,将其撤消释放此事务持有的所有的锁,使其它事务能继续运行下去,9.2.5 并发调度的可串行性,DBMS对并发事务不同的调度可能会产生不同的结果什么样的调度是正确的?,9.2.5 并发调度的可串
29、行性,可串行化调度多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行这些事务时的结果相同事务的可串行性是并发事务正确调度的准则一个给定的并发调度,当且仅当它是可串行化的,才认为是正确调度。,可串行化调度,例现在有两个事务,分别包含下列操作:事务T1:读B;A=B+1;写回A事务T2:读A;B=A+1;写回B现给出对这两个事务不同的调度策略 记号R(x):读数据xW(x):写数据x,串行化调度,正确的调度,假设A、B的初值均为2。按T1T2次序执行结果为A=3,B=4 串行调度策略,正确的调度,串行调度(a),串行化调度,正确的调度,串行调度(b),假设A、B的初值均为2。T2T1
30、次序执行结果为B=3,A=4 串行调度策略,正确的调度,不可串行化调度,错误的调度,不可串行化的调度,执行结果与(a)、(b)的结果都不同是错误的调度,可串行化调度,正确的调度,可串行化的调度,执行结果与串行调度(a)的执行结果相同是正确的调度,9.2.6 两段锁协议,两段锁协议是实现可串行化调度的充分条件。可以将每个事务分成两个时期:申请封锁期和释放封锁期,申请期申请要进行的封锁,释放期释放所占有的封锁。在申请期不允许释放任何锁,在释放期不允许申请任何锁,这就是两段式封锁。,两段锁协议,例事务Ti遵守两段锁协议,其封锁序列是 :Slock A Slock B Xlock C Unlock B
31、 Unlock A Unlock C;| 扩展阶段 | | 收缩阶段 |事务Tj不遵守两段锁协议,其封锁序列是: Slock A Unlock A Slock B Xlock C Unlock C Unlock B;,两段锁协议,遵守两段锁协议的可串行化调度,左图的调度是遵守两段锁协议的,因此一定是一个可串行化调度。,两段锁协议,事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。若并发事务都遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的若并发事务的一个调度是可串行化的,不一定所有事务都符合两段锁协议,两段锁协议,两段锁协议与防止死锁的一次封锁法一次封锁法要求每个事务必须
32、一次将所有要使用的数据全部加锁,否则就不能继续执行,因此一次封锁法遵守两段锁协议但是两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因此遵守两段锁协议的事务可能发生死锁,两段锁协议,例 遵守两段锁协议的事务发生死锁,T1Slock BR(B)=2Xlock A等待等待,T2Slock AR(A)=2Xlock A等待,遵守两段锁协议的事务可能发生死锁,小结,数据共享与数据一致性是一对矛盾数据库的价值在很大程度上取决于它所能提供的数据共享度数据共享在很大程度上取决于系统允许对数据并发操作的程度数据并发程度又取决于数据库中的并发控制机制数据的一致性也取决于并发控制的程度。施加的并发控制愈多,数据的一致性往往愈好,本章小结,数据库保护的4个方面;理解并发控制的原因;并发操作带来数据不一致的问题:丢失修改、读脏数据、不可重复读;解决并发操作问题的办法:加锁(排它锁与共享锁)解决三种并发操作问题的三个级别的封锁协议;了解封锁粒度的概念;了解SQL Server中与封锁机制;封锁可能产生的问题(死琐与活锁)及解决方法;理解正确的并发事务调度必须是可串行化调度;两段锁协议是实现并发事务调度可串行化的充分条件。,