查询处理
为何要查询优化
事务
DBMS 应该满足如下特性:
- 原子性(Atomicity)
事务中的所有操作要么被全部执行要么全部不被执行。也就是说,A 属性减去 100 单位和 B 属性增加 100 单位的操作要么都被执行,要么都不被执行,不会出现 A 属性减少了而 B 属性没有增加或 A 属性没有减少而 B 属性增加了的情况。如果出现了上述情况,数据库中的数据就无法代表原本应该代表的现实情况了,这个数据库中的数据就不再可信。
- 一致性(Consistency)
事务的执行不会影响数据库的一致性。反映到例子中就是事务的执行不能改变 A 属性和 B 属性的总和,因为在事务执行前后,要求该总和是不变的,这样一来事务中的语句全部被执行或全部不被执行时,系统都是满足一致性的。一致性和原子性是息息相关的。
- 隔离性(Isolation)
事务与事务之间在执行时是不会重叠的,数据库系统保证一个事务要么在另一个事务执行前执行,要么在另一个事务执行后执行。例如在上面的事务 T1 运行的同时,事务 T2 要将 A 属性中 50 个单位放入 B 属性中。如果事务 T2 关于 A 属性的操作与事务 T1 同步执行,关于 B 的操作在事务 T1 执行完成后执行。那么事务 T1 执行完成后,数据库中的 A 属性和 B 属性的总和会比执行前少 50 个单位,这样就违反了一致性。
- 持久性(Durability)
一旦事务执行完成,它对于数据库中数据项的更改将是永久的,即使之后数据库发生故障。一个事务执行完成后,数据库就从一个合法的一致性的状态变换到另一个合法的状态。这保证了事务语句的有效性,要不然你写了那么多语句对数据库没有造成任何影响,也是挺闹心的。
事实上,如果数据库系统满足了 ACID 原则,开发者或者用户就可以不考虑容错的问题,从而可以更加轻松地使用数据库,专心于单个事务的实现。
事务的状态
SQL的事务
UPDATE Takes SET Grade = 90 WHERE ID = 2017110004 AND CourseID = 'CS234';
并发控制与死锁
文件锁
事务的并发执行
在前面的章节中,我们有过这样一个场景,需要从 A 属性中取出 100个单位放入 B 属性中,其对应的事务为:
T1 :
lock‑X(A);
read(A);
A:=A‑100;
write(A);
unlock(A);
lock‑X(B);
read(B);
B:=B+100;
write(B);
unlock(B);
这时有另一个事务 T2 ,需要将 A 属性和 B 属性的值相加并显示出来,它可以表示为:
T2 :
lock‑S(A);
read(A);
unlock(A);
lock‑S(B);
read(B);
unlock(B);
display(A+B);
两个事务在并发时,可能是这样的:
T1 | T2 | concorrency-control manager |
---|---|---|
lock‑X(A) | grant‑X(A,T1 ) | |
read(A) | lock‑S(A) | |
A:=A‑100 | 等待 | |
write(A) | 等待 | |
unlock(A) | 等待 | |
等待 | grant‑S(A,T2 ) | |
read(A) | ||
unlock(A) | ||
lock‑S(B) | grant‑S(B,T2 ) | |
read(B) | ||
unlock(B) | ||
lock‑X(B) | grant‑X(B,T1 ) | |
read(B) | ||
B:=B+100 | ||
write(B) | ||
unlock(B) |
这种并发的情况,显然是不正确的,因为在事务T2 读取数据时,数据库系统是出于一个不合法的状态的,这就是我们之前说过的不可重复读问题。为了避免这种问题,我们一般将 unlock
操作放在事务的最后,例如:
T2 :
lock‑S(A);
read(A);
lock‑S(B);
read(B);
display(A+B);
unlock(B);
unlock(A);
活锁与死锁
死锁预防
死锁检测与恢复
死锁检测算法执行频率
死锁检测算法的执行频率受到两方面因素的影响:一是系统中死锁发生的频率;二是死锁是由多少的事务共同构成的。
如果一个系统中死锁发生的可能性很高,那么死锁检测算法的执行频率就要相应地提高。最坏的情况里,任何一个新增的文件锁请求,都要伴随着一次死锁检测算法的执行。
由于死锁牵扯到的资源在死锁被解开之前,都是不能被任何事务利用的,因此经常出现有多个事务组成的死锁的系统中,死锁检测算法的执行频率需要相应地提高。
死锁恢复
一个合格的数据库系统,应该具备以下功能:
- 存储并维护当前数据资源的分配情况、资源请求的顺序和影响、事务执行时对于数据的影响等,也就是说一切数据库中发生的事情,都要有记录,这样的记录也被称作日志;
- 拥有高效且准确的死锁检测算法,确定系统中是否存在死锁,哪些事务及这些事务中的哪些资源请求造成了死锁;
- 能够在检测出死锁后,根据日志判断需要回滚的事务及回滚的程度,将数据库系统恢复到正常的状态。
练习
那么,下面关于死锁检测和恢复的说法,正确的是:
练习
网友评论