美文网首页
mysql数据mvcc版本控制原理

mysql数据mvcc版本控制原理

作者: 断忆残缘 | 来源:发表于2023-01-29 16:13 被阅读0次

    事务并发执行遇到的问题

    1. 脏读(未提交读)
    2. 不可重复读(已提交读)
    3. 幻读(读出新纪录)

    事务隔离级别

    隔离级别 脏读 不可重复读 幻读
    未提交读 可能 可能 可能
    已提交读 —— 可能 可能
    可重复读 —— —— ——
    可串行化 —— —— ——

    mysql在可重复读的级别下,极大的程度上避免了幻读。

    版本链

    对于InnoDB引擎来说,每个主键索引记录中包含了两个隐藏列

    隐藏列
    trx_id 记录当前正在操作此条记录的事务id
    roll_pointer 修改时,记录旧的版本到undo日志中, 当前列就是指向旧版本的指针,以便找到修改前的信息

    示例

    1. 创建一张表
    CREATE TABLE teacher ( number INT,
    name VARCHAR(100), domain varchar(100), PRIMARY KEY (number)
    ) Engine=InnoDB CHARSET=utf8;
    
    1. 新增一条记录,并且当前插入的事物id为60
    INSERT INTO teacher VALUES(1, 'Jack', '源码系列');
    

    此刻生成一条记录,如下图所示

    insert
    1. 之后有两个80、120事务更新
    trx_id(80) trx_id(120)
    BEGIN
    BEGIN
    UPDATE teacher SET name = 'Mark' WHERE number = 1;
    UPDATE teacher SET name = 'James' WHERE number = 1;
    COMMIT
    UPDATE teacher SET name = 'King' WHERE number = 1;
    UPDATE teacher SET name = '大飞' WHERE number = 1;
    COMMIT

    每次记录修改都有一条undo日志,每条undo日志都会一个roll_pointer属性。可以将这些undo日志串成链表,我们把这种链表称为版本链。

    msyql版本链

    对该记录每次更新后,都会将旧值放到一条 undo 日志中,就算是该记录的 一个旧版本,随着更新次数的增多,所有的版本都会被 roll_pointer 属性连接成 一个链表,我们把这个链表称之为版本链

    ReadView

    InnoDB 提出了一个 ReadView 的概念, 包含 4 个比较重要的内容:

    id 说明
    m_ids 生成 ReadView 时当前系统中活跃的读写事务的事务 id 列表
    min_trx_id 生成 ReadView 时当前系统中活跃的读写事务中最小的事务 id,也就是 m_ids 中的最小值。
    max_trx_id 生成 ReadView 时系统中应该分配给下一个事务的 id 值
    creator_trx_id 生成该 ReadView 的事务的事务 id

    访问某条记录时,使用ReadView,遍历版本链,通过下面规则判断某个节点数据是否可以访问。

    1. 如果被访问的 trx_id 属性值与 ReadView 中的 creator_trx_id 值相同, 意味着当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问。
    2. 如果被访问版本的 trx_id 属性值小于 ReadView 中的 min_trx_id 值,表明 生成该版本的事务在当前事务生成 ReadView 前已经提交,所以该版本可以被当 前事务访问。
    3. 如果被访问版本的 trx_id 属性值大于或等于 ReadView 中的 max_trx_id 值,表明生成该版本的事务在当前事务生成 ReadView 后才开启,所以该版本不 可以被当前事务访问。
    4. 如果被访问版本的 trx_id 属性值在 ReadView 的 min_trx_id 和 max_trx_id 之间(min_trx_id <= trx_id < max_trx_id),那就需要判断一下 trx_id 属性值是不是在 m_ids 列表中,如果在,说明创建 ReadView 时生成该版本的事务还是活跃的, 该版本不可以被访问;如果不在,说明创建 ReadView 时生成该版本的事务已经 被提交,该版本可以被访问。
    5. 如果某个版本的数据对当前事务不可见的话,那就顺着版本链找到下一 个版本的数据,继续按照上边的步骤判断可见性,依此类推,直到版本链中的最 后一个版本。如果最后一个版本也不可见的话,那么就意味着该条记录对该事务 完全不可见,查询结果就不包含该记录。

    在 MySQL 中,已提交读(RC)和可重复读(RR)隔离级别的的一个非 常大的区别就是它们生成 ReadView 的时机不同。

    1. 已提交读(RC)在每次读取数据前都生成一个 ReadView。
    2. 可重复读(RR)在第一次读取数据时生成一个 ReadView。

    mysql默认的事务隔离级别是可重复读(RC)

    mysql可重复读(RR)基本解决了幻读问题,那什么情况下会出现幻读问题呢。

    1. 假设有T1,T2,两个事务,T1先开启事务。
    2. T2插入一条记录,并提交事务
    3. T1查询T2插入的记录,很明显查询不到。
    4. 如果此刻T1更新了T2插入的那条记录
    5. 此刻T1再去查询那条记录,这时是可以查到的,这就是幻读

    这种情况在实际生产并不多。

    相关文章

      网友评论

          本文标题:mysql数据mvcc版本控制原理

          本文链接:https://www.haomeiwen.com/subject/dyjphdtx.html