Otter同步原理理解

作者: 不着方寸 | 来源:发表于2019-12-10 16:55 被阅读0次

Otter同步原理理解
Otter-入门篇1(阿里开源项目Otter介绍)
分布式数据库同步系统Otter
【源码】otter工程结构
MySql__为用户赋于主从同步的权限
otter单向同步MySQL数据
otter部署
基于阿里巴巴开源的分布式数据同步系统安装配置文档otter 环境
Difference Between Otter and Bea
2.Otter原理介绍

今年下半年开始，接手了部门内otter同步的运维事项。虽然阅读了github上的wiki文档，但是对otter的双向同步原理依然不熟悉。

昨天（2019.12.9）睡觉时，不知道为什么突然灵光一闪，开始理解了otter同步的一些过程。

现在在这里记录下来，作为备忘。

这里主要分两部分：双向同步、双A同步来讲。

这两个概念在otter的页面上是通过是否有配置主站点来区分的。

有配置主站点的话就是双A同步，否则是双向同步。

双A同步会有数据回环的问题，双向同步不会。

我在维护otter同步的过程中就有碰到过双向同步配置成双A同步，导致某张表更新频繁的时候，读取到了中间版本，这个后面会说明。

先记住结论：如果不是两地同时写，配置成双向同步就已经足够了。

双向同步

假设有这样一个双向同步A <---> B，两个pipline：piplineA负责将A的数据同步到B，piplineB负责将B的数据同步到A

为了便于说明，我们只假设只同步一张表version。version表只有两个字段：id，version，其中id是主键。并且表中只有一笔数据，id=1

A、B两地的version表，一开始只有一笔数据

这个时候，假设A将version更新为2，那么两地binlog的变化流程如下：

双向同步过程中，两地的binlog变化示意图

可以看到最后binlog再次恢复到平静，两地数据保持一致。

双A同步

双A同步如果也只是单纯是双向同步的流程的话，会出现数据不一致的情况，考虑下面的流程

双A同步如果不做额外的处理的话，会出现数据不一致的问题

到最后binlog稳定下来的时候，出现了数据不一致的问题

为此，otter引入主站点的概念，并规定备站点到主站点的数据，还需要再一次从主站点回放到备战点。

因此流程变为：

双A同步引入主站点的概念，消除了数据可能不一致的风险

最终我们看到，两地的数据又恢复了一致

双A同步的中间版本问题

关于双A同步备站点会回放的验证，可以开启mysql的sql记录：

SET GLOBAL general_log = 'ON';

来观察sql回放过程，这里只做简单说明。

A、B配置双A同步，A为备站点。同步表为back，初始数据如下：

双A同步中初始值

1. 在A地连续执行5次更新语句 update back set value=concat(value,'a')

2. 观察general_log，这5次的变更是否有回放到A地

A地的5次更新sql

B地回放到A地的这5次sql

注意到general_log中有5次回放（截图只截了4次，太长了），这5次回放是从B->A的。

也就是说，在双A同步中因为有备站点数据回放的关系，如果在回放还没完成的时候去查询备站点，那么就会查询到中间版本。

所以查询到中间版本是因为：

1. 查询的是备站点的数据

2. 主站点到备站点的网络可能比较慢，导致处理回放的过程比较长，容易读取到中间版本

以上。

网友评论

本文标题：Otter同步原理理解

本文链接：https://www.haomeiwen.com/subject/voqpuftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Otter同步原理理解

双向同步

双A同步

双A同步的中间版本问题

相关文章

Otter同步原理理解

Otter-入门篇1(阿里开源项目Otter介绍)

分布式数据库同步系统Otter

【源码】otter工程结构

MySql__为用户赋于主从同步的权限

otter单向同步MySQL数据

otter部署

基于阿里巴巴开源的分布式数据同步系统安装配置文档otter 环境

Difference Between Otter and Bea

2.Otter原理介绍

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读