02、分布式事务-分布式CAP原则篇

作者: rock_fish | 来源:发表于2022-06-15 16:05 被阅读0次

如何实现如下要求的分布式系统？

实际这些要求就是无法实现的，因为它违背了CAP原则。

CAP原则又被称作布鲁尔定理（Brewer's theorem），指的是在一个分布式系统中，最多只能同时满足一致性（Consistency）、可用性（Availability）和分区容错性（Partition tolerance）这三项中的两项，即不可能同时满足CAP三项特性，如下图所示。

image.png

比如上海的静态化管理阶段也是满足这个原理的

一致性是指，一旦客户端将值写入任何一台服务器并获得响应，那么之后任意客户端从任意服务器读取的都是刚刚新写入的数据。如下图所示：

image.png

一致性保证了：不管向哪台服务器写入数据，其他的服务器能实时同步这个新数据，之后不管从哪个服务器读取数据得到的都是最新的数据。如果同步有问题，那么首先解决同步的问题，挂起请求等待同步完成后才响应，那么可能是延迟很久才得到了正确结果，也可能是请求异常或者结果异常。如下图所示：

image.png

可用性是指，向任意未崩溃的服务器发送请求，总能保证收到响应数据（允许不是最新数据），如下图所示：

image.png

分区的概念是：在分布式系统中，不同的节点分布在不同的子网络中，由于一些特殊的原因，这些子节点之间出现了网络不通的状态，但他们的内部子网络是正常的。从而导致了整个系统的环境被切分成了若干个孤立的区域。这就是分区。

分布式系统在遇到任何网络分区故障的时候，仍然能够对外提供满足一致性或可用性的服务。比如两个服务器，给对方任何消息都可以失败；也就是说会因为各种意外情况，导致无法成功进行数据同步，分布式系统要能容忍这种情况。

image.png

传统的单机系统满足CA，而没有P。在分布式系统中，首先必须要满足P（分布式系统，因为是多节点的，一定要考虑part failure），所以C，A需要根据具体场景进行取舍。

通过一个示例来梳理，如整个系统由服务节点A、B组成，之间通过网络通信，当节点 A 进行更新数据操作的时候，需要同时更新节点 B 的数据（这个数据复制的过程是一个原子操作）。

image.png

上图这个系统怎么满足 CAP 呢？通过反证法来梳理：假设可以同时满足一致性、可用性、分区容错这三个特性，由于满足分区容错，可以切断 A、B两个服务节点间的通信

总结来看：

组合	结果
AC	单机应用满足一致性和可用性，没有分区容错
CP	满足一致性和分区容错性，也就是说，要放弃可用性。当系统被分区，为了保证原子性，必须放弃可用性，让服务停用。
AP	满足可用性和分区容错性，当出现分区，同时为了保证可用性，即使数据未同步，也必须让节点继续对外服务，这样必然导致失去数据的一致性