1 如何进行分布式事务控制?
CAP理论是分布式事务处理的理论基础,了解了CAP理论有助于我们研究分布式事务的处理方案。
CAP理论是:分布式系统在设计时只能在一致性(Consistency)、可用性(Availability)、分区容忍性(Partition Tolerance)中满足两种,无法兼顾三种。
![](https://img.haomeiwen.com/i150505/87c03aae547cc5c4.png)
以上图来理解CAP理论:
一致性(Consistency):服务器A、B、C三个结点都存储了用户数据,三个结点的数据需要保持同一时刻数据一致性。
可用性(Availability):服务A、B、C三个结点,其中一个结点宕机不影响整个集群对外提供服务,如果只有服务A结点,当服务A宕机整个系统将无法提供服务,增加服务B、C是为了保证系统的可用性。
分区容忍性(Partition Tolerance):分区容忍性就是允许系统通过网络协同工作,分区容忍性要解决由于网络分区导致数据的不完整及无法访问等问题。分布式系统不可避免的出现了多个系统通过网络协同工作的场景,结点之间难免会出现网络中断、网延延迟等现象,这种现象一旦出现就导致数据被分散在不同的结点上,这就是网络分区。
1.1 什么是幂等性
幂等性是指同一个操作无论请求多少次,其结果都相同。幂等操作实现方式有:
(1)操作之前在业务方法进行判断如果执行过了就不再执行。
(2)缓存所有请求和处理的结果,已经处理的请求则直接返回结果。
(3)在数据库表中加一个状态字段(未处理,已处理),数据操作时判断未处理时再处理。
2 分布式系统能否兼顾C、A、P?
在保证分区容忍性的前提下,一致性和可用性无法兼顾。如果要提高系统的可用性就要增加多个结点,如果要保证数据的一致性就要实现每个结点的数据一致。这样结点越多可用性越好,但是数据一致性却越差。所以在进行分布式系统设计时,同时满足“一致性”、“可用性”和“分区容忍性”三者是几乎不可能的。
3 CAP有哪些组合方式?
(1)CA:放弃分区容忍性,加强一致性和可用性,关系数据库按照CA进行设计。
(2)AP:放弃一致性,加强可用性和分区容忍性,追求最终一致性,很多NoSQL数据库按照AP进行设计。(说明:这里放弃一致性是指放弃强一致性,强一致性就是写入成功立刻要查询出最新数据。追求最终一致性是指允许暂时的数据不一致,只要最终在用户接受的时间内数据一致即可。)
(3)CP:放弃可用性,加强一致性和分区容忍性,一些强一致性要求的系统按CP进行设计,比如跨行转账,一次转账请求要等待双方银行系统都完成整个事务才算完成。(说明:由于网络问题的存在CP系统可能会出现待等待超时,如果没有处理超时问题则整理系统会出现阻塞。)
总结: 在分布式系统设计中AP的应用较多,即保证分区容忍性和可用性,牺牲数据的强一致性(写操作后立刻读取到最新数据),保证数据最终一致性。比如:订单退款,今日退款成功,明日账户到账,只要在预定的用户可以接受的时间内退款事务走完即可。
4 分布式事务的解决方案
4.1 两阶段提交协议(2PC)
为解决分布式系统的数据一致性问题出现了两阶段提交协议(2 Phase Commitment Protocol),两阶段提交由协调者和参与者组成,共经过两个阶段和三个操作,部分关系数据库如Oracle、MySQL支持两阶段提交协议。
![](https://img.haomeiwen.com/i150505/b8a5089bce294492.png)
(1)第一阶段:准备阶段(prepare):协调者通知参与者准备提交订单,参与者开始投票,参与者完成准备工作向协调者回应Yes。
(2)第二阶段:提交(commit)/回滚(rollback)阶段:协调者根据参与者的投票结果发起最终的提交指令,如果有参与者没有准备好则发起回滚指令。
2PC的优点:实现强一致性,部分关系数据库支持(Oracle、MySQL等)。
2PC的缺点:整个事务的执行需要由协调者在多个节点之间去协调,增加了事务的执行时间,性能低下。
4.2 消息队列实现最终一致
本方案是将分布式事务拆分成多个本地事务来完成,并且由消息队列异步协调完成。如下图,下面以下单减少库存为例来说明:
![](https://img.haomeiwen.com/i150505/d8b6cea834fac4bc.png)
(1)订单服务和库存服务完成检查和预留资源。
(2)订单服务在本地事务中完成添加订单表记录和添加“减少库存任务消息”。
(3)由定时任务根据消息表的记录发送给MQ通知库存服务执行减库存操作。
(4)库存服务执行减少库存,并且记录执行消息状态(为避免重复执行消息,在执行减库存之前查询是否执行过此消息)。
(5)库存服务向MQ发送完成减少库存的消息。
(6)订单服务接收到完成库存减少的消息后删除原来添加的“减少库存任务消息”。
另外,在介绍一个业务场景,那就是网上付费下单网课。当买了视频后,需要在订单服务更新自己的学习列表中要订单的支付状态,此外,要在学习服务中添加选课的信息。解决方案如下:
![](https://img.haomeiwen.com/i150505/4cd81baa9449120f.png)
下面详细介绍下,这个解决方案:
(1)支付成功后,订单服务向本地数据库更新订单状态并向消息表写入“添加选课消息”,通过本地数据库保证订单状态和添加选课消息的事务。。
(2)定时任务扫描消息表,取出“添加选课任务“并发向MQ。
(3)学习服务接收到添加选课的消息,先查询本地数据库的历史消息表是否存在消息,存在则说明已经添加选课,否则向本地数据库添加选课,并向历史消息表添加选课消息。这里选课表和历史消息表在同一个数据库,通过本地事务保证。
(4)学习服务接收到添加选课的消息,通过查询消息表判断如果已经添加选课也向MQ发送“完成添加选课任务的消息”,否则则添加选课,完成后向MQ发送“完成添加选课任务的消息”。
(5)订单服务接收到完成选课的消息后删除订单数据库中消息表的“添加选课消息”,为保证后期对账将消息表的消息先添加到历史消息表再删除消息,表示此消息已经完成。
实现最终事务一致要求:预留资源成功理论上要求正式执行成功,如果执行失败会进行重试,要求业务执行方法实现幂等。
优点 :由MQ按异步的方式协调完成事务,性能较高,开发成本低。
缺点:此方式基于关系数据库本地事务来实现,会出现频繁读写数据库记录,浪费数据库资源,另外对于高并发操作不是最佳方案。
因为面试中多次被提及,所以耐心把分布式事务的内容细心学习了一遍,感觉这次终于对分布式事务有了初步的理解,真心感谢遇见原文作者的分享,大爱。
原文链接:
(1)Java微服务下的分布式事务介绍及其解决方案
(2)Java微服务下的分布式事务介绍及其解决方案
网友评论