- Consistency (all nodes have access to the same data simultaneously)
- Availability (a promise that every request receives a response, at minimum whether the request succeeded or failed)
- Partition tolerance (the system will continue to work even if some arbitrary node goes offline or can’t communicate)
理解:
- 一致性(Consistency): 所有结点在同一时刻能够看到相同的数据,对客户端(调用方)来说,读操作结果能够返回最新的操作结果
- 可用性(Availability): 非故障结点,在河里时间内返回合理的响应,不能是错误和超时。
- 分区容忍性(Partition tolerance): 当出现网络分区后, 系统能够继续工作
CAP应用:
CAP理论是说在分布式存储系统中,最多只能实现上面的两点 。
在分布式环境下,网络无法做到100%可靠,因为网络故障的原因,必须选择P(分区容忍)。选择C,则意味着不能提供不是最新的响应,则故障机器需要进制访问,与A冲突,选择A,则故障机器,继续提供有限的访问,数据不一致。由于A和C冲突,实际只能选择AP或者CP。
- CP:分区发生,部分不可用
- AP:返回脏数据,没有达到强一致性
关键细节
- CAP关注的粒度是数据,而不是整个系统,在实际系统中会根据业务对一致性的不同容忍做不同选择。比如:账号系统必须强一致,签名,备注啥的可以弱一致性
- CAP默认瞬间可以完成数据同步,没有考虑网络延迟。实际由于上网络延迟的存在,任何操作都需要一定的时间,几豪秒到几十毫秒。整个系统还是分布式架构的,只是无法将单个数据做分布式
- 无网络分区发生时,CAP是可以同时满足的,只有在分区发生时考虑AP还是CP
- 放弃不等于什么都不做,分区恢复后,必要的恢复操作还是要做,只是分区发生时暂时放弃一个
ACID
ACID,数据库事务正确执行的四个基本要素:
- 原子性(Atomicity): 要么成功,要么失败回滚
- 一致性(Consistency):事务开始之前,结束以后数据的完整性不受没有被破坏
- 隔离性(Isolation):并发事务执行隔离,互补影响
- 持久性(Durability): 一个支持事务(Transaction)的数据库,必须要具有这四种特性,否则在事务过程(Transaction processing)当中无法保证数据的正确性,交易过程极可能达不到交易方的要求。
ACID 是针对于数据库事务的,CAP针对的是分布式系统,二者无可比性。
**BASE ** 为了解决关系数据库强一致性引起的问题而引起的可用性降低而提出的解决方案
- 基本可用(Basically Available):分布式系统故障,损失部分可用性,保证核心可用
- 软状态(Soft state):中间状态,即故障中的不一致状态
- 最终一致(Eventually consistent):一定时间后,所有副本打到最终一致性
BASE是最CAP的延伸和补充,更多是针对AP补充。
延时无法避免,完美的CP场景不存在,CP方案也只是最终一致性,只是几毫秒的延时而已
AP牺牲的一致性仅存在于分区发生期间,分区恢复后达到最终的一致性。
网友评论