> 文章列表 > 分布式系统的CAP原则(CAP定理)和BASE理论

分布式系统的CAP原则(CAP定理)和BASE理论

分布式系统的CAP原则(CAP定理)和BASE理论

CAP指的是:

一致性(Consistency):在分布式系统中的所有数据备份,在同一时刻是否同样的值。(等同于所有节点访问同一份最新的数据副本)
可用性(Availability):保证每个请求不管成功或者失败都有响应。
分区容错性(Partition tolerance):系统中任意信息的丢失或失败不会影响系统的继续运作。

三个首字母缩写就是CAP
CAP原则:就是要么满足AP,要么满足CP,要么满足AC,但是不存在CAP。如果在某个分布式系统中数据只有一份, 那么系统必然满足强一致性条件, 因为只有独一数据,不会出现数据不一致的情况,此时C和P两要素具备,但是如果系统发生了网络分区状况或者宕机,必然导致某些数据不可以访问,此时可用性条件A就不能被满足,即在此情况下获得了CP系统,但是CAP不可同时满足。
分布式系统的CAP原则(CAP定理)和BASE理论
但其中还有一个问题,就是CA理论上在分布式系统中也是不能同时保证的,原因是如果是分布式系统,一个节点进行修改操作时,由于要保证一致性,其他节点就不能同时进行修改,那么这时就不能保证系统的可用性,这就冲突了,所以我也对CA做了标记。

在一个分布式系统中,由于网络硬件环境肯定会出现延迟丢包等各种问题,所以分区容错性(Partition tolerance)是必须要保证的,那么**一致性(Consistency)可用性(Availability)**就只能保证一个,不能两者兼顾。这就如同物理量子力学上的测不准原理一样,位置与动量只能确定一个,这个是理论依据,谁来都不好使。知道这个原理,就会给我们项目的搭建和框架的选择提供一定的理论支持,就只能选择CP或者AP。

BASE理论

BASE理论是:BASE是指基本可用(Basically Available)、软状态( Soft State)、最终一致性( Eventual Consistency)的一个缩写。
在CAP中,因为P(分区容错性)必须要保证。可用性、一致性也是我们一般系统希望满足的,那么如何在可用性和一致性进行权衡,所以就出现了各种一致性的理论与算法。
分布式系统的CAP原则(CAP定理)和BASE理论

BASE 理论是对 CAP 中的一致性和可用性进行一个权衡的结果,其来源于对大规模互联网系统分布式实践的总结,是基于CAP定理逐步演化而来的,其核心思想是即使无法做到强一致性(Strong consistency),但每个应用都可以根据自身的业务特点,采用适当的方式来使系统达到最终一致性(Eventual consistency)。
基本可用:
基本可用是指分布式系统在出现不可预知故障的时候,允许损失部分可用性,但请注意,这绝不等价于系统不可用,
比如平时打开一个页面0.5秒,繁忙时打开需要2秒,或者提示访问稍等,正在加载,系统还是可用的,只是降级或者响应变慢,这种情况是允许存在的。
软状态:
指的是允许系统中的数据存在中间状态,并认为该中间状态的存在不会影响系统的整体可用性,即允许系统在不同节点的数据副本之间进行数据同步的过程存在延时。
最终一致性:
最终一致性强调的是系统中所有的数据副本,在经过一段时间的同步后,最终能够达到一个一致的状态。因此,最终一致性的本质是需要系统保证最终数据能够达到一致,而不需要实时保证系统数据的强一致性。

注意:最终一致性是一种特殊的弱一致性,系统能够保证在没有其他新的更新操作的情况下,数据最终一定能够达到一致的状态,因此所有客户端对系统的数据访问都能够获取到最新的值。同时,在没有发生故障的前提下,数据达到一致状态的时间延迟,取决于网络延迟、系统负载和数据复制方案设计等因素。