JumpConsistentHash，一种快速、简单、内存占用最少的一致性hash算法

文章列表

Consistent hashing最早是David Karger在MIT用于分布式缓存时提出的一个概念。对于分布式缓存系统来说，通常数据会分散地分布在不同的node上。而Consistent hashingh的作用就是来定位key->node的关系。本文主要是根据论文简单解释一下JumpConsistentHash的原理和实现。

为什么需要Consistent hashing

通常来说，在线服务经常会因为请求量波动而需要去做扩缩容。如果用传统的hash方式去做，那就会导致数据分布会重排，那就意味着要做大规模的数据迁移，这显然对在线服务来说是不能接受的。新加一个node，通常只希望每一个node迁移少量一部分数据到新的node，删除一个node同样希望是删除的node重新均匀分配给其他node。而Consistent hashing就是为了解决这种动态数据分布均匀的问题。

JumpConsistentHash的实现

标准的Consistent hashing实现的思路是把node和key同时hash映射到2^32的环上，再通过顺时针找到key最近的node。这个方式有个缺点是当node很少时，node在环上的分布不均匀，从而导致数据在node的分布不均匀。为了解决这个问题后来又引入了虚拟node的概念。

传统的实现过于麻烦且复杂，在2014年Google发布了一篇《A Fast, Minimal Memory, Consistent Hash Algorithm》，在这篇论文中Google提出了一种纯数学的方式解决了这个问题，代码只需要仅仅几行。

int32_t JumpConsistentHash(uint64_t key, int32_t num_buckets) {int64_t b = 1, j = 0;while (j < num_buckets) {b = j;key = key * 2862933555777941757ULL + 1;j = (b + 1) * (double(1LL << 31) / double((key >> 33) + 1));}return b;
}

它的时间复杂度小于ln(n) + 1，后面会给出证明。空间复杂度看代码很显然是O(1)。

JumpConsistentHash的原理

设ch(key，num_buckets)为当有num_buckets个桶时key的Consistent hashing值。显然，对于任何key k，ch(k，1)为0，因为只有一个桶。为了使Consistent hashing函数平衡，ch(k，2)必须对于一半的k保持为0，另一半的k跳到1。一般来说，ch(k，n+1)必须对于n/(n+1)的key保持与ch(k，n)相同，而对于其他1/(n+1)的key则必须跳到n。

根据这个思路，我们可以得出一个简单的算法。给定一个key和num_buckets，该算法考虑从1到num_buckets-1的每个连续的桶j，并使用ch(key，j)来计算ch(key，j+1)。在每个桶j处，它决定是否将ch(k，j+1)保持与ch(k，j)相同，或者将其值跳到j。为了跳跃1/(j+1)的key，它生成一个介于0.0和1.0之间的均匀随机数，如果该值小于1/(j+1)，则跳跃。代码如下：

int ch(int key, int num_buckets) {random.seed(key);int b = 0; // This will track ch(key, j+1).for (int j = 1; j < num_buckets; j++) {if (random.next() < 1.0 / (j + 1)) b = j;}return b;
}

这里随着j的增加，跳跃的概率越来越低。所以论文里又想到了一种办法让key直接跳跃到下一个可跳跃的j。

假设算法正在跟踪特定key的jump bucket。假设b是上一次跳跃的目的地，即ch(k，b)≠ch(k，b+1)，且ch(k，b+1)=b。现在，我们想找到下一个跳跃的目的地，即最小的j，使得ch(k，j+1)≠ch(k，b+1)，或者等价地算出最大的j，使得ch(k，j)=ch(k，b+1)。我们使用一个随机数j。为了得到对j的概率约束，对于任何i，当且仅当Consistent hashing的值没有改变i时，即当且仅当ch(k，i)=ch(k，b+1)时，我们有j≥i。因此，j的分布必须满足以下条件：

P(j ≥ i) = P(ch(k, i) = ch(k, b+1))

这个概率P很容易计算。由于P(ch(k，10)=ch(k，11))为10/11，P(ch(k，11)=ch(k，12))为11/12，因此P(ch(k，10)=ch(k，12))为10/11 * 11/12 = 10/12。所以如果n≥m，则P(ch(k，n)=ch(k，m))=m/n。因此，对于任何i>b，有以下结论：

P(j ≥ i) = P(ch(k, i) = ch(k, b+1)) = (b+1) / i

现在，我们生成一个随机变量r，它在0到1之间均匀分布。由于我们希望P(j≥i)=(b+1)/i，因此我们必须要让r<=(b+1)/i。解不等式得到：仅当i≤(b+1)/r。由于i是j的下限，因此，j=floor((b+1)/r)。使用这个公式，JumpConsistentHash可以通过选择跳跃的目的地来找到ch(key，num_buckets。代码如下：

int ch(int key, int num_buckets) {random.seed(key);int b = 1; // bucket number before the previous jumpint j = 0; // bucket number before the current jumpwhile (j < num_buckets) {b = j;r = random.next();j = floor((b + 1) / r);}return = b;
}

最后再改成通过LCG来生成随机数就会变成本文开头的那段代码。

JumpConsistentHash的时间复杂度

该算法的时间复杂度等于循环的执行次数。因为最后一次一定得跳出循环，也就是j >= num_buckets，故最少要执行一次。而每次跳跃的期望小于1/i，所以整体跳跃的期望=Σ 1/i (2 <= i <= n)，而这个数值是<ln(n)的，所以最终的复杂度大约是ln(n) + 1。

论文中没有给出跳跃的期望的证明，可能是因为太简单了，笔者这里简单反证一下。

假设当前在桶b，根据公式，如果要跳跃到b+1，则r需要在((b+1)/(b+2), 1)这个范围内。如果要跳跃到b+2，则r需要在((b+1)/(b+3), (b+1)/(b+2))这个范围内。以此类推，需要跳到b+n这个位置，则r需要在((b+1)/(b+n+1), (b+1)/(b+n))这个范围。

故证明每次跳跃的期望小于1/i，等价于证明(b+1)/b+n - (b+1)/(b+n+1) < 1/(b+1)，令x=b+1,y=n-1可得：

x/(x+y) - x/(x+y+1) < 1/x

最后解得：

x*x < (x+y)(x+y+1)

因为y=n-1，n>=2，故有y>=1。x=b+1>=1，所以显然上述不等式是成立的。

总结

JumpConsistentHash提出了一种崭新的思路来解决这类问题。如果已经理解了原理，那不难看出想要增加或者删除node只能在末尾进行操作，这是和传统的实现不一样的地方。但笔者认为这个不是什么很大的缺点，它优秀的复杂度和实现完全可以覆盖掉这个缺点。笔者最近刚好要搭一套分布式缓存服务，直接拿这个上手非常好用。如果还想了解更多细节，比如benchmark，建议看原文。

参考

[1]《A Fast, Minimal Memory, Consistent Hash Algorithm》：https://arxiv.org/pdf/1406.2294.pdf

周公解梦

JumpConsistentHash，一种快速、简单、内存占用最少的一致性hash算法

为什么需要Consistent hashing

JumpConsistentHash的实现

JumpConsistentHash的原理

JumpConsistentHash的时间复杂度

总结

参考

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签

JumpConsistentHash，一种快速、简单、内存占用最少的一致性hash算法

为什么需要Consistent hashing

JumpConsistentHash的实现

JumpConsistentHash的原理

JumpConsistentHash的时间复杂度

总结

参考

相关问题

公告

DeepSeek全套部署资料免费下载

免费可商用字体批量下载

标签