[一致性Hash] 一致性hash算法

[一致性Hash] 一致性hash算法

作者: cgl1079743846 | 来源:发表于2018-03-12 11:00 被阅读14次

分布式集群架构场景化解决方案
【转载】对一致性Hash算法介绍与实现
极客时间《架构师训练营》第五章课后作业
一致性hash算法
负载均衡一致性Hash算法
自己实现一个一致性 Hash 算法
缓存架构之17：数据分布算法：hash+一致性hash+redi
27_数据分布算法：hash+一致性hash+redis clu
什么是一致性Hash算法？
一致性hash

概述

一致哈希是一种特殊的哈希算法。在使用一致哈希算法后，哈希表槽位数（大小）的改变平均只需要对 K/n个关键字重新映射，其中K是关键字的数量， n是槽位数量。然而在传统的哈希表中，添加或删除一个槽位的几乎需要对所有关键字进行重新映射。

引出

我们在上文中已经介绍了一致性Hash算法的基本优势，我们看到了该算法主要解决的问题是：当slot数发生变化时，能够尽量少的移动数据。那么，我们思考一下，普通的Hash算法是如何实现？又存在什么问题呢？

引出问题：假设有1000w个数据项，100个存储节点，请设计一种算法合理地将他们存储在这些节点上？

看一看普通Hash算法的原理：

算法设计得核心

[图片上传中...(image-df8a02-1520690978489-0)]

普通的Hash算法均匀地将这些数据项打散到了这些节点上，并且分布最少和最多的存储节点数据项数目小于1%。之所以分布均匀，主要是依赖Hash算法（实现使用的MD5算法）能够比较随机的分布。

然而，我们看看存在一个问题，由于该算法使用节点数取余的方法，强依赖node的数目，因此，当是node数发生变化的时候，item所对应的node发生剧烈变化，而发生变化的成本就是我们需要在node数发生变化的时候，数据需要迁移，这对存储产品来说显然是不能忍的，我们观察一下增加node后，数据项移动的情况

结论：如果有100个item，当增加一个node，之前99%的数据都需要重新移动
这显然是不能忍的, 没错我们的一致性hash算法闪亮登场

登场

我们上节介绍了普通Hash算法的劣势，即当node数发生变化（增加、移除）后，数据项会被重新“打散”，导致大部分数据项不能落到原来的节点上，从而导致大量数据需要迁移。

那么，一个亟待解决的问题就变成了：当node数发生变化时，如何保证尽量少引起迁移呢？即当增加或者删除节点时，对于大多数item，保证原来分配到的某个node，现在仍然应该分配到那个node，将数据迁移量的降到最低。

一致性Hash算法的原理是这样的：

从最初的1000w个数据项经过一般的哈希算法的模拟来看，这些数据项“打散”后，是可以比较均匀分布的。但是引入一致性哈希算法后，为什么就不均匀呢？数据项本身的哈希值并未发生变化，变化的是判断数据项哈希应该落到哪个节点的算法变了。

因此，主要是因为这100个节点Hash后，在环上分布不均匀，导致了每个节点实际占据环上的区间大小不一造成的。

虚节点

当我们将node进行哈希后，这些值并没有均匀地落在环上，因此，最终会导致，这些节点所管辖的范围并不均匀，最终导致了数据分布的不均匀。

通过增加虚节点的方法，使得每个节点在环上所“管辖”更加均匀。这样就既保证了在节点变化时，尽可能小的影响数据分布的变化，而同时又保证了数据分布的均匀。

相关文章

分布式集群架构场景化解决方案
一致性hash算法hash算法应用场景普通hash算法存在的问题一致性hash算法手写一致性hash算法nginx...
【转载】对一致性Hash算法介绍与实现
对一致性Hash算法，Java代码实现的深入研究一致性哈希算法一致性HASH算法详解
极客时间《架构师训练营》第五章课后作业
用你熟悉的语言实现一致性 hash 算法简介一致性 Hash 被广泛的应用于负载均衡领域的 Hash 算法，我...
一致性hash算法
一致性hash算法简介首先为什么需要一致性hash算法？因为传统的hash算法，对于将数据映射到具体的结点确实有...
负载均衡一致性Hash算法
一致性Hash算法通过一个叫作一致性Hash环的数据结构实现Key到服务器的Hash映射。具体算法过程为： ...
自己实现一个一致性 Hash 算法
前言在前文分布式理论(八)—— Consistent Hash（一致性哈希算法）中，我们讨论了一致性 hash ...
缓存架构之17：数据分布算法：hash+一致性hash+redi
讲解分布式数据存储的核心算法，数据分布的算法 hash算法 -> 一致性hash算法（memcached） -> ...
27_数据分布算法：hash+一致性hash+redis clu
讲解分布式数据存储的核心算法，数据分布的算法 hash算法 -> 一致性hash算法（memcached） -> ...
什么是一致性Hash算法？
什么是一致性Hash算法？五分钟看懂一致性哈希算法
一致性hash
一致性Hash算法概念：先构造一个长度为232的整数环（这个环被称为一致性Hash环），根据节点名称的Hash值...

网友评论

Java面试题总结

本文标题：[一致性Hash] 一致性hash算法

本文链接：https://www.haomeiwen.com/subject/rcabfftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

Java面试题总结

热点阅读

Java面试题总结

关于我们|服务条款|联系我们|[一致性Hash] 一致性hash算法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！