海量数据分流处理-------一致性哈希算法

作者: 狼牙战士 | 来源:发表于2017-08-14 10:39 被阅读0次

海量数据分流处理-------一致性哈希算法
阿里技术面试题—一致性hash算法
一致性哈希算法
一致性Hash算法
JAVA集合特殊用处
理解一致性哈希算法
什么是一致性Hash算法？
【转载】对一致性Hash算法介绍与实现
「Redis源码解读」—数据结构（二）哈希表
《分布式技术原理与算法解析》学习笔记Day22

大学时期做移动开发(ios),毕业后开始做大数据开发，到现在也为止也做过不少工程项目，掌握了不少我只认为是工具的东西，比如Hadoop中的HDFS、Mapreduce、Yarn、HBase、Hive、Sqoop、Flume、Mahout、Pig、Zookeeper等和Spark中的Spark SQL、Spark Streaming、MLlib等，越来越意识到算法在工程中的重要性，有了扎实的的算法基础，新的技术，新的工具能够很快的学会并且掌握，也是通往高级工程师的必经之路。今天来说一说海量数据分流处理中的一种方法：一致性哈希算法。

海量数据分流处理(负载均衡)的几种方法

一、传统Hash方法

实际应用：流量分发

1.png

这个算法的问题在于容错性和扩展性不好。所谓容错性是指当系统中某一个或几个服务器变得不可用时，整个系统是否可以正确高效运行；而扩展性是指当加入新的服务器后，整个系统是否可以正确高效运行。

现假设有一台服务器宕机了，那么为了填补空缺，要将宕机的服务器从编号列表中移除，后面的服务器按顺序前移一位并将其编号值减一，此时每个key就要按h = Hash(key) % (N-1)重新计算；同样，如果新增了一台服务器，虽然原有服务器编号不用改变，但是要按h = Hash(key) % (N+1)重新计算哈希值。因此系统中一旦有服务器变更，大量的key会被重定位到不同的服务器从而造成大量的缓存不命中。而这种情况在分布式系统中是非常糟糕的。