twitter的snowflake算法

作者: 天一阁图书管理员 | 来源:发表于2017-03-26 14:10 被阅读207次

数据库分库分表（二）Twitter-Snowflake（64位分
Twitter snowflake ID 算法之 golang
分布式ID生成研究
雪花算法（SnowFlake）Java实现
（5）分布式ID之雪法算法Snowflake实现分布式ID
雪花算法（SnowFlake）Java实现
ID生成器之-Twitter雪花算法的Java实现
twitter的snowflake算法
Twitter-Snowflake，64位自增ID算法详解
分库分表结合分布式id生成算法

snowflake算法是twitter提出的一个用来生成不重复ID的算法，用于解决ID冲突。适用于：先插数据，然后根据id更新数据。还有分布式多机同时取ID。

这个算法本身并不复杂，它的原理是根据时间(ms)来不断更新ID。ID由64bit组成，分为workerId、datacenterId、timestamp(ms)、sequence四部分。其中workerId占5个bit，datacenterId占5个bit，sequence占12个bit。为了不产生溢出，timestamp还要减去一个固定值。因为timestamp本身就是32位的数值，添加了毫秒以后位数就多了。减去一个固定值以后，可以有效的减少位数，而不产生冲突，保证重复性。

private[this] val workerIdBits = 5L
private[this] val datacenterIdBits = 5L
private[this] val maxWorkerId = -1L ^ (-1L << workerIdBits)
private[this] val maxDatacenterId = -1L ^ (-1L << datacenterIdBits)
private[this] val sequenceBits = 12L
private[this] val workerIdShift = sequenceBits
private[this] val datacenterIdShift = sequenceBits + workerIdBits
private[this] val timestampLeftShift = sequenceBits + workerIdBits + datacenterIdBits
private[this] val sequenceMask = -1L ^ (-1L << sequenceBits)

timestamp放在最左边，然后是datacenterId，接着是workerId，最后是sequence。sequence最大可以达到12位，也就是说每个毫秒对datacenterId+workerId可以产生4095个ID。我相信对每秒上万的qps的服务器也是足够用的了。下面的代码是生成算法，从twitter的源码拷出来的。

((timestamp - twepoch) << timestampLeftShift) |
      (datacenterId << datacenterIdShift) |
      (workerId << workerIdShift) | 
      sequence

这个算法我们已经用于统计HTTP请求，有一些业务需要记录请求的参数，以便查找和定位问题，这个记录要分为两步，每一步是请求进来的参数，如果请求处理完了，在返回前，还要把这个请求的结果再更新一把。

从目前的情况来看，运行效果良好。唯一要注意的是，这个算法必须是一个单例，否则每次sequence都从0开始会产生冲突。

网友评论

程序员

本文标题：twitter的snowflake算法

本文链接：https://www.haomeiwen.com/subject/ywckottx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

twitter的snowflake算法

相关文章

数据库分库分表（二）Twitter-Snowflake（64位分

Twitter snowflake ID 算法之 golang

分布式ID生成研究

雪花算法（SnowFlake）Java实现

（5）分布式ID之雪法算法Snowflake实现分布式ID

雪花算法（SnowFlake）Java实现

ID生成器之-Twitter雪花算法的Java实现