算法实战3 - 高性能队列的实现思路

作者: 天命_风流 | 来源:发表于2020-04-22 10:33 被阅读0次

算法实战3 - 高性能队列的实现思路
P61-用两个队列实现一个栈
iOS开发集锦之 2017.03.30(Swift 算法实战之路
转载:史上更全的 MySQL 高性能优化实战总结！
Swift 算法实战二(二叉树、二分搜索)
Swift 算法实战一(集合,字典,链表,栈,队列等算法)
数据结构——栈和队列
队列之-队列实现栈
数组实现环形队列
堆排序

本章关键词

高性能队列、并发、线程安全

Disruptor 是一个高性能的内存消息队列，用于不同线程之间的通信。为了实现这样的高性能，它在设计和实现上做了很多功夫，这一节，我们就看一看它在底层用了什么样的数据结构。

底层数据结构的选取

对于消息队列，我们当然会选择使用队列这种数据结构。队列有两种实现思路，链式队列（使用链表实现）和顺序队列（使用数组实现）：

链式队列适合在不知道数据量的情况下使用，但是这可能会出现队列持续添加，从而导致内存溢出。
顺序队列使用数组实现，当队列中的消息数量超出限制，就会触发等待。从这个意义上来说，使用顺序队列更加符合我们的需求。
单纯的顺序队列在使用中会涉及数据搬移操作，所以我们可以选择使用循环队列避免这样的消耗。

线程队列的访问冲突问题

线程间的消息队列，可以用生产者-消费者模型很好地表示，这个模型非常经典，在这里就不多介绍了，我们直接说在实际应用中会遇到的问题：

多个生产者写入的数据可能会互相覆盖
多个消费者可能会读取重复的数据

这两个问题实际上是同一类问题：由于线程直接不是同步执行的，所以可能会相互影响，造成公共资源之间的使用冲突。

为了后面讲述的方便，我们定义一下向队列添加时使用的代码：

public boolean add(Long element) {
  if ((tail + 1) % size == head) return false;
  data[tail] = element;
  tail = (tail + 1) % size;
  return true;
}

在冲突时，程序会这样执行：

两个生产者同时想要写入数据：线程1希望写入12，线程2希望写入5，他们都向队列提出的写入请求。

在线程1执行完数据写入后，还没来得及将指针后移，线程2就已经执行了数据写入，这时线程1写入的12就被覆盖了

之后，两个线程都将指针后移，这导致出现了一个数据“空洞”

最简单的解决办法就是在数据写入和指针移动时对队列加锁。但是这样等于将一个并行的队列强制转成串行执行，势必会降低性能。

Disruptor的解决办法

Disruptor 的解决办法非常简单：一次申请 n 个内存空间：

对于生产者来说，它往队列中添加数据之前，先申请可用空闲存储单元，并且是批量地申请连续的 n 个（n≥1）存储单元。当申请到这组连续的存储单元之后，后续往队列中添加元素，就可以不用加锁了，因为这组存储单元是这个线程独享的。不过，从刚刚的描述中，我们可以看出，申请存储单元的过程是需要加锁的。
对于消费者来说，处理的过程跟生产者是类似的。它先去申请一批连续可读的存储单元（这个申请的过程也是需要加锁的），当申请到这批存储单元之后，后续的读取操作就可以不用加锁了。

具体操作过程如下：