美文网首页
MPSC消息队列设计

MPSC消息队列设计

作者: 谭英智 | 来源:发表于2024-04-27 21:48 被阅读0次

设计原理

初始化

  • 建立2048个元素的数组,用于传输数据
  • 为每个元素分配一个版本号:turn
  • turn为奇数是,为可读
  • turn为偶数时,为可写

生产者

  • 抢夺head原子变量idx,增加1
  • 轮询idx下turn是否为偶数
  • 如果为偶数,写入数据,并turn = idx/2048*2 + 1
  • 如果为奇数,则一直轮询,知道turn变为偶数

消费者

  • 判断tail下的turn是否为奇数
  • 如果为奇数,则消费
  • 并写入turn = idx/2048*2 + 2
  • 如果为偶数,则轮询,知道turn变为奇数

局部优化

  • 原子变量head, tail, turn align 64,避免伪共享
  • 使用位运算代替取余 idx & size => idx & (size -1)
  • 使用左移和右移来代替乘除 idx / size * 2 => ((idx >> 11)<<1)

代码

#include <vector>
#include <atomic>
#include <thread>
#include <iostream>
#include <sys/time.h>
#include <sstream>
#include <cstring>

#define SLOT_DATA_BUF_SIZE 2048
#define MPSC_IDX(i, size_mask) i&size_mask
#define MPSC_TURN(i, size_bit) ((i>>size_bit)<<1)

class MpscQueueSlot {
public:
    std::atomic<uint32_t> turn_ = {0};
    uint32_t padding[15];
};
class MpscQueueSlotData {
public:
    char value[SLOT_DATA_BUF_SIZE];
};
class MpscQueue {
public:
    const uint32_t size = 2048;
    const uint32_t size_mask = 2047;
    const uint32_t size_bit = 11;
    const uint32_t slot_size = SLOT_DATA_BUF_SIZE;
    std::vector<MpscQueueSlotData> v;
    MpscQueueSlot* slot_;
    std::atomic<uint32_t> head_ = {0};
    uint32_t padding[15];
    std::atomic<uint32_t> tail_ = {0};
    MpscQueue() {
        v.resize(size);
        slot_ = new MpscQueueSlot[size];
    }
    ~MpscQueue() {
        delete[] slot_;
    }
    void peek(uint32_t& i, char*& buf ) {
        i = head_.fetch_add(1, std::memory_order_acquire);
        auto & turn = slot_[MPSC_IDX(i,size_mask)].turn_;
        auto new_turn = MPSC_TURN(i, size_bit);
        while (new_turn != turn.load(std::memory_order_acquire));
        buf = v[MPSC_IDX(i,size_mask)].value;
    }
    void send(uint32_t& i) {
        auto & turn = slot_[MPSC_IDX(i,size_mask)].turn_;
        auto new_turn = MPSC_TURN(i, size_bit);
        turn.store(new_turn + 1, std::memory_order_release);
    }
    bool try_pop(char*& buf) {
        auto i = tail_.load(std::memory_order_relaxed);
        auto & turn = slot_[MPSC_IDX(i,size_mask)].turn_;
        if (MPSC_TURN(i, size_bit) + 1 != turn.load(std::memory_order_acquire)) {
            return false;
        }
        buf = v[MPSC_IDX(i,size_mask)].value;
        return true;

    }
    void ack() {
        auto i = tail_.fetch_add(1, std::memory_order_release);
        auto new_turn = MPSC_TURN(i, size_bit);
        auto & turn = slot_[MPSC_IDX(i,size_mask)].turn_;
        turn.store(new_turn + 2, std::memory_order_release);
    }
};

void prodecer_thread(MpscQueue* q) {
    uint32_t i;
    char* buf;
    char data[2048];
    uint32_t count = 0;
    while(true) {
        q->peek(i, buf);
        memcpy(buf, data, 2048);
        *((uint32_t*)buf) = count;
        count++;
        q->send(i);
    }
}

int64_t getUs() {
    struct timeval cur_time;
    gettimeofday(&cur_time, nullptr);
    return (cur_time.tv_sec*1000000+cur_time.tv_usec);
}

void consumer_thread(MpscQueue* q) {
    char* buf;
    char tmp[2048];
    uint64_t count = 0;
    int64_t start = getUs();
    std::stringstream print_str;
    int print_count = 0;
    while(true) {
        if(!q->try_pop(buf)) {
            continue;
        }
        memcpy(tmp, buf, 2048);
        q->ack();
        count++;
        if(count == 0xFFFFF) {
            print_count++;
            int64_t cur = getUs();
            print_str<<" consume "<< count << " records take "<< cur - start << "us speed "
                << (count*1000000)/(cur - start) <<" qps " << (count*2048)/(cur - start) << " MB/s" << std::endl;
            count = 0;
            start = cur;

            if(print_count == 5) {
                std::cout<<print_str.str() << std::endl;
                exit(0);
            }
        }
    }
}


int main()  {
    MpscQueue q;
    auto producer_1 = std::thread(prodecer_thread, &q);
    auto producer_2 = std::thread(prodecer_thread, &q);
    auto producer_3 = std::thread(prodecer_thread, &q);
    auto producer_4 = std::thread(prodecer_thread, &q);
    auto consumer = std::thread(consumer_thread, &q);
    producer_1.join();
    producer_2.join();
    producer_3.join();
    producer_4.join();
    consumer.join();
    
    return 0;
}

性能数据

root@ubuntu:/home/marco/Documents/code/mpsc# ./a.out
 consume 1048575 records take 59722us speed 17557600 qps 35957 MB/s
 consume 1048575 records take 61869us speed 16948310 qps 34710 MB/s
 consume 1048575 records take 61062us speed 17172300 qps 35168 MB/s
 consume 1048575 records take 61801us speed 16966958 qps 34748 MB/s
 consume 1048575 records take 61486us speed 17053882 qps 34926 MB/s

相关文章

  • 消息队列设计

    消息队列通常作为企业IT系统内部通信的核心手段具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能,成为异...

  • 消息队列设计精要

    消息队列已经逐渐成为企业IT系统内部通信的核心手段。它具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能...

  • 消息队列设计精要

    消息队列已经逐渐成为企业IT系统内部通信的核心手段。它具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能...

  • 消息队列设计精要

    消息队列已经逐渐成为企业IT系统内部通信的核心手段。它具有低耦合、可靠投递、广播、流量控制、最终一致性等一系列功能...

  • nsq 消息队列设计

    消息传递设计 nsqlookupd:作用类似nsqd的注册中心,也复制给消费者提供nsqd地址 nsqd:管理to...

  • Golang 消息队列系列一 概念

    参考消息队列的使用场景是怎样的?新手也能看懂,消息队列其实很简单消息队列设计精要 一、例一 假设用户在你的软件中注...

  • 我们为什么要用消息队列?

    消息队列是系统设计中存在时间最长的中间件之一,从系统有通信需求开始,就产生了消息队列。 消息队列的使用场景 在日常...

  • 从趣例理解 Android 消息机制,帮你彻底解决进程间的通信问

    这次,真的可以一文吃透: Java层消息队列的设计 Java层Looper分发 Native层消息队列和Java层...

  • MQ的消息模型和事务

    消息队列架构演进 早期mq就是按照队列的数据结构来设计的 若有多个生产者往同一队列发送消息、这个队列可以消费到生产...

  • 详解RocketMQ的通信模型和应用

    对于消息队列的通信模型,目前市面上主流的消息队列产品主要有两种形式,一种按照队列的数据结构设计出来的“队列模型”,...

网友评论

      本文标题:MPSC消息队列设计

      本文链接:https://www.haomeiwen.com/subject/uybaxjtx.html