对于消息队列组件,在大数据技术生态当中,是有着多种解决方案的,在实际的开发任务当中,往往需要根据具体的需求,去规划解决方案。今天的大数据开发学习分享,我们主要来讲讲常用的四种消息队列技术的对比。
1、ActiveMQ
ActiveMQ是由Apache出品,ActiveMQ是一个完全支持JMS1.1和J2EE1.4规范的JMS Provider实现。它非常快速,支持多种语言的客户端和协议,而且可以非常容易的嵌入到企业的应用环境中,并有许多高级功能。
主要特性:
服从JMS规范:JMS规范提供了良好的标准和保证,包括:同步或异步的消息分发,一次和仅一次消息分发,消息接收和订阅等等。遵从JMS规范的好处在于,不论使用什么JMS实现提供者,这些基础特性都是可用的。
连接灵活性:ActiveMQ提供了广泛的连接协议,支持的协议有:HTTP/S,IP多播,SSL,TCP,UDP等等。对众多协议的支持让ActiveMQ拥有了很好的灵活性。
支持的协议种类多:OpenWire、STOMP、REST、XMPP、AMQP。
持久化插件和安全插件:ActiveMQ提供了多种持久化选择。而且,ActiveMQ的安全性也可以完全依据用户需求进行自定义鉴权和授权。
支持的客户端语言种类多:除了Java之外,还有C/C++,.Net,Perl,PHP,Python,Ruby。
代理集群:多个ActiveMQ代理可以组成一个集群来提供服务。
异常简单的管理:ActiveMQ是以开发者思维被设计的。所以,它并不需要专门的管理员,因为它提供了简单又实用的管理特性。
有很多种方法可以监控ActiveMQ不同层面的数据,包括使用在JConsole或者在ActiveMQ的WebConsole中使用JMX。
通过处理JMX的告警消息,通过使用命令行脚本,甚至可以通过监控各种类型的日志。
部署环境:ActiveMQ可以运行在Java语言所支持的平台之上。
2、RabbitMQ
RabbitMQ于2007年发布,是一个在AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。
主要特性如下:
可靠性:提供了多种技术可以让你在性能和可靠性之间进行权衡。这些技术包括持久性机制、投递确认、发布者证实和高可用性机制。
灵活的路由:消息在到达队列前是通过交换机进行路由的。RabbitMQ为典型的路由逻辑提供了多种内置交换机类型。
如果你有更复杂的路由需求,可以将这些交换机组合起来使用,你甚至可以实现自己的交换机类型,并且当做RabbitMQ的插件来使用。
消息集群:在相同局域网中的多个RabbitMQ服务器可以聚合在一起,作为一个独立的逻辑代理来使用。
队列高可用:队列可以在集群中的机器上进行镜像,以确保在硬件问题下还保证消息安全。
支持多种协议:支持多种消息队列协议。
支持多种语言:用Erlang语言编写,支持只要是你能想到的所有编程语言。
管理界面:RabbitMQ有一个易用的用户界面,使得用户可以监控和管理消息Broker的许多方面。
跟踪机制:如果消息异常,RabbitMQ提供消息跟踪机制,使用者可以找出发生了什么。
插件机制:提供了许多插件,来从多方面进行扩展,也可以编写自己的插件。
部署环境:RabbitMQ可以运行在Erlang语言所支持的平台之上,包括Solaris,BSD,Linux,MacOSX,TRU64,Windows等。
3、RocketMQ
RocketMQ出自阿里的开源产品,用Java语言实现,在设计时参考了Kafka,并做出了自己的一些改进,消息可靠性上比Kafka更好。
RocketMQ在阿里内部被广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,Binglog分发等场景。
主要特性如下:
基于队列模型:具有高性能、高可靠、高实时、分布式等特点。
Producer、Consumer队列都支持分布式。
Producer向一些队列轮流发送消息,队列集合称为Topic。Consumer如果做广播消费,则一个Consumer实例消费这个Topic对应的所有队列。
如果做集群消费,则多个Consumer实例平均消费这个Topic对应的队列集合。
能够保证严格的消息顺序。
提供丰富的消息拉取模式。
高效的订阅者水平扩展能力。
实时的消息订阅机制。
亿级消息堆积能力。
较少的外部依赖。
部署环境:RocketMQ可以运行在Java语言所支持的平台之上。
4、Kafka
Apache Kafka是一个分布式消息发布订阅系统。它最初由LinkedIn公司基于独特的设计实现为一个分布式的日志提交系统(a distributed commit log),之后成为Apache项目的一部分。
Kafka性能高效、可扩展良好并且可持久化。它的分区特性,可复制和可容错都是不错的特性。
主要特性如下:
快速持久化:可以在O(1)的系统开销下进行消息持久化。
高吞吐:在一台普通的服务器上即可以达到10W/S的吞吐速率。
完全的分布式系统:Broker、Producer和Consumer都原生自动支持分布式,自动实现负载均衡。
支持同步和异步复制两种高可用机制。
支持数据批量发送和拉取。
零拷贝技术(zero-copy):减少IO操作步骤,提高系统吞吐量。
数据迁移、扩容对用户透明。
无需停机即可扩展机器。
其他特性:丰富的消息拉取模型、高效订阅者水平扩展、实时的消息订阅、亿级的消息堆积能力、定期删除机制。
部署环境,使用Kafka需要:JavaJDK、Kafka安装包。
关于大数据开发学习,四种消息队列技术对比,以上就为大家做了简单的介绍了。在现有的大数据技术生态当中,消息队列的使用算是比较常见的需求,而作为开发者,需要对主流的解决方案都做到心中有数。
网友评论