大数据开发：常用的四种消息队列对比

对于消息队列组件，在大数据技术生态当中，是有着多种解决方案的，在实际的开发任务当中，往往需要根据具体的需求，去规划解决方案。今天的大数据开发学习分享，我们主要来讲讲常用的四种消息队列的对比。

1、ActiveMQ

ActiveMQ是由Apache出品，ActiveMQ是一个完全支持JMS1.1和J2EE1.4规范的JMS Provider实现。它非常快速，支持多种语言的客户端和协议，而且可以非常容易的嵌入到企业的应用环境中，并有许多高级功能。

主要特性：

服从JMS规范：JMS规范提供了良好的标准和保证，包括：同步或异步的消息分发，一次和仅一次消息分发，消息接收和订阅等等。遵从JMS规范的好处在于，不论使用什么JMS实现提供者，这些基础特性都是可用的。

连接灵活性：ActiveMQ提供了广泛的连接协议，支持的协议有：HTTP/S，IP多播，SSL，TCP，UDP等等。对众多协议的支持让ActiveMQ拥有了很好的灵活性。

支持的协议种类多：OpenWire、STOMP、REST、XMPP、AMQP。

持久化插件和安全插件：ActiveMQ提供了多种持久化选择。而且，ActiveMQ的安全性也可以完全依据用户需求进行自定义鉴权和授权。

支持的客户端语言种类多：除了Java之外，还有C/C ，.Net，Perl，PHP，Python，Ruby。

代理集群：多个ActiveMQ代理可以组成一个集群来提供服务。

异常简单的管理：ActiveMQ是以开发者思维被设计的。所以，它并不需要专门的管理员，因为它提供了简单又实用的管理特性。

有很多种方法可以监控ActiveMQ不同层面的数据，包括使用在JConsole或者在ActiveMQ的WebConsole中使用JMX。

通过处理JMX的告警消息，通过使用命令行脚本，甚至可以通过监控各种类型的日志。

部署环境：ActiveMQ可以运行在Java语言所支持的平台之上。

2、RabbitMQ

RabbitMQ于2007年发布，是一个在AMQP（高级消息队列协议）基础上完成的，可复用的企业消息系统，是当前最主流的消息中间件之一。

主要特性如下：

可靠性：提供了多种技术可以让你在性能和可靠性之间进行权衡。这些技术包括持久性机制、投递确认、发布者证实和高可用性机制。

灵活的路由：消息在到达队列前是通过交换机进行路由的。RabbitMQ为典型的路由逻辑提供了多种内置交换机类型。

如果你有更复杂的路由需求，可以将这些交换机组合起来使用，你甚至可以实现自己的交换机类型，并且当做RabbitMQ的插件来使用。

消息集群：在相同局域网中的多个RabbitMQ服务器可以聚合在一起，作为一个独立的逻辑代理来使用。

队列高可用：队列可以在集群中的机器上进行镜像，以确保在硬件问题下还保证消息安全。

支持多种协议：支持多种消息队列协议。

支持多种语言：用Erlang语言编写，支持只要是你能想到的所有编程语言。

管理界面：RabbitMQ有一个易用的用户界面，使得用户可以监控和管理消息Broker的许多方面。

跟踪机制：如果消息异常，RabbitMQ提供消息跟踪机制，使用者可以找出发生了什么。

插件机制：提供了许多插件，来从多方面进行扩展，也可以编写自己的插件。

部署环境：RabbitMQ可以运行在Erlang语言所支持的平台之上，包括Solaris，BSD，Linux，MacOSX，TRU64，Windows等。

3、RocketMQ

RocketMQ出自阿里的开源产品，用Java语言实现，在设计时参考了Kafka，并做出了自己的一些改进，消息可靠性上比Kafka更好。

RocketMQ在阿里内部被广泛应用在订单，交易，充值，流计算，消息推送，日志流式处理，Binglog分发等场景。

主要特性如下：

基于队列模型：具有高性能、高可靠、高实时、分布式等特点。

Producer、Consumer队列都支持分布式。

Producer向一些队列轮流发送消息，队列集合称为Topic。Consumer如果做广播消费，则一个Consumer实例消费这个Topic对应的所有队列。

如果做集群消费，则多个Consumer实例平均消费这个Topic对应的队列集合。

能够保证严格的消息顺序。

提供丰富的消息拉取模式。

高效的订阅者水平扩展能力。

实时的消息订阅机制。

亿级消息堆积能力。

较少的外部依赖。

部署环境：RocketMQ可以运行在Java语言所支持的平台之上。

4、Kafka

Apache Kafka是一个分布式消息发布订阅系统。它最初由LinkedIn公司基于独特的设计实现为一个分布式的日志提交系统（a distributed commit log），之后成为Apache项目的一部分。

Kafka性能高效、可扩展良好并且可持久化。它的分区特性，可复制和可容错都是不错的特性。

主要特性如下：

快速持久化：可以在O(1)的系统开销下进行消息持久化。

高吞吐：在一台普通的服务器上即可以达到10W/S的吞吐速率。

完全的分布式系统：Broker、Producer和Consumer都原生自动支持分布式，自动实现负载均衡。

支持同步和异步复制两种高可用机制。

支持数据批量发送和拉取。

零拷贝技术（zero-copy）：减少IO操作步骤，提高系统吞吐量。

数据迁移、扩容对用户透明。

无需停机即可扩展机器。

其他特性：丰富的消息拉取模型、高效订阅者水平扩展、实时的消息订阅、亿级的消息堆积能力、定期删除机制。

部署环境，使用Kafka需要：JavaJDK、Kafka安装包。

关于大数据开发学习，四种消息队列对比，以上就为大家做了简单的介绍了。在现有的大数据技术生态当中，消息队列的使用算是比较常见的需求，而作为开发者，需要对主流的解决方案都做到心中有数。

大数据大数据处理套件TBDS 消息队列CMQ版

0 人点赞