文章目录
- 高可用机制解析
- 消息消费高可用
- 消息发送高可用
- NameServer协调者解析
- NameServer基本概念和功能
- 集群状态的存储结构
- topicQueueTable
- brokerAddrTable
- clusterAddrTable
- brokerLiveTable
- filterServerTable
- 为什么不直接用Zookeeper而是定义NameServer
高可用机制解析
RocketMQ分布式集群是通过Master和Slave的配合达到高可用性的。 Master和Slave的区别:
- 在Broker的配置文件中,参数brokerId的值为0表明这个Broker是Master,大于0表明这个Broker是Slave,brokerRole参数也说明这个Broker是Master还是Slave。(SYNC_MASTER/ASYNC_MASTER/SALVE)
- Master角色的Broker支持读和写,Slave角色的Broker仅支持读。
- Consumer可以连接Master角色的Broker,也可以连接Slave角色的Broker来读取消息。
消息消费高可用
在Consumer的配置文件中,并不需要设置是从Master读还是从Slave 读,当Master不可用或者繁忙的时候,Consumer会被自动切换到从Slave 读。 有了自动切换Consumer这种机制,当一个Master角色的机器出现故障后,Consumer仍然可以从Slave读取消息,不影响Consumer程序。这就达到了消费端的高可用性
消息发送高可用
如何达到发送端的高可用性呢? 在创建Topic的时候,把Topic的多个Message Queue创建在多个Broker组上(相同Broker名称,不同brokerId的机器组成一个Broker组),这样既可以在性能方面具有扩展性,也可以降低主节点故障对整体上带来的影响,而且当一个Broker组的Master不可用后,其他组的Master仍然可用,Producer仍然可以发送消息的。 RocketMQ目前还不支持把Slave自动转成Master,如果机器资源不足,需要把Slave转成Master。可以按照如下步骤操作:
- 手动停止Slave角色的Broker。
- 更改配置文件。
- 用新的配置文件启动Broker
NameServer协调者解析
NameServer基本概念和功能
对于一个消息队列集群来说,系统由很多机器组成,每个机器的角色、IP地址都不相同,而且这些信息是变动的(如在某些情况下,会有新的Producer或Consumer加入)。 NameServer的存在主要是为了解决这类问题,由NameServer维护这些配置信息、状态信息,其他角色都通过NameServer来协同执行。 NameServer是整个消息队列中的状态服务器,集群的各个组件通过它来了解全局的信息。各个角色的机器要定时向NameServer上报自己的状态,如果超时未上报,NameServer会认为某个机器出故障不可用了,其他的组件会把这个机器从可用列表中删除。 NameServer可以部署多个,相互之间独立,其他角色同时向多个NameServer上报状态信息,从而达到热备份的目的。NameServer本身是无状态的,也就是说NameServer中的Broker、Topic等信息都不会持久化,都是由各个角色定时上报并存储到内存中的(NameServer支持参数的持久化,一般用不到)。
集群状态的存储结构
在nameserver模块下的RouteInfoManager可以看到有五个HashMap变量保存了集群的信息。
代码语言:javascript复制 /**
* 存储所有Topic与Broker关联的属性信息
*/
private final HashMap<String/* topic */, Map<String /* brokerName */ , QueueData>> topicQueueTable;
/**
* 存储BrokerName对应的属性信息
*/
private final HashMap<String/* brokerName */, BrokerData> brokerAddrTable;
/**
* 存储集群的信息
*/
private final HashMap<String/* clusterName */, Set<String/* brokerName */>> clusterAddrTable;
/**
* 存储Broker机器的实时状态
*/
private final HashMap<String/* brokerAddr */, BrokerLiveInfo> brokerLiveTable;
/**
* 存储过滤服务器信息
*/
private final HashMap<String/* brokerAddr */, List<String>/* Filter Server */> filterServerTable;
topicQueueTable
代码语言:javascript复制HashMap<String/* topic */, Map<String /* brokerName */ , QueueData>> topicQueueTable;
key
:Topic的名称。
value
:value是个一个Map集合,集合中存的brokerName与QueueData(队列数据)的关联信息。QueueData存储着Broker的名称,读写Queue的数量、同步标识等。
brokerAddrTable
代码语言:javascript复制HashMap<String/* brokerName */, BrokerData> brokerAddrTable;
key
:brokerName
value
:BrokerData里面存了broker相关数据信息。
clusterAddrTable
代码语言:javascript复制HashMap<String/* clusterName */, Set<String/* brokerName */>> clusterAddrTable;
key
:cluster(集群)的名称
value
:Broker Name组成的集合。
即一个cluster名称对应的一个BrokerName的集合。
brokerLiveTable
代码语言:javascript复制HashMap<String/* brokerAddr */, BrokerLiveInfo> brokerLiveTable;
key
:Broker的地址,brokerAddr 对应着一台机器。
value
:BrokerLiveInfo存储的内容是这台 Broker 机器的实时状态,包括上次更新状态的时间戳,NameServer 会定期检查这个时间戳,超时没有更新就认为这个 Broker 无效了,将其从 Broker 列表里清除。
filterServerTable
代码语言:javascript复制HashMap<String/* brokerAddr */, List<String>/* Filter Server */> filterServerTable;
key
:BrokerAddr
value
:FilterServer的地址列表。
Filter Server是过滤服务器,是RocketMQ的一种服务端过滤方式。一个Broker可以有一个或多个Filter Server。
总结:NameServer 通过 brokerLiveInfo 来维护存活的 Broker。Producer 会获取上面的路由信息,发送消息的时候指定发送到哪个 Topic,根据 Topic 可以从 topicQueueTable 选择一个 Broker,根据 BrokerName 可以从 BrokerAddrTable 获取到Broker IP 地址。有了地址 Producer 就可以将消息通过网络传递给 Broker。
为什么不直接用Zookeeper而是定义NameServer
Zookeeper为分布式应用程序提供协调服务,Zookeeper的功能很强大,包括自动Master选举,RocketMQ的设计决定了它不需要进行Master选举,用不到这些复杂的功能,只需要一个轻量级的元数据服务器就足够了。 中间件对稳定性要求很高,RocketMQ的NameServer只有很少的代码,容易维护,所以不需要再依赖另一个中间件,从而减少整体维护成本。
本文内容到此结束了, 如有收获欢迎点赞