消息队列

时间：2017-04-10 10:47:22 阅读：258 评论：0 收藏：0 [点我收藏+]

标签：tle new 消息队列事务机制参考 htm 异步 url xmpp

消息队列

应用消息队列可以对系统进行解耦，流量削峰，在分布式系统设计中，消息队列是重要的组件之一。

在开发中应用过ActiveMQ，kafka等mq，不过对消息队列背后的实现原理关注不多，其实了解消息队列背后的实现特别重要，

比如对一致性等实现的关注，可以帮助我们在开发中避免踩坑，规避问题的出现。这篇文章简单探讨下当设计和实现一个消息队列时，我们需要关心哪些地方。

消息队列功能和特性

一个传统意义上的消息队列，需要支持消息的发送，接受和消息暂存的功能。

在实际应用中，对消息队列的要求远不止于此，在不同的业务场景中，需要消息队列提供如顺序消息，消息可靠性，消息持久化等需求。

1.即时通信和消息队列

从消息能否会被即时接受和处理的角度，可以把消息传递的方式分为两种。

一种是即时消息通讯，也就是说消息从发送者一端发出后立即就可以达到接收者一端；

另一种方式称为延迟消息通讯，即消息从某一端发出后，首先进入一个容器进行临时存储，当达到某种条件后，再由这个容器发送给另一端。

延迟消息通讯的容器实现就是消息队列。

技术分享

2.消息队列基础功能

消息队列需要支持消息的发送，消息暂存，和消息的异步消费，

3.消息队列需要支持的特性

除了基本功能以外，消息队列在某些特殊的场景还需要支持事务，消息重试等功能。

消息的顺序
投递可靠性保证
消息持久化
支持不同消息模型
多实例集群功能
分布式环境下的负载均衡

消息队列的基础设计

为了实现消息队列的基础功能，即消息的传输，存储和消费，

需要从以下几个维度去进行设计：

通信协议
存储选择
消费关系维护

1.通信协议

消息既是信息的载体，消息发送者需要知道如何构造消息，消息接收者需要知道如何解析消息，它们需要按照一种统一的格式描述消息，这种统一的格式称之为消息协议。没有格式的消息是没有意义的。

传统的通信协议标准有XMPP和AMQP协议等，现在更多的消息队列从性能的角度出发使用自己设计实现的通信协议。

（1）AMQP规范和JMS规范

AMQP 是 Advanced Message Queuing Protocol，即高级消息队列协议。AMQP不是一个具体的消息队列实现，而是一个标准化的消息中间件协议。目标是让不同语言，不同系统的应用互相通信，并提供一个简单统一的模型和编程接口。目前主流的ActiveMQ和RabbitMQ都支持AMQP协议。

技术分享

JMS是Java平台的一部分，是一种应用于异步消息传递的标准API，JMS可以允许不同应用、不同模块之间实现可靠、异步数据通信。

在JMS中，支持两种消息模型，点对点（Point-to-point）和发布-订阅(Publish and subscribe)，这两种模式分别对应于JMS中的两种消息目标（Message Destination）:队列及主题（queue/topic）。

（2）Kafka的通信协议

Kafka的Producer、Broker和Consumer之间采用的是一套自行设计的基于TCP层的协议。Kafka的这套协议完全是为了Kafka自身的业务需求而定制的，而非要实现一套类似于Protocol Buffer的通用协议。

2.消息存储

消息队列常常保存在链表结构中，拥有权限的进程可以向消息队列中写入或读取消息。

对于分布式系统，消息存储的选择有以下几种：

内存
本地文件系统
分布式文件系统
关系型数据库
NoSQL数据库

从速度上内存显然是最快的，对于允许消息丢失，消息堆积能力要求不高的场景(例如日志)，内存会是比较好的选择。关系型数据库则是最简单的实现可靠存储的方案，很适合用在可靠性要求很高，最终一致性的场景(例如交易消息)。

对于不需要100%保证数据完整性的场景，要求性能和消息堆积的场景，hbase也是一个很好的选择，典型的比如 kafka的消息落地可以使用hadoop。

3.消费关系维护

消息队列需要支持点对点和发布／订阅模式的消费模型，消费端的消费进度也需要记录，典型的如消费端重连的处理，参考Kafka对每个Consumer提供一个偏移量的支持。

另外消息队列选择Pull还是Push模型进行实现也非常重要。在消费端，ActiveMQ使用PUSH模型，而Kafka使用PULL模型，两者各有利弊。对于PUSH，broker很难控制数据发送给不同消费者的速度，而PULL可以由消费者自己控制，但是PULL模型可能造成消费者在没有消息的情况下盲等，这种情况下可以通过long polling机制缓解。对于几乎每时每刻都有消息传递的流式系统，使用Pull模型更合适。