这篇文章的标题很难起,网上一翻全是各种mq的性能比较,很容易让人以为我也是这么“粗俗”的人。我这篇文章想要表达的是——它们根本不是一个东西,有毛的性能好比较?
mq是什么?
message queue(mq),消息队列中间件。很多人都说:mq通过将消息的发送和接收分离来实现应用程序的异步和解偶,这个给人的直觉是——mq是异步的,用来解耦的,但是这个只是mq的效果而不是目的。
mq真正的目的是为了通讯,屏蔽底层复杂的通讯协议,定义了一套应用层的、更加简单的通讯协议。一个分布式系统中两个模块之间通讯要么是http,要么是自己开发的tcp,但是这两种协议其实都是原始的协议。http协议很难实现两端通讯——模块a可以调用b,b也可以主动调用a,如果要做到这个两端都要背上webserver,而且还不支持长连接(http 2.0的库根本找不到)。
tcp就更加原始了,粘包、心跳、私有的协议,想一想头皮就发麻。mq所要做的就是在这些协议之上构建一个简单的“协议”——生产者/消费者模型。mq带给我的“协议”不是具体的通讯协议,而是更高层次通讯模型。它定义了两个对象——发送数据的叫生产者;消费数据的叫消费者, 提供一个sdk让我们可以定义自己的生产者和消费者实现消息通讯而无视底层通讯协议。
mq的流派
列出功能表来比较mq差异或者来一场“mq性能大比武”的做法都是比较扯的,首先要做的事情应该是分类。我理解的mq分为两个流派:
有broker
这个流派通常有一台服务器作为broker,所有的消息都通过它中转。生产者把消息发送给它就结束自己的任务了,broker则把消息主动推送给消费者(或者消费者主动轮询)。
重topic流
kafka、jms就属于这个流派,生产者会发送key和数据到broker,由broker比较key之后决定给哪个消费者。这是我们最常见的模式,是我们对mq最多的印象。在这种模式下一个topic往往是一个比较大的概念,甚至一个系统中就可能只有一个topic,topic某种意义上就是queue,生产者发送key相当于说:“hi,把数据放到key的队列中”。
如上图所示,broker定义了三个队列,key1,key2,key3,生产者发送数据的时候会发送key1和data,broker在推送数据的时候则推送data(也可能把key带上)。虽然架构一样但是kafka的性能要比jms的性能不知道高到多少倍,所以基本这种类型的mq只有kafka一种备选方案。如果你需要一条暴力的数据流(在乎性能而非灵活性)那么kafka是最好的选择。
轻topic流
这种的代表是rabbitmq(或者说是amqp)。生产者发送key和数据,消费者定义订阅的队列,broker收到数据之后会通过一定的逻辑计算出key对应的队列,然后把数据交给队列。
注意到了吗?这种模式下解耦了key和queue,在这种架构中queue是非常轻量级的(在rabbitmq中它的上限取决于你的内存),消费者关心的只是自己的queue;生产者不必关心数据最终给谁只要指定key就行了,中间的那层映射在amqp中叫exchange(交换机)。amqp中有四种种exchange——direct exchange:key就等于queue;fanout exchange:无视key,给所有的queue都来一份;topic exchange:key可以用“宽字符”模糊匹配queue;最后一个厉害了headers exchange:无视key,通过查看消息的头部元数据来决定发给那个queue(amqp头部元数据非常丰富而且可以自定义)。
这种结构的架构给通讯带来了很大的灵活性,我们能想到的通讯方式都可以用这四种exchange表达出来。如果你需要一个企业数据总线(在乎灵活性)那么rabbitmq绝对的值得一用。
无broker
此门派是amqp的“叛徒”,某位道友嫌弃amqp太“重”(那是他没看到用erlang实现的时候是多么的行云流水) 所以设计了zeromq。这位道友非常睿智,他非常敏锐的意识到——mq是更高级的socket,它是解决通讯问题的。所以zeromq被设计成了一个“库”而不是一个中间件,这种实现也可以达到——没有broker的目的。
节点之间通讯的消息都是发送到彼此的队列中,每个节点都既是生产者又是消费者。zeromq做的事情就是封装出一套类似于scoket的api可以完成发送数据,读取数据。如果你仔细想一下其实zeromq是这样的:
顿悟了吗?actor模型,zeromq其实就是一个跨语言的、重量级的actor模型邮箱库。你可以把自己的程序想象成一个actor,zeromq就是提供邮箱功能的库;zeromq可以实现同一台机器的ipc通讯也可以实现不同机器的tcp、udp通讯。如果你需要一个强大的、灵活、野蛮的通讯能力,别犹豫zeromq。
mq只能异步吗
答案是否定了,首先zeromq支持请求->应答模式;其次rabbitmq提供了rpc是地地道道的同步通讯,只有jms、kafka这种架构才只能做异步。我们很多人第一次接触mq都是jms之类的这种所以才会产生这种错觉。
总结
kafka,zeromq,rabbitmq代表了三种完全不同风格的mq架构;关注点完全不同:
kafka在乎的是性能,速度
rabbitmq追求的是灵活
zeromq追求的是轻量级、分布式
如果你拿zeromq来做大数据量的传输功能,不是生产者的内存“爆掉”就是消费者被“压死”;如果你用kafka做通讯总线那绝对的不会快只能更慢;你想要rabbitmq实现分布式,那真的是难为它。
<b></b>
<b>本文来自云栖社区合作伙伴"dbaplus",原文发布时间:2016-10-20</b>