現象
在kafka consumer (以 kafka1.0.0為例)消費 topic 時,常常會出現程式還在運作,但是已經不消費消息了(kafka producer正常生産消息),使用kafka指令檢視,kafka 已經沒有consumer 的資訊了。
實驗用例
實驗 kafka consumer 實作:
package com.muhao.kafka;
import java.util.Arrays;
import java.util.Properties;
import org.apache.kafka.clients.consumer.ConsumerRecord;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
public class MyKafKaConsumer {
public static void main(String[] args) throws InterruptedException {
Properties props = new Properties();
props.put("bootstrap.servers", "192.168.220.10:9092");
props.put("group.id", "test");
props.put("enable.auto.commit", "true");
props.put("auto.commit.interval.ms", "1000");
props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
consumer.subscribe(Arrays.asList("my-topic"));
while (true) {
ConsumerRecords<String, String> records = consumer.poll(100);
for (ConsumerRecord<String, String> record : records) {
// 一次停止10 秒鐘,如果上一次得到超過30條消息,就會出現kafka consumer停止消費的現象
Thread.sleep(10000L);
System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
}
}
}
}
實驗 kafka producer 實作:
package com.muhao.kafka;
import java.util.Properties;
import org.apache.kafka.clients.producer.KafkaProducer;
import org.apache.kafka.clients.producer.Producer;
import org.apache.kafka.clients.producer.ProducerRecord;
public class MyKafkaProducer {
public static void main(String[] args) {
Properties props = new Properties();
props.put("bootstrap.servers", "192.168.220.10:9092");
props.put("acks", "all");
props.put("retries", 0);
props.put("batch.size", 16384);
props.put("linger.ms", 1);
props.put("buffer.memory", 33554432);
props.put("key.serializer", "org.apache.kafka.common.serialization.StringSerializer");
props.put("value.serializer", "org.apache.kafka.common.serialization.StringSerializer");
Producer<String, String> producer = new KafkaProducer<>(props);
for (int i = 0; i < 1000; i++)
producer.send(new ProducerRecord<String, String>("my-topic", Integer.toString(i), "hello message is number : "+Integer.toString(i)));
producer.close();
}
}
啟動 kafka consumer ,成功運作後在 kafka指令行執行
bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --describe --group test
發現kafka consumer 已經注冊到kafka叢集中了。
kafka producer發送消息讓kafka consumer 消費,但是consumer是阻塞的,等待5分鐘時候,運作指令行
發現kafka叢集已經沒有了 consumer的消息,但是程式仍在運作。
解決及建議
這種現象也是糾結了好長時間,檢視源碼,終于明白了,原來是在 kafka consumer 運作時,要和kafka叢集的協調節點做心跳交流,這也是kafka叢集給consumer做負載均衡的條件。但是但是consumer内部也會有一個計時器,記錄上一次向 kafka 叢集 poll 的時間,另外心跳線程會檢測該現在距上一次poll的時間,如果該時間差超過了設定時間(kafka consumer預設的是 5分鐘),就會想kafka叢集發出leaveGroup,這時kafka叢集會登出掉該consumer 的資訊。
建議:kafka consumer 在消費消息時,不要使用阻塞方法,比如blockqueue、網絡發送設定逾時時間……
總得一句就是上下兩次poll 的時間間隔不要超過5分鐘(預設的時間)。