大数据 -59 Kafka 拦截器全解析：原理、拦截链机制与自定义实现实战

2025-08-04
山东
本文字数：3712 字
阅读完需：约 12 分钟

点一下关注吧！！！非常感谢！！持续更新！！！

🚀 AI 篇持续更新中！（长期更新）

AI 炼丹日志-30-新发布【1T 万亿】参数量大模型！Kimi‑K2 开源大模型解读与实践，持续打造实用 AI 工具指南！📐🤖

💻 Java 篇正式开启！（300 篇）

目前 2025 年 08 月 04 日更新到：Java-89 深入浅出 MySQL 搞懂 MySQL Undo/Redo Log，彻底掌握事务回滚与持久化 MyBatis 已完结，Spring 已完结，Nginx 已完结，Tomcat 已完结，分布式服务正在更新！深入浅出助你打牢基础！

📊 大数据板块已完成多项干货更新（300 篇）：

包括 Hadoop、Hive、Kafka、Flink、ClickHouse、Elasticsearch 等二十余项核心组件，覆盖离线+实时数仓全栈！大数据-278 Spark MLib - 基础介绍机器学习算法梯度提升树 GBDT 案例详解

章节内容

上节我们完成了如下的内容：

Kafka 序列化器
Kafka 自定义序列化器
Kafka 分区器
Kafka 自定义分区器

拦截器

Kafka 拦截器详解

拦截器概述

Producer拦截器（Interceptor）和 Consumer拦截器是 Kafka 0.10 版本中引入的重要功能，主要用于实现客户端（Client 端）的定制化控制逻辑。这些拦截器提供了一种非侵入式的方式来监控和修改消息流，而不需要修改核心的业务逻辑代码。

Producer 拦截器功能

对于 Producer 而言，Interceptor 提供了两个关键时机的拦截点：

在消息发送前：可以对消息内容进行修改或增强
在 Producer回调逻辑前：可以处理发送结果或执行清理操作

常见的应用场景包括：

消息内容修改（如添加时间戳、消息 ID 等）
消息格式转换
发送监控和统计
消息日志记录
消息加密/解密

拦截链机制

Producer 允许指定多个Interceptor，它们会按顺序作用在同一条消息上，形成一个拦截链（Interceptor chain）。这种设计类似于 Servlet 中的 Filter 链或 Spring 中的 AOP 拦截器链。

核心方法详解

1. `onSend(ProducerRecord)`

执行时机：该方法封装在 KafkaProducer.send 方法中，运行在主线程中
调用顺序：Producer 确保在消息序列化及分区计算前调用该方法
使用建议：
可以对消息内容进行任意修改（如添加 header、修改 value 等）
避免修改消息的 topic 和分区信息，这会影响分区的计算逻辑
典型的应用包括：

    // 示例：添加时间戳    public ProducerRecord onSend(ProducerRecord record) {        Headers headers = record.headers().add("send_timestamp", System.currentTimeMillis());        return new ProducerRecord(record.topic(), record.partition(), record.key(), record.value(), headers);    }

复制代码

2. `onAcknowledgement(RecordMetadata, Exception)`

执行时机：
在消息被服务端应答之前调用
或在消息发送失败时调用
总是在 Producer 回调逻辑触发之前执行
线程特性：运行在 Producer 的 IO 线程中
使用建议：
避免执行耗时或复杂的逻辑，以免阻塞 IO 线程
适合用于：
发送结果统计（成功/失败计数）
资源清理
发送监控
错误日志记录
示例：

    public void onAcknowledgement(RecordMetadata metadata, Exception exception) {        if (exception != null) {            errorCounter.increment();        } else {            successCounter.increment();        }    }

复制代码

3. `close()`

功能：关闭 Interceptor 时调用
主要用途：
释放 Interceptor 占用的资源
执行最后的统计或日志输出
关闭网络连接等
示例：

  public void close() {      // 输出最终统计结果      System.out.println("Success: " + successCounter.get());      System.out.println("Failed: " + errorCounter.get());  }

复制代码

多线程注意事项

由于Interceptor 可能被运行在多个线程中（主线程和 IO 线程），在具体实现时需要特别注意：

确保所有共享变量的线程安全
避免使用非线程安全的集合类
考虑使用原子变量或同步机制
示例：

   // 线程安全的计数器实现   private final AtomicLong counter = new AtomicLong(0);      public void onSend(ProducerRecord record) {       counter.incrementAndGet();       return record;   }

复制代码

错误处理机制

当指定了多个 Interceptor 时：

Producer 会按照配置顺序依次调用每个 Interceptor
如果在某个 Interceptor 中抛出异常：
异常会被捕获并记录到日志中
异常不会向上传递，不会中断后续 Interceptor 的执行
业务逻辑（消息发送）会继续正常执行
这种设计保证了单个 Interceptor 的故障不会影响整体消息发送流程

最佳实践建议

保持 Interceptor 逻辑简单高效
避免在 Interceptor 中执行耗时操作（如网络 IO）
为 Interceptor 添加清晰的日志记录
考虑使用拦截器实现：
消息追踪（TraceID 传递）
消息加密/解密
发送监控和统计
A/B 测试的消息路由

通过合理使用拦截器，可以在不修改核心业务代码的情况下，实现各种横切关注点的功能，这是 Kafka 提供的一个非常强大的扩展机制。

自定义拦截器

根据对拦截器的观察学习，我们知道了，要实现自定义的拦截器，我们需要：

实现ProducerInterceptor接口
在KafkaProducer的设置中定义自定义的拦截器

自定义类

（上一节大数据 Kafka 58 点击跳转）借用我们刚才实现的 User 类，这里就不再写了。

自定义拦截器

自定义拦截器 01

public class Interceptor01<K, V> implements ProducerInterceptor<K, V> {
    @Override    public ProducerRecord<K, V> onSend(ProducerRecord<K, V> record) {        System.out.println("=== 拦截器01 onSend ===");        // 做一些操作        return record;    }
    @Override    public void onAcknowledgement(RecordMetadata metadata, Exception exception) {        System.out.println("=== 拦截器01 onAcknowledgement ===");        if (null != exception) {            // 此处应该记录日志等操作            exception.printStackTrace();        }    }
    @Override    public void close() {
    }
    @Override    public void configure(Map<String, ?> configs) {
    }}

复制代码

自定义拦截器 02

public class Interceptor02<K, V> implements ProducerInterceptor<K, V> {
    @Override    public ProducerRecord<K, V> onSend(ProducerRecord<K, V> record) {        System.out.println("=== 拦截器02 onSend ===");        // 做一些操作        return record;    }
    @Override    public void onAcknowledgement(RecordMetadata metadata, Exception exception) {        System.out.println("=== 拦截器02 onAcknowledgement ===");        if (null != exception) {            // 此处应该记录日志等操作            exception.printStackTrace();        }    }
    @Override    public void close() {
    }
    @Override    public void configure(Map<String, ?> configs) {
    }}

复制代码

使用拦截器

configs.put(ProducerConfig.INTERCEPTOR_CLASSES_CONFIG,                "icu.wzk.model.Interceptor01,icu.wzk.model.Interceptor02"        );

复制代码

原理剖析

整体原理图

主线程工作流程详解

主线程是 Kafka 生产者客户端的核心控制线程，主要完成以下关键操作：

消息处理阶段

消息创建：接收应用程序发送的 ProducerRecord 对象，包含主题、分区、键值对等信息
拦截器处理：依次通过配置的 ProducerInterceptor 链进行处理，可进行消息修改、统计等操作
示例：添加时间戳、消息 ID 等元数据
序列化：使用配置的 Serializer 将键值对象序列化为字节数组
常见序列化方式：StringSerializer、ByteArraySerializer 等
分区选择：通过 Partitioner 确定消息的目标分区
默认策略：key 哈希或轮询（无 key 时）

RecordAccumulator 工作机制

消息收集器 RecorderAccumulator 采用高效的双层存储结构：

分区队列：
每个分区对应一个 Deque<ProducerBatch>双端队列
采用双端队列便于头尾操作，提高并发性能
批次管理：
ProducerBatch 是内存中的消息批次容器
默认大小由 batch.size 参数控制（默认 16KB）
采用 ByteBuffer 存储，支持批量压缩
新建批次条件：
当前无可用批次
现有批次剩余空间不足
批次已满（达到 batch.size 或 linger.ms）
内存管理优化：
BufferPool 内存池设计：
维护固定大小（默认为 32MB）的 ByteBuffer 池
只缓存特定大小（由 batch.size 决定）的 ByteBuffer
大消息直接分配非池化内存
内存分配策略：

     if (size == poolableSize && !this.free.isEmpty())         return this.free.pollFirst();  // 从池中获取     else         return ByteBuffer.allocate(size);  // 直接分配

复制代码

发送准备阶段

批次转换：
将 Deque<ProducerBatch>按 Broker 节点分组
生成<Node, List<ProducerBatch>>结构
通过元数据获取分区 Leader 所在的 Broker 节点
请求构建：
将批次列表转换为网络请求 Request
考虑压缩配置（gzip/snappy/lz4 等）
添加必要的请求头信息
飞行请求管理：
InFlightRequests 缓存设计：
采用 Map<NodeId, Deque<Request>>结构
限制每个节点的未确认请求数（max.in.flight.requests.per.connection）
负载均衡策略：

     Node node = this.accumulator.ready(cluster).stream()         .min(Comparator.comparingInt(n -> this.inFlightRequests.count(n.id())))         .orElse(null);

复制代码

优先选择负载最低的节点发送

该设计通过批量处理、内存复用和智能路由等机制，显著提升了 Kafka 生产者的吞吐量和可靠性。

发布于: 刚刚阅读数: 2

原文链接:【http://xie.infoq.cn/article/ab58857eb07718eeeb820fea5】。文章转载请联系作者。

武子康

关注

永远好奇无限进步 2019-04-14 加入

Hi, I'm Zikang，好奇心驱动的探索者 | INTJ / INFJ 我热爱探索一切值得深究的事物。对技术、成长、效率、认知、人生有着持续的好奇心和行动力。坚信「飞轮效应」，相信每一次微小的积累，终将带来深远的改变。

发布

暂无评论

创作场景

大数据 -59 Kafka 拦截器全解析：原理、拦截链机制与自定义实现实战

点一下关注吧！！！非常感谢！！持续更新！！！

🚀 AI 篇持续更新中！（长期更新）

💻 Java 篇正式开启！（300 篇）

📊 大数据板块已完成多项干货更新（300 篇）：

章节内容

拦截器

Kafka 拦截器详解

拦截器概述

Producer 拦截器功能

拦截链机制

核心方法详解

1. onSend(ProducerRecord)

2. onAcknowledgement(RecordMetadata, Exception)

3. close()

多线程注意事项

错误处理机制

最佳实践建议

自定义拦截器

自定义类

自定义拦截器

使用拦截器

原理剖析

整体原理图

主线程工作流程详解

消息处理阶段

RecordAccumulator 工作机制

发送准备阶段

武子康

评论

1. `onSend(ProducerRecord)`

2. `onAcknowledgement(RecordMetadata, Exception)`

3. `close()`