写点什么

行业热议 | 当实时数据平台成为必然布局,IBM 收购 Confluent 释放了什么信号?

作者:tapdata
  • 2025-12-22
    广东
  • 本文字数:2216 字

    阅读完需:约 7 分钟

行业热议 | 当实时数据平台成为必然布局,IBM 收购 Confluent 释放了什么信号?

上周,IBM 宣布将以约 110 亿美元现金收购数据流处理公司 Confluent,以构建面向企业级生成式 AI 的智能数据平台,通过实时连接、处理和治理数据来提升 AI 和混合云应用的部署能力,该交易预计于 2026 年中完成,并有望在首个完整财年提升盈利表现。这一动作迅速引发行业热议,也被解读为企业在实时数据、数据治理与平台能力上的竞争正在进入新阶段。


对许多企业来说,实时数据架构并不是一个“正在设计”的问题,而是一个“已经存在、但未必再被认真审视”的现实。当底层技术逐渐成熟、平台逐渐集中,原本基于工程便利做出的选择,也开始需要被放到业务可用性的角度重新检视。


在这样的节点上,IBM 收购 Confluent 更像是一个信号,而不是答案本身。表面上看,这是对 Kafka 生态的重磅投入,但背后传递的信号更为关键:实时数据基础设施,正在成为企业战略级的必选项。


这也让许多国内的技术负责人开始思考一个实际问题:如果我的目标是“实时、可用的数据”,那我现在这套以 Kafka 为中心的架构,真的还是最合适的吗?

流式架构 ≠ 数据集成,更不等于数据就绪

在很多企业实践中,引入 Kafka 往往不是因为业务需要“流处理”,而是因为:

  • 传统的批量同步无法满足业务时效性要求

  • 微服务之间需要实时数据协同

  • 希望摆脱 T+1 的数据延迟,实现更敏捷的业务响应


Kafka 逐渐成为“默认选择”,更多是因为其生态成熟,而非架构必然。在缺乏专门实时数据集成层的情况下,Kafka 被自然推到了这一位置。

久而久之,一个典型的模式开始形成:

  • 通过 Debezium 等工具捕捉数据库变更

  • Kafka 负责传递事件

  • 开发团队编写消费者程序,在消费侧完成原本属于数据集成层的结构对齐、语义拼接与数据加工工作

  • 管道越堆越多,Schema 管理愈发复杂,定制代码成为负担,这并非实现方式的问题,而是集成职责被分散到各个消费者所导致的结构性结果。


问题并不在于 Kafka 的能力不足,而在于它被使用在了并非其设计目标的层面。Kafka 在传递数据方面表现出色,但它并非为以下场景设计:

  • 直接面向业务的数据服务

  • 实时查询与灵活聚合

  • 开箱即用的数据产品化


换句话说,它解决了数据流动的问题,但当缺乏专门的数据集成层时,数据就绪的责任便被转移到了 Kafka 及其消费者之上。

IBM 的收购,反映的是什么趋势?

IBM 并不是第一次下注开源技术。这次收购 Confluent,也并不意味着 Kafka 本身发生了质变——Kafka 早已是成熟的开源基础设施。

IBM 买下的并非 Kafka 本身,而是其在企业级实时数据流领域的整体方案与控制力:

  • 面向大型企业的统一管控、合规与治理体系

  • 围绕流式数据的标准化管理、平台化部署与运维能力

  • 与其云平台、AI 及自动化产品线之间的体系化整合能力


对于追求稳定、一站式解决方案的大型企业,这或许是一条值得关注的路径。但对于更看重技术自主性、灵活架构与成本可控的团队而言,这也带来一些新的考量:

  • 技术路线是否会受供应商规划影响

  • 长期使用成本是否可控

  • 架构是否足够开放,避免被单一生态绑定


当技术选型的不确定性增加,也正是我们重新审视架构的合适时机。

从“流得快”到“用得上”,从“数据管道”到“数据服务”

真正发生变化的,并不是企业对实时数据的需求——恰恰相反,这种需求只会越来越强。而转变在于,企业开始更认真地思考,哪些工作应该由集成平台承担,哪些不应继续堆叠在流处理之上。

越来越多团队意识到:

  • 业务系统需要的并非原始事件流,而是实时、结构清晰、可查询的数据视图

  • 数据应当能够被业务接口、应用程序和分析工具直接使用

  • 运维复杂度应当尽可能降低,让团队聚焦业务而非管道维护在这样的需求面前,传统以流处理为中心的架构,开始显得偏重、偏工程化。


在这一趋势下,单纯以“流为中心”的架构,有时显得重心偏高、迭代偏重。

企业真正需要的是“实时数据服务层” —— 建立在清晰的数据集成与数据就绪能力之上,能够将数据变更自动转化为实时、可复用的数据产品。

此时,正是审视实时架构的好时机

IBM 此次收购,并不代表某种技术路径的终结,反而标志着实时数据建设进入“价值深水区”。这促使我们回归到一个更本质的问题:我们构建实时数据能力,究竟是为了技术布局,还是为了业务敏捷?


这并非一个非此即彼的选择,而是一个关于路径与重心的思考:

  • 如果你的核心场景是 “系统解耦、事件驱动、流水线式传输” ,那么以 Kafka 为代表的流式架构依然是坚实的选择。

  • 但如果你的业务诉求更偏向于 “实时数据服务、跨源统一查询、快速构建数据产品” ,那么或许值得思考:是否一定要从复杂的流式管道从头构建?是否存在一条更直接、更专注于 “数据就绪” 的路径?


而现在,正是一个重新审视架构的契机。我们可以问自己几个问题:

  1. 是否足够简单?——能否降低使用门槛,让业务团队能更直接地参与?

  2. 是否足够直接?——能否从数据变更到 API 服务,以最短路径响应业务?

  3. 是否足够开放?——能否与现有数据生态自然融合,而非制造新的孤岛?


最终,技术选型的答案,不在于追逐单一热点,而在于清晰地回答:我们需要的实时数据,为谁服务?需要多快能用?

TapData 观察:实时数据的价值,最终体现在对业务的支持速度与灵活度上。无论是流式架构还是数据服务平台,合适的就是最好的,但也要做到各司其职,数据集成不应继续由流式管道和消费者代码来“顺带完成”,将数据集成长期压在流式管道之上,本身就是一种架构妥协。在实时数据从“管道建设”走向“服务赋能”的过程中,我们始终相信,一个正在浮现的共识是:让更简单、更专注、更贴近业务的数据架构,将成为越来越多企业实现数据驱动的务实选择。

用户头像

tapdata

关注

Make Your Data on Tap 2021-04-23 加入

Tapdata 能够快速帮助企业快速打通数据孤岛,构建主数据服务平台,为业务提供统一、完整、实时的数据。现已上线永久免费的异构数据库同步工具cloud.tapdata.net ,支持主流数据库间的双向实时同步。

评论

发布
暂无评论
行业热议 | 当实时数据平台成为必然布局,IBM 收购 Confluent 释放了什么信号?_kafka架构_tapdata_InfoQ写作社区