写点什么

Hudi

0 人感兴趣 · 5 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/95/954499eac10d6b2c474cdb950173f209.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

字节跳动基于 Apache Hudi 的多流拼接实践

字节跳动数据湖团队在实时数仓构建宽表的业务场景中,探索实践出的一种基于 Hudi Payload 的合并机制提出的全新解决方案。

https://static001.geekbang.org/infoq/1d/1d5e4bb1f0d529daba51b268fe54103e.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Hudi Bucket Index 在字节跳动的设计与实践

由字节跳动数据湖团队贡献的 RFC-29 Bucket Index 在近期合入 Hudi 主分支,本文详细介绍 Hudi Bucket Index 产生的背景与实践经验。

https://static001.geekbang.org/infoq/99/99943388e1cff62245fc2a819c6eaefb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Flink Hudi 0.10.0 发布,多项重要更新,稳定性大幅提升

用户头像
Apache Flink
2021 年 12 月 20 日

核心读写能力大幅增强,解锁了多个新场景。

Hudi 自带工具 DeltaStreamer 的实时入湖最佳实践

用户头像
华为云开发者联盟
2021 年 8 月 2 日

摘要:本文介绍如何使用Hudi自带入湖工具DeltaStreamer进行数据的实时入湖。

https://static001.geekbang.org/infoq/4a/4a91683c10117fbe7e0c28bd305e6e11.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

使用 Apache Spark 构建可靠的数据湖 (九)

用户头像
数据与智能
2021 年 7 月 24 日

写在前面: 大家好,我是强哥,一个热爱分享的技术狂。目前已有 12 年大数据与AI相关项目经验, 10 年推荐系统研究及实践经验。平时喜欢读书、暴走和写作。

Hudi_Hudi技术文章_InfoQ写作社区