iceberg
0 人感兴趣 · 17 次引用
- 最新
- 推荐
网易传媒基于 Arctic 的低成本准实时计算实践
Arctic 能相对较好地支持与服务于流批混用的场景,其开放的叠加式架构,可以帮助我们非常平滑地过渡与实现 Hive 到数据湖的升级改造,且由于传媒离线数仓已接入有数,通过 Arctic 来改造现有业务的成本较低
Arctic 基于 Hive 的流批一体实践
帮助业务平滑地从 Hive 过渡到 Streaming Lakehouse
Spark 合并 Iceberg 小文件内存溢出问题定位和解决方案
此问题来源于客户POC测试现场,我们提供了合并小文件的driver程序RewriteDatafile,现场有一个5亿数据的Iceberg表,其中包括5千万删除数据,需要通过Spark合并小文件,进而提升Trino的查询速度。但是合并过程中任务必中断,任务被kill。
Trino 应用 Iceberg Catalog 写入数据原理分析
Trino在Iceberg Catalog下创建表后(https://xie.infoq.cn/article/e4c245a0e260d1ebf0b29c592),再
Trino 通过 Iceberg 创建表的过程分析
Iceberg是一个为大规模数据集设计的通用的表格形式,并且适配了Trino 、Flink和Spark,提供SQL化解决方案。在构建数据湖的场景中,计算引擎和iceberg的组合为用户提供了ACID和多版本支持,支持批/流读写等特性。本文主要介绍trino如何构建一个Iceberg表。
Apache Flink Meetup · 上海站,超强数据湖干货等你!
Apache Flink x Iceberg Meetup