写点什么

湖仓一体

0 人感兴趣 · 25 次引用

  • 最新
  • 推荐

支持多模型数据分析探索的存算分离湖仓一体架构解析(下)

当企业需要建设独立的数据仓库系统来支撑BI和分析业务时,有了“数据湖+数据仓库”的混合架构。但混合架构带来了更高的建设成本、管理成本和业务开发成本。

支持多模型数据分析探索的存算分离湖仓一体架构解析(上)

当企业需要建设独立的数据仓库系统来支撑BI和业务分析业务时,有了“数据湖+数据仓库”的混合架构。但混合架构带来了更高的建设成本、管理成本和业务开发成本。

https://static001.geekbang.org/infoq/ba/ba3537989bab0d4581c7aac8d54b7162.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Arctic 自动优化湖仓原理解析

要构建一套开箱即用的湖仓系统,自动优化是第一个需要解决的需求。

https://static001.geekbang.org/infoq/d8/d892cd333250696f33aa1e2edea15f94.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

直播|StarRocks 3.0 极速统一的湖仓新范式

近期,StarRocks V3.0 RC 版本发布。自此,StarRocks 开启了从 OLAP 到 Lakehouse 演进的新篇章。

https://static001.geekbang.org/infoq/81/81b0befb8e37fe82b8086e2876ba42f9.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

明天 9 点!Doris Summit 2022 拉开序幕,立即报名年度技术盛会!

数据是数字经济时代的基础性资源和战略性资源,也是重要的生产力。

https://static001.geekbang.org/infoq/de/ded7d3f36499ed98a5151e84d89cc19a.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何快速构建企业级数据湖仓?

本文整理自火山引擎开发者社区技术大讲堂第四期演讲,主要介绍了数据湖仓开源趋势、火山引擎 EMR 的架构及特点,以及如何基于火山引擎 EMR 构建企业级数据湖仓。

https://static001.geekbang.org/infoq/6b/6b2aba9b85e9ee18f3255cca0829568c.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

湖仓一体电商项目(十):业务实现之编写写入 DWD 层业务代码

用户头像
Lansonli
2022-11-15

DWD层数据主要存储干净的明细数据,这里针对ODS层“KAFKA-ODS-TOPIC”数据编写代码进行清洗写入对应的Kafka topic和Iceberg-DWD层中。代码功能中有以下几点重要方面:

https://static001.geekbang.org/infoq/57/571591afa15b3ca0ed761c97daed56c7.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

网易传媒基于 Arctic 的低成本准实时计算实践

用户头像
网易数帆
2022-11-09

Arctic 能相对较好地支持与服务于流批混用的场景,其开放的叠加式架构,可以帮助我们非常平滑地过渡与实现 Hive 到数据湖的升级改造,且由于传媒离线数仓已接入有数,通过 Arctic 来改造现有业务的成本较低

https://static001.geekbang.org/infoq/cb/cb9fac1401bc2c6cd88b5ae00aec99ff.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

湖仓一体电商项目(五):内网穿透工具 - 网云穿

用户头像
Lansonli
2022-11-09

一般开发完成接口部署后可以在本地使用localhost或者127.0.0.1来访问,在同一个局域网内的机器也可以通过访问局域网IP来实现接口访问,但是外网无法直接访问,我们需要使用腾讯云图来访问局域网内开发的接口,这就需要用到内网穿透工具,内网穿透工具可以让我

https://static001.geekbang.org/infoq/5f/5f00e926071926b1de4c8f8a8f4326df.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

湖仓一体电商项目(四):项目数据种类与采集

用户头像
Lansonli
2022-11-09

实时数仓项目中的数据分为两类,一类是业务系统产生的业务数据,这部分数据存储在MySQL数据库中,另一类是实时用户日志行为数据,这部分数据是用户登录系统产生的日志数据。

https://static001.geekbang.org/infoq/ef/ef34db738b9bd4e7dcebc31da07721c7.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

字节跳动基于 Doris 的湖仓分析探索实践

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

数据平台发展史 - 从数据仓库数据湖到数据湖仓

回顾数据平台发展历史,梳理数据平台变迁脉络,更全面准确地理解数据仓库数据湖和数据湖仓!

https://static001.geekbang.org/infoq/9a/9a5b66dca6b05038d882451b151e242c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于 Hudi 的湖仓一体技术在 Shopee 的实践

湖仓一体(LakeHouse)作为大数据领域的重要发展方向,提供了流批一体和湖仓结合的新场景。目前,企业许多业务中会遇到的数据及时性、准确性,以及存储的成本等问题,都可以通过湖仓一体方案得到解决。

Apache Hudi X Apache Kyuubi,中国移动云湖仓一体的探索与实践

用户头像
网易数帆
2022-09-06

本文主要介绍移动云云原生大数据分析LakeHouse的整体架构、核心功能、关键技术点,以及在公有云/私有云的应用场景。

https://static001.geekbang.org/infoq/99/9989bbb202ffbca13f1331e21fa353bf.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

提速 10 倍!深度解读字节跳动新型云原生 Spark History Server

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群

https://static001.geekbang.org/infoq/58/58df9336d6282796215d1327ca9bf924.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

B 站基于 Iceberg+Alluxio 助力湖仓一体项目落地实践

用户头像
Alluxio
2022-08-24

本期分享的题目是B站基于Iceberg + Alluxio 助力湖仓一体项目落地实践,内容包含诸多技术细节

从 Delta 2.0 开始聊聊我们需要怎样的数据湖

用户头像
网易数帆
2022-08-10

盘点行业内近期发生的大事,Delta 2.0 的开源是最让人津津乐道的,尤其在 Databricks 官宣 delta2.0 时抛出了下面这张性能对比,颇有些引战的味道。

数据湖系列之一 | 你一定爱读的极简数据平台史,从数据仓库、数据湖到湖仓一体

用户头像
Baidu AICLOUD
2022-07-01

一套数据平台等式,洞察数据仓库、数据湖、湖仓一体发展历史。全文八卦、干货、观点穿插其中,一口气读完不费力。

https://static001.geekbang.org/infoq/e8/e87514b23a788926c76c891e4317da2d.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

使用 LakeSoul 构建实时机器学习样本库

用户头像
Geek_a02d1e
2022-06-02

LakeSoul 是数元灵研发并开源的流批一体表存储框架。本文以实时机器学习样本库场景为落地案例,带大家探索体验使用 LakeSoul 强大的流批一体入湖能力解决实际业务痛点。

https://static001.geekbang.org/infoq/c1/c1c4d4192a90e13aaf386e90d020a3a3.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数栈在湖仓一体上的探索与实践

用户头像
袋鼠云数栈
2022-04-01

导读:市场发展催生的数据管理需求一直是数据技术革新的动力。比如数据仓库如何存储不同结构的数据?数据湖又如何避免因为缺乏治理导致的数据杂乱现象?今天的文章想跟大家具体聊聊数栈如何解决这些问题。

https://static001.geekbang.org/infoq/8d/8d3db94a95bccb6110d4ea044a90a0b5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

揭秘字节跳动云原生 Spark History 服务 UIService

在字节跳动内部,我们实现了一套全新的云原生 Spark History 服务—— UIService,相比开源的 SHS,UIService 存储占用和访问延迟均降低 90% 以上。

湖仓一体天花板,大数据一站式 SQL 分析技术实践

摘要:本文将详细阐述HetuEngine在实现一站式SQL分析所面临的挑战、技术架构和案例。

湖仓一体_湖仓一体技术文章_InfoQ写作社区