湖仓一体
0 人感兴趣 · 25 次引用
- 最新
- 推荐
支持多模型数据分析探索的存算分离湖仓一体架构解析(下)
当企业需要建设独立的数据仓库系统来支撑BI和分析业务时,有了“数据湖+数据仓库”的混合架构。但混合架构带来了更高的建设成本、管理成本和业务开发成本。
支持多模型数据分析探索的存算分离湖仓一体架构解析(上)
当企业需要建设独立的数据仓库系统来支撑BI和业务分析业务时,有了“数据湖+数据仓库”的混合架构。但混合架构带来了更高的建设成本、管理成本和业务开发成本。


如何快速构建企业级数据湖仓?
本文整理自火山引擎开发者社区技术大讲堂第四期演讲,主要介绍了数据湖仓开源趋势、火山引擎 EMR 的架构及特点,以及如何基于火山引擎 EMR 构建企业级数据湖仓。

湖仓一体电商项目(十):业务实现之编写写入 DWD 层业务代码
DWD层数据主要存储干净的明细数据,这里针对ODS层“KAFKA-ODS-TOPIC”数据编写代码进行清洗写入对应的Kafka topic和Iceberg-DWD层中。代码功能中有以下几点重要方面:

网易传媒基于 Arctic 的低成本准实时计算实践
Arctic 能相对较好地支持与服务于流批混用的场景,其开放的叠加式架构,可以帮助我们非常平滑地过渡与实现 Hive 到数据湖的升级改造,且由于传媒离线数仓已接入有数,通过 Arctic 来改造现有业务的成本较低

湖仓一体电商项目(五):内网穿透工具 - 网云穿
一般开发完成接口部署后可以在本地使用localhost或者127.0.0.1来访问,在同一个局域网内的机器也可以通过访问局域网IP来实现接口访问,但是外网无法直接访问,我们需要使用腾讯云图来访问局域网内开发的接口,这就需要用到内网穿透工具,内网穿透工具可以让我

湖仓一体电商项目(四):项目数据种类与采集
实时数仓项目中的数据分为两类,一类是业务系统产生的业务数据,这部分数据存储在MySQL数据库中,另一类是实时用户日志行为数据,这部分数据是用户登录系统产生的日志数据。

基于 Hudi 的湖仓一体技术在 Shopee 的实践
湖仓一体(LakeHouse)作为大数据领域的重要发展方向,提供了流批一体和湖仓结合的新场景。目前,企业许多业务中会遇到的数据及时性、准确性,以及存储的成本等问题,都可以通过湖仓一体方案得到解决。
数据湖系列之一 | 你一定爱读的极简数据平台史,从数据仓库、数据湖到湖仓一体
一套数据平台等式,洞察数据仓库、数据湖、湖仓一体发展历史。全文八卦、干货、观点穿插其中,一口气读完不费力。

使用 LakeSoul 构建实时机器学习样本库
LakeSoul 是数元灵研发并开源的流批一体表存储框架。本文以实时机器学习样本库场景为落地案例,带大家探索体验使用 LakeSoul 强大的流批一体入湖能力解决实际业务痛点。
湖仓一体天花板,大数据一站式 SQL 分析技术实践
摘要:本文将详细阐述HetuEngine在实现一站式SQL分析所面临的挑战、技术架构和案例。