写点什么

数据架构

0 人感兴趣 · 22 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/fe/fe49427dbe8349ad156aa0b40802cca1.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从数据仓库到数据结构:数据架构的演变之路

在上个世纪,从电子商务巨头到医疗服务机构和政府部门,数据已成为每家组织的生命线。有效地收集和管理这些数据可以为组织提供宝贵的洞察力,以帮助决策,然而这是一项艰巨的任务。

https://static001.geekbang.org/infoq/09/09eef2aebb7ee37b1430a3f686902db0.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

RisingWave 1.0 版本正式发布!

2023 年 7 月 12 日,开源分布式流处理数据库项目 RisingWave 发布正式版:RisingWave 1.0。

https://static001.geekbang.org/infoq/28/28c46b424ff6171656b56b0db9cc0782.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

【专栏 03】数据仓库、数据集市、数据湖,你的企业更适合哪种数据管理架构?

建设企业级数据平台,首先需要了解企业数据,确认管理需求,并选择一个数据管理架构。那么面对纷繁复杂的数据来源,多元化的数据结构,以及他们的管理使用需求,企业数据平台建设该从何处入手呢?哪个数据管理架构适合自己的企业呢?

https://static001.geekbang.org/infoq/85/8552c8aeadde0b71aa3dc16323393dea.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

火山引擎 DataLeap:一家企业,数据体系要怎么搭建?

经过十多年的发展,数据治理在传统行业以及新兴互联网公司都已经产生落地实践。字节跳动也在探索一种分布式的数据治理方式。本篇内容来源于火山引擎超话数据直播活动的回顾。

https://static001.geekbang.org/infoq/1f/1f02dbad5644784bee3b194c0571f8f5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Ventana Research|是时候把指标中台纳入企业数据架构了!

用户头像
Kyligence
2022-09-27

近日,Kyligence 秋季线上论坛成功举办,来自领先的市场研究和咨询机构 Ventana Research 的 David Menninger 发表了主题为 Add a Metrics Store to Your Information Architecture《把指标中台纳入企业数据架构》的演讲,希望对大家有所启发。

https://static001.geekbang.org/infoq/c1/c1db716f32888f4e47eaf43919e94ee6.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Alluxio 为 Presto 赋能跨云的自助服务能力

用户头像
Alluxio
2022-07-29

本文重点介绍两大流行开源项目Alluxio 和 Presto之间的协同作用,并展示如何利用两者实现跨云自助服务数据架构。

https://static001.geekbang.org/infoq/3b/3b0cc1d3d93d0f46be78f49c4884188d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

私藏干货分享:关于企业架构中如何进行平台化

备注:这一篇是来自在自己写的书某些章节删减,在这里并不对文章中所涉及到内容深入展开。  

https://static001.geekbang.org/infoq/7b/7b59d1f520da168e86053dd62da02726.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

百度搜索中台海量数据管理的云原生和智能化实践

用户头像
lecury
2021-12-21

百度搜索中台将搜索核心能力赋能阿拉丁(百度搜索特型结果)、垂直领域搜索、应用内搜索等场景,支撑了数百个检索场景、百亿级内容数据的检索。 我们通过智能化的设计理念,在容量自动调整、数据按需存储等方面取得了效率和成本的显著收益,并通过进阶...

Apache ShardingSphere 在京东白条场景的落地之旅

用户头像
SphereEx
2021-10-14

京东白条使用 Apache ShardingSphere 解决了千亿数据存储和扩容的问题,为大促活动奠定了基础。

https://static001.geekbang.org/infoq/36/36cb20d8348817838dc20916d14adeeb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

小 A 数仓之路:数仓现状与解决方案

用户头像
水滴
2021-08-22

业务增长速度快,数据迅速增加,同时取数需求激增与数据应用场景对数据质量、响应速度、数据时效性与稳定要求越来越高;但技术能力滞后业务增长,如实时数仓技术能力、高可用稳定保障能力、流程规范缺少等;通过梳理数据仓库问题,并针对问题提出解决方案

数仓开发人员经常说的 ETL、ELT,又有什么区别

用户头像
奔向架构师
2021-07-07

昨天看了一个ETL的东西,随手写了一个ETL到底是什么,那知道ETL后,什么是ELT呢?其实很简单,ETL是抽取、转换、装载的缩写,那ETL不就是抽取、加载、转换的缩写吗,但是这俩有什么不一样呢?

数仓开发人员经常说的 ETL,到底是什么

用户头像
奔向架构师
2021-07-06

在日常的数据开发交流过程中,会多次提到ETL一词,初次听到是一头雾水,这些开发人员口中的ETL到底是什么?

数仓分层架构如何设计?

用户头像
奔向架构师
2021-06-22

刚接触数据仓库之前,小白我就有一个疑问,数据仓库为什么分层?

https://static001.geekbang.org/infoq/30/30607de6639fef51f308d2fef087fb20.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据架构:数据冷热分离实践思考

数据冷热分离并不是新的概念,各公司在很早之前就已经开始了落地实践。微软云有冷热blob存储,阿里云有ots,都是为了在云服务层面提供冷热存储的解决方案。尽管有这些工具,如果很好地实现冷热分离,仍然是值得仔细思考和玩味的。

https://static001.geekbang.org/infoq/1d/1dddbb4d7bb6279b0d80c83580764ea9.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据架构:概念与冷热分离

本文介绍了数据架构的概念、意义,以及数据的冷热分离,并阐述了冷热分离方案和注意事项。本篇作为综述,在后续系列文章中会通过实际案例来进一步探究数据架构的内容。

https://static001.geekbang.org/infoq/bc/bce9aa12b3026504f39ad24e50850a37.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

中小型城市商业银行数字化转型实践 (三) 数据中台建设思路和路径

用户头像
泡菜小仙
2020-05-19

数据资产变现能力一直是困扰中小型城市商业银行业务运营转型的关键痛点 中小型商业银行数字化转型 数据中台

https://static001.geekbang.org/infoq/0b/0b8c33655659436546bbd8050c50b89d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据湖引擎是什么鬼

用户头像
数据社
2020-05-09

数据湖引擎是一种开源软件解决方案或云服务,它通过一组统一的api和数据模型为分析工作负载的各种数据源提供关键功能。数据湖引擎解决了快捷访问、加速分析处理、保护和屏蔽数据、管理数据集以及提供跨所有数据源的统一数据目录等方面的关键需求。

数据架构_数据架构技术文章_InfoQ写作社区