元数据
1 人感兴趣 · 40 次引用
- 最新
- 推荐
云原生文件存储 CFS 线性扩展到千亿级文件数,百度沧海·存储论文被 EuroSys 2023 录用
论文介绍了百度智能云 CFS 文件存储元数据系统的核心设计,对长期困扰文件系统元数据领域的 POSIX 兼容性和高扩展性(特别是写扩展性)难以兼顾的问题,进行了解答。
火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0 (Ⅵ)
以下为ByteHouse技术白皮书【核心技术解析——元数据】版块摘录。
数据湖系列之二 | 打造无限扩展的云存储系统,元数据存储底座的设计和实践
TafDB 是面向元数据场景设计的一个分布式数据库系统。作为百度沧海·存储统一的元数据底座,TafDB 支撑了百度智能云对象存储 BOS 和文件存储 CFS 的元数据存储,提供了万亿级别元数据规模、千万级别 QPS 的元数据存储能力。
自动化元数据管理的“七宗最”?
1、数据质量:有了自动化,数据质量得到了系统的保证,数据管道被无缝地治理和操作,使所有涉众受益。实时识别集成数据源或目标内的数据问题和不一致性,通过增加洞察或修复的时间来提高整体数据质量。在企业兼并重组过程中,为现有结构的定期维护映射、移动
你可能不知道,自动化元数据管理的“七宗最”?
1、数据质量:有了自动化,数据质量得到了系统的保证,数据管道被无缝地治理和操作,使所有涉众受益。实时识别集成数据源或目标内的数据问题和不一致性,通过增加洞察或修复的时间来提高整体数据质量。在企业兼并重组过程中,为现有结构的定期维护映射、移动
面向大数据存算分离场景的数据湖加速方案
数据湖的存算分离,优势和挑战并存。其中的关键技术有哪些,如何选择合适的的解决方案,推荐大家读一读这篇文章。
什么是主动元数据?为什么 Gartner 预测它是元数据管理的新方向
导读:Gartner用主动元数据市场指南取代元数据管理魔力象限,预示着什么?到底什么主动元数据管理?欢迎聪明的读者自己去文中探索。
HDFS 细粒度锁优化,FusionInsight MRS 有妙招
华为云FusionInsight MRS通过FGL对HDFS NameNode锁机制进行优化,有效提升了NameNode的读写吞吐量,从而能够支持更多数据,更多业务请求访问,从而更好的支撑政企客户高效用数,业务洞见更准,价值兑现更快。
浅析 Alluxio 元数据管理的实现原理
“ Alluxio 是世界上第一个用于云分析和人工智能的开源数据编排技术。本文主要介绍了Alluxio元数据管理的两种方案及其实现原理。”
白话大数据 | 元宇宙来了,但是你了解元数据吗?
元数据是对数据的描述,采集企业环境中的各类元数据并统一存储,通过分析元数据,根据业务维度、系统维度等不同维度对数据分类,并梳理出数据和数据之间的关系,让企业不同的员工都能方便地看到自己关心的数据情况,使大数据不再 “暗无天日”。