大数据
286 人感兴趣 · 1931 次引用
- 最新
- 推荐
CSR 格式如何更新? GES 图计算引擎 HyG 揭秘之数据更新
HyG图计算引擎采用CSR格式来存储图的拓扑信息,CSR格式可以将稀疏矩阵的存储空间压缩,进而大大降低图的存储开销,同时具备访问效率高、格式易转化等优点。
Flink 流批一体在 Shopee 的大规模实践
Shopee 研发专家李明昆,在 Flink Forward Asia 2022 流批一体专场的分享。
只需 2 小时,变身 Flink 实战派:Flink-Learning 实战营火热报名中
你想知道今天 GitHub 上炙手可热的 TOP 10 项目是什么吗?
数仓架构“瘦身”,Hologres 5000CU 时免费试用
Hologres基于创新的HSAP架构,可以将您原先数仓架构中的OLAP系统(Greenplum、Presto、Impala、ClickHouse)、KV数据库/Serving系统(HBase、Redis)统一在一个大数据计算引擎中,并提供快速的离线实时一体化分析能力。
MaxCompute 中如何处理异常字符
在处理数据时,当业务数据同步至MaxCompute后,会产生一些含异常字符的脏数据,比如字段中包含了一个不可见字符,在DataWorks中显示不出来,但在BI界面又会显示成其他字符,影响整体观感。这种情况,通常我们的解法是,将异常的字符洗掉。
美团买菜基于 Flink 的实时数仓建设
美团买菜实时数仓技术负责人严书,在 Flink Forward Asia 2022 实时湖仓专场的分享。
揭秘阿里云 Flink 智能诊断利器——Flink Job Advisor
揭秘阿里云 Flink 智能诊断利器——Flink Job Advisor
政务云建设提速,天翼云夯实智慧政务数字底座
5月30日,2023数字政府高质量发展论坛在北京举办,大会聚焦业界关注的政策、技术、应用、标准、发展等议题,邀请政产学研各界共议政府数字化转型之路。现场重磅发布了由中国电信联合中国信息通信研究院云计算与大数据研究所共同撰写的《安全可信政务云一体化
正式启动|2023 中国高校计算机大赛—大数据挑战赛火热报名中!
清华大学「中国高校计算机大赛——大数据挑战赛」火热报名中,20万奖金池,外加清华科研项目实习机会、云智慧绿色招聘通道等丰厚奖励,快来报名参与吧!
一篇文章带你入门 HBase
HBase(Hadoop Database)是一个开源的、分布式的、面向列的NoSQL数据库,它是构建在Hadoop之上的。HBase旨在提供可靠的、高性能的、可扩展的存储和访问大规模数据集的能力。
活动预告|6 月 15 日 Apache Paimon Meetup,深入解读 Apache Paimon 0.4.0 !
活动预告|6月15 日 Apache Paimon Meetup,深入解读 Apache Paimon 0.4.0 !
揭秘阿里云 Flink 智能诊断利器——Fllink Job Advisor
解决用户在使用Flink全托管产品全生命周期中可能遇到的各种难题,提升用户使用Flink的体验,降低对人工服务的依赖。
一份配置轻松搞定表单渲染,配置式表单渲染器在袋鼠云的实现思路与实践
本文将为大家详细介绍配置式表单渲染器在袋鼠云的实现思路与实践,在对接新的数据源时,可以不再关心表单渲染相关问题,从数据源中心新建数据源一直到数据源在数据同步模块的应用,全链路的表单都可以通过配置化的方式解决。
Maxcompute 数据上云一致性比对
当把数据集成到Maxcompute上后,用户其实最关心的一个技术问题就是集成数据是否与源端一致,本文中介绍的一致性方案比对方案是基于阿里云多个大数据项目实际项目交付实践总结。
大数据存储与处理技术探索:Hadoop HDFS 与 Amazon S3 的无尽可能性【上进小菜猪大数据】
上进小菜猪,沈工大软件工程专业,爱好敲代码,持续输出干货。
构建智能电商推荐系统:大数据实战中的 Kudu、Flink 和 Mahout 应用【上进小菜猪大数据】
上进小菜猪,沈工大软件工程专业,爱好敲代码,持续输出干货。
带你走进大数据 | 写给小白的大数据指南
本文将介绍数大数据与数据分析之间的关系,并追溯大数据的发展历史,本文重点内容将介绍大数据有关内容。在当今数字化时代,数据扮演着无比重要的角色。由于硬件设备和软件的发展,产生了海量的数据,挑战着我们处理和理解信息的能力。
5 分钟在 k8s 上可视化搭建 Kylin5
使用CloudEon可以极快地在Kubernetes上搭建Kylin5需要的HDFS、YARN、Hive、Zookeeper等组件