写点什么

大数据 开源

0 人感兴趣 · 49 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/d1/d18f990a4160c3708df3ed1021a7221e.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

实录分享 | Alluxio Operator 一体化部署方案

用户头像
Alluxio
06-25

今天给大家分享的内容是 Alluxio Operator的一体化部署方案。我会将内容分成 4 个部分来给大家讲解。

https://static001.geekbang.org/infoq/cd/cdfc93885cf344aac2d419c536582733.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

SeaTunnel StarRocks 连接器的使用及原理介绍

作者:毕博,马蜂窝数据平台负责人,StarRocks 活跃贡献者 & Apache SeaTunnel 贡献者

粉丝提问:区块链与大数据开发读研方向怎么选?

同学你好,我看到你是研一新生,咨询区块链的研究方向和大数据研究方向哪个好?针对这个问题,先说我的结论,你的这个问题,我不知道怎么去回答,因为这个好的定义,每一个人以及不同的目的背景都是不一样的。比如你未来是想找一份工作,还是继续攻读博士,就

H2 存储内核分析一

用户头像
陈飞
03-27

现在做数据库一般都才有 C/C++ 获取其它编译型的语言,为什么会选择 h2 这种基于 java 的语言?会不会影响效率?其实回答这个问题很简单,无论是用什么语言来实现数据库,其实都是在调用操作系统 IO 的函数。因此仅仅是作为存储的话差别其实是不大的。

https://static001.geekbang.org/infoq/27/275fc7373b6fc50738eb2c7eb31d8752.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

ChatGPT:“Hello Alluxio,我为你写了一首诗!”

用户头像
Alluxio
02-13

新晋“网红”ChatGPT爆火网络,大家都很好奇ChatGPT究竟是什么? 但让小编更好奇的是:它眼中的Alluxio是怎样的?

https://static001.geekbang.org/infoq/1d/1d657127e9f4539208f2876223887ffd.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

非代码的贡献也能成为 Committer,我与 DolphinScheduler 社区的故事

每个人对于”开源社区“的定义都不一样,在社区的想法也完全不一样,我认为玩开源就像”谈恋爱“,要想方设法对它好,在接触 Apache DolphinScheduler 社区之后,我从”非技术“的视角真真实实地感受到了 Apache Way 。

Apache Spark + 海豚调度:PB 级数据调度挑战,教你如何构建高效离线工作流

2010年,我国进入移动互联网,数据规模成几何式增长。在大数据开源技术领域,以Hadoop为核心的大数据生态系统面对海量数据也不断发展与迭代,大数据处理流程中的各个开源组件,也一起开启了狂飙突进的大数据时代,推动整个行业开启了数字化变革之路。

阿里云开源大数据平台 EMR 全面升级 性能最高可提升 6 倍

12月27日,阿里云正式发布云原生开源大数据平台EMR 2.0,升级后的开源大数据平台在成本持平的情况下,扩缩容性能最高可提升6倍。

https://static001.geekbang.org/infoq/21/2104421ed0f65eea497ad38758e0ed19.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从“少林寺”毕业后,我当上了开源社区“区长”

用户头像
Alluxio
01-04

本期名人堂我们有幸邀请到了Alluxio创始成员兼开源社区副总裁范斌先生。范斌先生讲述了自己的求学、工作、加入开源社区的经历,以及对未来十年数据编排发展的展望,和对开发贡献者的一些建议。

https://static001.geekbang.org/infoq/0b/0b96d1d901d367f9dfbb77dc3ae12331.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

直播预约|阿里云 EMR 2.0 重磅发布

面向未来,构建新一代开源大数据基础设施!阿里云EMR 2.0 发布会 将于12月27日14点在线上举办。

https://static001.geekbang.org/infoq/dd/dd2c21b2e75dc1262713d6f1771a5cc8.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据分析架构新变革?Doris Summit 2022 议程首公布!|即刻报名

用户头像
SelectDB
2022-12-20

在数字化转型的大趋势下,“数据”成为新的生产要素已达成共识,如何更好进行数据分析成为了数据价值挖掘的关键手段。而当下大多数企业坐拥海量数据,而因资源限制、原架构冗余、数据难以迁移等问题,导致数据的实时性及准确性无法得到保证,数据的价值也大打

https://static001.geekbang.org/infoq/96/962ba75a43d7a71e2729c04600d78a44.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Kerberos 身份验证在 ChunJun 中的落地实践

用户头像
袋鼠云数栈
2022-12-16

Kerberos,在古希腊神话故事中,指的是一只三头犬守护在地狱之门外,禁止任何人类闯入地狱之中。

https://static001.geekbang.org/infoq/62/62acd5deaa40604e7dae72870503c7f6.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Alluxio 2.9 新版发布 | 重塑架构,支持大规模多租户环境

用户头像
Alluxio
2022-11-21

2022年11月17日,全球首创的开源数据编排软件开发商Alluxio宣布正式发布数据编排平台2.9版本,新版本立即可用。

https://static001.geekbang.org/infoq/28/28f9135f597da9ef251b6be2331ead63.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大咖分享 | 如何构建 Alluxio 审计日志分析系统

用户头像
Alluxio
2022-11-10

大数据技术日新月异,数据湖、数据中台、逻辑数据湖、数据编织、数据编排等数据建设理念不断出现、深化,究其根本依然是如何能够将数据规整起来,以统一的规范对数据的脉络进行梳理,形成统一的视图、统一的标准,实现业务层面的数据治理目标。

https://static001.geekbang.org/infoq/70/704e3567214881bc3ba71d1a3b0c3bca.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Apache Linkis 介绍

用户头像
拾数崽
2022-10-31

Linkis是在底层引擎和上层应用工具之间的一个通用的“计算中间件”的中间层,统一了上层应用工具到底层计算存储引擎的入口(作为大数据平台的统一入口),以标准化可重用的方式处理紧耦合、重复造轮子、扩展难、应用孤岛等计算治理问题。

https://static001.geekbang.org/infoq/97/971f013247bca85f43be6463f6ef365d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

一站式全覆盖数据 I/O 平台 - Alluxio 与 Aunalytics 的完美结合

用户头像
Alluxio
2022-10-26

Presto是开源分布式SQL查询引擎,可以对从GB到PB级大小的数据源进行交互式分析查询。Presto支持Hive、Cassandra、关系型数据库甚至专有数据存储等多种数据源,允许跨源查询。(详见参考[1] )

自主创新、领先一代,星环科技成功登陆科创板

用户头像
星环科技
2022-10-21

10月18日,“国产大数据基础软件”星环信息科技(上海)股份有限公司(简称“星环科技”,证券代码“688031”)在科创板上市,宣告正式开启新征程。

https://static001.geekbang.org/infoq/4f/4f886a9c7e55f64c2df0c697866b8e57.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

精讲数据归档分析 |Data Infra 研究社第四期

用户头像
Databend
2022-09-15

【Data Infra 研究社】来到了我们的第四期活动,本期的内容我们定位在和【数据归档】相关的内容,特邀请了现任数字化零售多点 Dmall 数据库负责人冯光普老师以及 Datafuse Labs 联合创始人&架构师 吴炳锡老师来给大家从多方面出发进行交流,带大家体验云

https://static001.geekbang.org/infoq/2d/2dc8bfd7358df0f68bbf3d0898cbf724.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Databend 特性系列(1)|Databend 数据生命周期

用户头像
Databend
2022-09-15

Databend 是一个使用 Rust 研发、开源、完全面向云架构的新式数仓,提供极速的弹性扩展能力,致力于打造按需、按量的 Data Cloud 产品体验。具备以下特点:

https://static001.geekbang.org/infoq/01/01b8a3829bba8c39a548f0c7f31e6454.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

【联通】数据编排技术在联通的应用

用户头像
Alluxio
2022-09-13

欢迎来到【微直播间】,2min纵览大咖观点,本期分享的题目是数据编排技术在联通的应用。

开源,无禁止即可为

用户头像
Databend
2022-08-31

尽管我们经常说代码贡献并不是唯一的开源贡献方式,参与讨论,Review RFC 也是参与开源的良好途径。但是很多同学仍然会有疑虑:我不是项目的 Maintainer/Committer/Reviewer,我有资格 Review 别人的 PR 吗?本文以我在 envd 中的实践来阐述这样的观点:开

https://static001.geekbang.org/infoq/13/13b4a85b2ae663185b269347f64344f8.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Databend SQL Planner 全新设计

用户头像
Databend
2022-08-30

为了支持复杂的 SQL 查询,并且提供更好的使用体验,我们在最近的几个月里对 Databend 的 SQL planner 进行了大规模的重构。目前重构已经接近尾声,感兴趣的朋友可以通过修改 Databend 的 Session settings

大数据 开源_大数据 开源技术文章_InfoQ写作社区