写点什么

Apache Spark

0 人感兴趣 · 6 次引用

  • 最新
  • 推荐

Apache Spark + 海豚调度:PB 级数据调度挑战,教你如何构建高效离线工作流

2010年,我国进入移动互联网,数据规模成几何式增长。在大数据开源技术领域,以Hadoop为核心的大数据生态系统面对海量数据也不断发展与迭代,大数据处理流程中的各个开源组件,也一起开启了狂飙突进的大数据时代,推动整个行业开启了数字化变革之路。

Apache Kyuubi 在小米大数据平台的应用实践

用户头像
网易数帆
2022-09-02

导读:今天分享的主题是《Kyuubi 在小米大数据平台的应用实践》,主要分为四部分内容:

看 CarbonData 如何用四招助力 Apache Spark

摘要:CarbonData 在 Apache Spark 和存储系统之间起到中介服务的作用,为 Spark 提供的4个重要功能。

https://static001.geekbang.org/infoq/ef/efdc4028b46dfb48c3193830edbfe613.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Java 开发 Spark ELT 实践(一)

用户头像
团子粑粑
2020-07-28

Java开发Spark多种异构数据源之间的同步

https://static001.geekbang.org/infoq/e3/e38e6a80e0572504ce44bde0e186e718.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

半小时,将你的 Spark SQL 模型变为在线服务

用户头像
范式AI云
2020-07-08

第四范式已经在很多行业落地了上万个AI应用,比如在金融行业的反欺诈,媒体行业的新闻推荐,能源行业管道检测,而SparkSQL在这些AI应用中快速实现特征变换发挥着重要的作用

Apache Spark 有哪些局限性

用户头像
奈学教育
2020-06-11

Apache Spark是行业中流行和广泛使用的大数据工具之一。Apache Spark已成为业界的热门话题,并且如今非常流行。但工业正在转移朝向apache flink。

Apache Spark_Apache Spark技术文章_InfoQ写作社区