写点什么

mapreduce

0 人感兴趣 · 47 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/16/16ade6bf7562e17e3f6aedbfd0e01283.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

MapReduce 作业生命周期

MapReduce作业作为一种分布式应用程序,可直接运行在Hadoop资源管理系统YARN之上(MapReduce On YARN)。每个MapReduce应用程序由一个MRAppMaster以及一系列MapTask和ReduceTask构成,它们通过ResourceManager获得资源,并由NodeManager启动运行。

https://static001.geekbang.org/infoq/9f/9f79347afebc4259d61717f2ab089eee.gif?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

在 Hadoop 环境里面统计西游记文章的词组(hdfs 实验)

用户头像
王小王-123
2022-06-29

在Hadoop的环境里面我们测试一个文件,对西游记这个书籍里面的所有词语,进行统计排序。hadoop包括两个核心组成:HDFS:分布式文件系统,存储海量的数据MapReduce:并行处理框架,实现任务分解和调度。

开发一个不需要重写成 Hive QL 的大数据 SQL 引擎

开发一款能支持标准数据库SQL的大数据仓库引擎,让那些在Oracle上运行良好的SQL可以直接运行在Hadoop上,而不需要重写成Hive QL。

带你了解极具弹性的 Spark 架构的原理

相比MapReduce僵化的Map与Reduce分阶段计算相比,Spark的计算框架更加富有弹性和灵活性,运行性能更佳。

不 care 工具,在大数据平台中 Hive 能自动处理 SQL

有没有更简单的办法,可以直接将SQL运行在大数据平台?

坐实大数据资源调度框架之王,Yarn 为何这么牛

Yarn的出现伴随着Hadoop的发展,使Hadoop从一个单一的大数据计算引擎,成为大数据的代名词。

https://static001.geekbang.org/infoq/26/2669016f6f4c8e8832a9c16990449d16.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

MapReduce 学习思考

用户头像
en
2022-04-04

MapReduce是我最近知晓的一个编程模型,简单学习了一下,发现它的设计思路和之前Rob Pike演讲的go语言并发模式还有一点异曲同工之妙,所以在此整理归纳一下。

大数据培训 hive 和 mapreduce 的区别

用户头像
@零度
2022-03-23

​考虑到维护的成本的增大,慢慢的开始准备将MR的作业,逐渐的移植到一些脚本平台上去,hive成了我们的首选_大数据培训。

https://static001.geekbang.org/infoq/60/608778d210ce6b4290568a810dbb25c3.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Map-Reduce 思想在 ABAP 编程中的一个实际应用案例

用户头像
Jerry Wang
2022-03-18

Map-Reduce 是一种编程模型和相关实现,用于在集群上使用并行分布式算法,生成和处理大规模数据集。ABAP 编程语言从语言层面支持对大规模数据的 REDUCE 操作。本文分享了笔者工作中使用Map-Reduce思路处理大规模数据集的一个实际案例,希望能给大家带来启发。

Hadoop 中 mapreduce 作业日志是如何生成的

摘要:本篇博客介绍了hadoop中mapreduce类型的作业日志是如何生成的。主要介绍日志生成的几个关键过程,不涉及过多细节性的内容。

Hadoop 学习过程中遇到的错误及解决方法

用户头像
阿丞
2021-12-28

在自己学习搭建并使用Hadoop集群的时候,遇到的一些错误及解决方法。

MapReduce 示例:减少 Hadoop MapReduce 中的侧连接

摘要:在排序和reducer 阶段,reduce 侧连接过程会产生巨大的网络I/O 流量,在这个阶段,相同键的值被聚集在一起。

https://static001.geekbang.org/infoq/6f/6fa13c501de472b158bd5b0119774fc2.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

Spark 必读!总有一些 Spark 知识点你需要知道

一文梳理 Spark 必知必会知识点既可以快速对 Spark 有个简单清晰的认知;也可以回顾 Spark 基础概念和原理;还可以进行知识点查缺补漏。

云小课|MRS 基础原理之 ClickHouse 组件介绍

阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说)、深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云。更多精彩内容请单击此处。

MapReduce 排序以及序列化实践

序列化(Serialization)是指把结构化对象转化为字节流。

https://static001.geekbang.org/infoq/24/243acf13475ad61cc92837d92b08b722.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

腾讯云 EMR 基于 YARN 针对云原生容器化的优化与实践

HADOOP资源调度器YARN在容器环境中能多有效率?

https://static001.geekbang.org/infoq/29/2942095ecc9aefda5e10f385e171ddcd.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

MapReduce 排序以及序列化

序列化(Serialization)是指把结构化对象转化为字节流。

https://static001.geekbang.org/infoq/1e/1ed4815548718a63507fb8e744dd215d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

MapReduce 的运行机制详解

整个Map阶段流程大体如上图所示。

12 周架构

用户头像
FreeOcean
2021-02-12

大数据概要总结

https://static001.geekbang.org/infoq/71/71dae3826e559ebc0b9688c2bec3efbf.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

MapReduce 练习案例 4 - 求共同好友

用户头像
小马哥
2021-01-29

大数据专栏系列文章: 通过该文章, 学会使用MapReduce模型灵活编程.

https://static001.geekbang.org/infoq/b7/b7bf560239f33eca19c06de4fbfd653f.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据知识专栏 - MapReduce 的自定义分组求 TopN

用户头像
小马哥
2021-01-28

大数据专栏系列文章: 通过该文章, 教会如何在 MapReduce 中使用自定义分组技术求取TopN.

https://static001.geekbang.org/infoq/5a/5a0051cf8c7f5881d51d478fd4a2db75.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

MapReduce 博文体系

用户头像
小马哥
2021-01-26

本文是对MapReduce知识体系的归纳总结, 形成指向各篇MapReduce文章的博文链接, 个人学习总结, 欢迎交流

https://static001.geekbang.org/infoq/8b/8b6e2d94c8c4669b5ae654ea5d6a981d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

MapReduce 练习案例 3 - 自定义分区

用户头像
小马哥
2021-01-26

大数据知识专栏, 通过系列文章, 总结大数据知识 ; 本篇文章作用: 练习 MapReduce 的自定义分区.

https://static001.geekbang.org/infoq/97/97fac923fea9c6b5444224553aecc6a0.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

MapReduce 练习案例 2 - 自定义排序

用户头像
小马哥
2021-01-26

大数据知识专栏, 通过系列文章, 总结大数据知识; 本篇文章作用: 练习MapReduce的自定义排序.

https://static001.geekbang.org/infoq/44/44ab02439870caef0fc686525aac4d7e.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

MapReduce 练习案例 1- 统计求和

用户头像
小马哥
2021-01-26

大数据知识专栏, 通过系列文章, 总结大数据知识; 本篇文章作用: 练习MapReudce统计求和.

https://static001.geekbang.org/infoq/c0/c045440f5d71d210599cc068292e400d.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据知识专栏 - MapReduce 的 Map 端 Join

用户头像
小马哥
2021-01-22

大数据专栏系列文章: 通过该文章, 教会如何在 MapReduce 中使用 Map 端 Join.

https://static001.geekbang.org/infoq/17/1729e33e6a89f0313d1b159252b2273e.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据知识专栏 - MapReduce 的 Reduce 端 Join

用户头像
小马哥
2021-01-21

大数据专栏系列文章: 通过该文章, 教会你什么是MapReduce的Reduce端Join.

https://static001.geekbang.org/infoq/68/682878614af14b294609db026c907e06.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据知识专栏 - MapReduce 的 Combiner 实现 shuffle 调优

用户头像
小马哥
2021-01-20

大数据专栏系列文章: 本节内容教会你你如何通过 MapReduce 的自定义Combiner技术, 实现对MapReduce的shuffle过程调优.

https://static001.geekbang.org/infoq/a4/a4b3b2b05384515b991f64146fccb03b.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据知识专栏 -MapReduce 自定义排序技术

用户头像
小马哥
2021-01-20

大数据专栏系列文章: 今天告诉你如何通过MapReduce的排序技术, 来实现对数据的任意顺序输出.

https://static001.geekbang.org/infoq/49/495b2d38bbb10c5d957c8ea997de8ac1.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

大数据知识专栏 -MapReduce 自定义计数器技术

用户头像
小马哥
2021-01-20

大数据专栏系列文章: 今天告诉你如何通过玩转 MapReduce 计数器技术, 观察MR任务的执行

mapreduce_mapreduce技术文章_InfoQ写作社区
vConsole