写点什么

上天入地 Hadoop——使用高性能分布式技术完成大数据处理任务

作者:程序猿阿宇
  • 2022 年 7 月 30 日
  • 本文字数:475 字

    阅读完需:约 2 分钟

上天入地Hadoop——使用高性能分布式技术完成大数据处理任务

本书以大数据处理系统的三大关键要素——“存储”、“计算" 和“容错”为起点,深入浅出地介绍了如何使用 Hadoop 这一高性能分布式技术完成大数据处理任务。

此书不仅包含了使用 Hadoop 进行大数据处理的实践性知识和示例,还以图文并茂的形式系统性地揭示了 Hadoop 技术组中关键组件的运行原理和优化手段,为读者进一步提升 Hadoop 使用技巧和运行效率提供了颇具价值的参考。


本书共 10 章,涉及的主题包括大数据处理概念、基于 Hadoop 的大数据处理框架、MapReduce 计算模式、使用 HDFS 存储大数据、HBase 大数据库、大数据的分析处理、Hadoop 环境下的数据整合、Hadoop 集群的管理与维护、基于 MapReduce 的数据挖掘实践及面向未来的大数据处理技术。最后附有一个在 Windows 环境下搭建 Hadoop 开发及调试环境的参考手册。

内容展示

第 1 章大数据处理概论



第 2 章基于 Hadoop 的大数据处理框架




第 3 章 MapReduce 计算模式




第 4 章使用 HDFS 存储大数据




第 5 章 HBase 大数据库




第 6 章大数据的分析处理



第 7 章 Hadoop 环境下的数据整合



第 8 章 Hadoop 集群的管理与维护



第 9 章基于 MapReduce 的数据挖掘



第 10 章面向未来的大数据处理



附录基于 Cygwin 的 Hadoop 环境搭建



领取方式:yxqbkd,

用户头像

还未添加个人签名 2022.02.18 加入

还未添加个人简介

评论

发布
暂无评论
上天入地Hadoop——使用高性能分布式技术完成大数据处理任务_大数据_程序猿阿宇_InfoQ写作社区