上天入地 Hadoop——使用高性能分布式技术完成大数据处理任务
本书以大数据处理系统的三大关键要素——“存储”、“计算" 和“容错”为起点,深入浅出地介绍了如何使用 Hadoop 这一高性能分布式技术完成大数据处理任务。
此书不仅包含了使用 Hadoop 进行大数据处理的实践性知识和示例,还以图文并茂的形式系统性地揭示了 Hadoop 技术组中关键组件的运行原理和优化手段,为读者进一步提升 Hadoop 使用技巧和运行效率提供了颇具价值的参考。
本书共 10 章,涉及的主题包括大数据处理概念、基于 Hadoop 的大数据处理框架、MapReduce 计算模式、使用 HDFS 存储大数据、HBase 大数据库、大数据的分析处理、Hadoop 环境下的数据整合、Hadoop 集群的管理与维护、基于 MapReduce 的数据挖掘实践及面向未来的大数据处理技术。最后附有一个在 Windows 环境下搭建 Hadoop 开发及调试环境的参考手册。
内容展示
第 1 章大数据处理概论
第 2 章基于 Hadoop 的大数据处理框架
第 3 章 MapReduce 计算模式
第 4 章使用 HDFS 存储大数据
第 5 章 HBase 大数据库
第 6 章大数据的分析处理
第 7 章 Hadoop 环境下的数据整合
第 8 章 Hadoop 集群的管理与维护
第 9 章基于 MapReduce 的数据挖掘
第 10 章面向未来的大数据处理
附录基于 Cygwin 的 Hadoop 环境搭建
领取方式:yxqbkd,
评论