真狠!涵盖了 Netty+Spark+Hadoop+ 分布式五部分!讲的清清楚楚!
一、Hadoop 实战
Hadoop 是 Apache 软件基金会旗下的一一个开源分布式计算平台。以 Hadoop 分布式文件系统(HDFS,Hadoop Distributed Filesystem)和 MapReduce ( Google MapReduce 的开源实现)为核心的 Hadoop 为用户提供了系统底层细节透明的分布式基础架构。HDFS 的高容错性、高伸缩性等优点允许用户将 Hadoop 部署在低廉的硬件上,形成分布式系统;
MapReduce 分布式编程模型允许用户在不了解分布式系统底层细节的情况下开发并行应用程序。所以用户可以利用 Hadoop 轻松地组织计算机资源,从而搭建自己的分布式计算平台,并且可以充分利用集群的计算和存储能力,完成海量数据的处理。
而本书是一本系统且极具实践指导意义的 Hadoop 工具书和参考书。内容全面,对 Hadoop 整个技术体系进行了全面的讲解,不仅包括 HDFS 和 MapReduce 这两大核心内容,而且还包括 Hive、HBase、Mahout、Pig、 ZooKeeper、 Avro、 Chukwa 等与 Hadoop 相关的子项目的内容。实战性强,为各个知识点精心设计了大量经典的小案例,易于理解,可操作性强。
目录
Haoop 简介
Hadoop 的安装与配置
Haoop 应用案例分析
MapReduce 计算模型
开发 MapReduce 应用程序
MapRe duce 应用案例
MapRe duce.工作机制
Hadoop I/0 操作
HDFS 详解
Hadoop 的管理
Hive 详解
HBase 详解
Mahout 详解
Pig 详解
Zooeeper 详解
Avro 详解
Chulkv a 详解
Hadoop 的常用插件与开发
二、Spark 大数据分析实战
Spark 大数据技术还在如火如荼地发展,Spark 中国峰会的召开,各地 meetup 的火爆举行,开源软件 Spark 也因此水涨船高,很多公司已经将 Spark 大范围落地并且应用。Spark 使用者的需求已经从最初的部署安装、运行实例,到现在越来越需要通过 Spark 构建丰富的数据分析应用。写一本 Spark 实用案例类的技术书籍,是-一个持续了很久的想法。由于工作较为紧张,最初只是将参与或学习过的 Spark 相关案例进行总结,但是随着时间的推移,最终还是打算将其中通用的算法、系统架构以及应用场景抽象出来,并进行适当简化,也算是一种总结和分享。
目录
Spark 简介
Spark 开发与环境配置程序
BDAS 简介
Lamda 架构日志分析流水线
基于云平台和用户日志的推荐系统
Twitter 情感分析
热点新闻分析系统
构建分布式的协同过滤推荐系统
基于 Sparl 的社交网络分析
基于 Spark 的大规模新闻主题分析
构建分布式的搜索引擎
三、Hbase
HBase 是- -种 NoSQL 存储系统,专门设计用来快速随机读写大规模数据。HBase 运行在普通商用服务器上,可以平滑扩展,以支持从中等规模到数十亿行、数百万列的数据集。.
本书是一本基于经验提炼而成的指南,它教给读者如何运用 HBase 设计、搭建及运行大数据应用系统。全书共分为 4 个部分。前两个部分分别介绍了分布式系统和大规模数据处理的发展历史,讲解 HBase 的基本原理模式设计以及如何使用 HBase 的高级特性;第三部分通过真实的应用和代码示例以及支持这些实践技巧的理论知识,进一步探索 HBase 的一些实用技术;第四部分讲解如何把原型开发系统升级为羽翼丰满的生产系统。
目录
第一部分 HBase 基础
HBase 介绍
入门
分布式的 Base 、HDFS 和 MapReduce
第二部分高级概念
HBase 表设计
使用协处理器扩展 iBase
其他的 HBase 客 户端选择
第三部分应用系统实例
通过实例学习 HBase: OpenTSDB
在 HBase 上查询地理信息系统
第四部分让 HBase 运转起来
部署 IBase
运维
麻烦一键三连之后看下图小助理的 vx:bjmsb2019 或者 vx:1249448307 即可!
四、分布式服务架构原理、设计与实战
本书以当前流行的分布式服务架构为主线,讲解了分布式服务架构的原理、设计与实践。
本书首先介绍了分布式服务架构的背景和演化,然后深入阐述了保证分布式服务的一-致性、 高性能、高可用性等的设计思想和可实施的方案;然后介绍了大规模、高并发线上服务的应急流程和技术攻关过程,并给出了发现和定位问题的有效、常用工具集;最后详细介绍了分布式服务架构中容器化过程分析、敏捷开发和上线的工具,为从事高并发服务架构的开发人员提供了便利
目录
分布式微服务架构设计原理
彻底解决分布式系统一致性的问题
服务化系统容量评估和性能保障
大数据日志系统的构建
基于调用链的服务治理系统的设计与实现
Java 服务的线上应急和技术攻关
服务的容器化过程
敏捷开发 2.的自动化工具
五、Netty 实战原理
Netty 是一款用于快速开发高性能的网络应用程序的 Java 框架。它封装了网络编程的复杂性,使网络编程和 Web 技术的最新进展能够被比以往更广泛的开发人员接触到。Netty 不只是一个接口和类的集合;它还定义了一种架构模型以及一套丰富的设计模式。但是直到现在,依然缺乏一个全面的、系统性的用户指南,已经成为入门 Netty 的一个障碍,这种情况也是本书旨在改变的。除了解释该框架的组件以及 API 的详细信息之外,本书还会展示 Netty 如何能够帮助开发人员编写更高效的、可复用的、可维护的代码。
目录
第一部分 Netty 的概念及体系结构
Netty--异步和事件驱动
你的第一款 Hetty 应用程序
Netty 的组件和设计
传输
ByteBuf
ChannelHandler 和 ChannelPipeline
EventLoop 和线程模型
引导
单元测试
第二部分编解码器
编解码器框架
预置的 ChannelHandl er 和编解码器
第三部分网络协议
WebSocket
使用 VDP 广播事件
第四部分案例研究
案例研究,第一部分
案例研究,第二部分
这些互联网行业十分火、热门的 PDF 小编已经为大家整理好了,
麻烦一键三连之后看下图小助理的 vx:bjmsb2019 或者 vx:1249448307 即可!
评论