好书推荐 -- 大数据日知录(深入理解大数据的必备书籍)附电子版下载
今天给大家推荐一本大数据领域中必读的一本书,名字叫《大数据日知录-架构与算法》
大数据日知录
这本书正如它封面中介绍的一样,全面梳理大数据相关技术,从数据、算法、策略、应用和系统架构等多个维度进行剖析,既包罗万象,又深入浅出。
这本书详细介绍了我们所使用的大数据组件的底层原理及实现算法。
像 Flink 中非常重要的分布式一致性协议,使用的是两阶段提交协议,这本书中就详细介绍了两阶段提交协议的原理,如下为书中截图:
两阶段提交协议
还有像比特币中用来进行交易验证的 Merkle 树,书中也有详细介绍,Merkle 树在亚马逊的 Dynamo 数据库中也有广泛应用
Merkle树
在 Hive 中常用 orc 格式 + snappy 压缩是比较常用的存储加压缩格式,书中也有详细介绍压缩算法 Snappy
snappy算法
书中还有很多大数据组件底层算法及原理,就不一一举例了
给大家截取部分目录看下
目录
目录
目录
这本书非常值得读一读,有兴趣的同学建议买一本实体书
因此处不易放链接,如果你想看电子版,可以搜索公众号:五分钟学大数据,或直接扫描下方二维码,对话框发送 大数据日知录 即可获取此书电子版
公众号:五分钟学大数据
评论