写点什么

hive 性能调优实战 - 读书笔记

作者:聚变
  • 2022 年 2 月 27 日
  • 本文字数:290 字

    阅读完需:约 1 分钟

hive性能调优实战-读书笔记

收获

收获 1:看懂 hive 的执行计划


收获 2:hive 性能调优的步骤

性能调优的整体思路如下


收获 3:了解到了 MapReduce 程序的编写案例

收获 4:常见性能问题

问题排查

map 读取文件

reduce 的数据倾斜

shuffle 缓慢:Elapsed Time Shuffle

集群资源限制


数据倾斜

不可拆分大文件引发的数据倾斜:压缩文件可能会很大:用支持拆分的压缩算法

业务无关的数据引发的数据倾斜:排除

多维聚合计算膨胀引发的数据倾斜:

无法削减中间结果的数据量引发的数据倾斜:mapreduce.map.memory.mb 调大

两个 hive 表数据连接时引发的数据倾斜:两个作业分别处理倾斜和没有倾斜的数据


他人笔记

https://www.jianshu.com/p/21ce1cd53cca

https://zhuanlan.zhihu.com/p/399578723

发布于: 刚刚阅读数: 2
用户头像

聚变

关注

还未添加个人签名 2017.10.18 加入

还未添加个人简介

评论

发布
暂无评论
hive性能调优实战-读书笔记