写点什么

HiveQL 分析

用户头像
天天向上
关注
发布于: 2020 年 12 月 13 日

分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

INSERT OVERWRITE TABLE pv_users
SELECT pv.pageid, u.age
FROM page_view pv
JOIN user u
ON (pv.userid = u.userid);

page_view 表和 user 表结构与数据示例如下





  • map 函数的输入

page_view和user表的所有记录



  • map 函数的输出

page_view表经过map阶段之后的输出,key为userid,value为<表编号,pageid>



user表经过map阶段之后的输出,key为userid,value为<表编号,age>



  • reduce 函数的输入

map的输出经过shuffle之后reduce函数的输入,如下图



  • reduce 函数的输出



用户头像

天天向上

关注

还未添加个人签名 2018.09.20 加入

还未添加个人简介

评论

发布
暂无评论
HiveQL分析