写点什么

Week 12 作业

用户头像
evildracula
关注
发布于: 2021 年 01 月 10 日

分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

INSERT OVERWRITE TABLE pv_usersSELECT pv.pageid, u.ageFROM page_view pv   JOIN user u   ON (pv.userid = u.userid);
复制代码



Map 输出

page_view map: key={userid}, value=<tableId=1, pageId>

user map:key={userid}, value={tableId=2, age>


Shuffle Sort,按 Key 归类,作为 Reduce 输入

111, <1, 1>

111, <1, 2>

111, <2, 25>

222, <1, 1>

222, <2, 32>


最后 pv_users Reduce 的输出为:

1, 25

2, 25

1, 32


发布于: 2021 年 01 月 10 日阅读数: 12
用户头像

evildracula

关注

还未添加个人签名 2019.07.29 加入

还未添加个人简介

评论

发布
暂无评论
Week 12 作业