架构师训练营作业

用户头像
qihuajun
关注
发布于: 2020 年 09 月 02 日

分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

INSERT OVERWRITE TABLE pv_users
SELECT pv.pageid, u.age
FROM page_view pv
JOIN user u
ON (pv.userid = u.userid);





map有两组,第一组读取pv表的的输入是pageid、userid、 time,输出是userid、pageid、time, 第二组读取user表的输入是userid、age、gender,输出也是userid、age、gender。 Reduce端的输入是上面的两组输出,输出是pageid、age。

用户头像

qihuajun

关注

还未添加个人签名 2009.05.15 加入

还未添加个人简介

评论 (1 条评论)

发布
用户头像
作业请添加“极客大学架构师训练营”标签,便于分类
2020 年 09 月 03 日 10:29
回复
没有更多了
架构师训练营作业