架构师训练营第十二周作业 1
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么
INSERT OVERWRITE TABLE pv_users
SELECT pv.pageid, u.age
FROM page_view pv
JOIN user u
ON (pv.userid = u.userid);
第一个 page_view 表的 Map 函数的输入是表的数据记录,输出 key:value 是 userid:<表名,pageid>
第二个 user 表的 map 函数输入表的数据记录,输出 key:value 是 userid:<表名,age>
Reduce 函数输入 key:value 是 userid:表一的 pageid 或者表二的的 age。
输出 key:value 是 pageid:age
评论