架构师训练营第 1 期 -- 第十二周作业
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
复制代码
page_view 表和 user 表结构与数据示例如下
Map:
输入:即为每个表每行的数据
输出:key: userid
value: 二元组 <表,value>,其中 page_view 表的 value 为 pageid,user 表为 age
Reduce:
经过 Shuffle 后,相同的 key 会进入到相同的 reducer
输入:map 的输出
输出: pageid, age
评论