架构师训练营第 1 期 第 12 周作业
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
map函数的输入:
map of page_view :<pageid, userid>
map of user: <userid, age>
map函数的输出:
map of page_view :{key: userid, value:<1, pageid>}
map of user: {key: userid, value:<2, age>}
reduce 函数输入:
{key: userid, values:[<1, pageid>, <2, age>....]}
reduce 函数输出:
[<pageid, age>, ...]
评论