架构师训练营作业 -- Week 12
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
复制代码
Page_view 表和 user 表结构与数据示例如下:
map函数的输入:
page_view 表
key: record id(PK)
object: 一行记录
user 表
key: record id(PK)
object: 一行记录
map函数的输出:
<userId, pageId>和<userId, age>键值对。
reduce函数的输入:map函数输出的键值对,经过shuffle之后,按userId合并后的二维值数组。例如,[[1,25], [2,25]],
reduce函数的输出:合并所有的二维值数组。结果如下:
[1, 25], [2, 25], [1, 32]
版权声明: 本文为 InfoQ 作者【吴炳华】的原创文章。
原文链接:【http://xie.infoq.cn/article/8b2594201286f47b6f4d6f7e7】。文章转载请联系作者。
评论