Week 12 作业
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
复制代码
Map 输出
page_view map: key={userid}, value=<tableId=1, pageId>
user map:key={userid}, value={tableId=2, age>
Shuffle Sort,按 Key 归类,作为 Reduce 输入
111, <1, 1>
111, <1, 2>
111, <2, 25>
和
222, <1, 1>
222, <2, 32>
最后 pv_users Reduce 的输出为:
1, 25
2, 25
和
1, 32
版权声明: 本文为 InfoQ 作者【evildracula】的原创文章。
原文链接:【http://xie.infoq.cn/article/8c378fe842aff0d591dbc462d】。文章转载请联系作者。
评论