架构师训练营第 12 周课后作业一
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
Page_view 表和 user 表结构与数据示例如下:

map 输入为
pageId userid time
1 111 9:08:01
1 111 9:08:14
2 222 9:08:13
userid age gender
111 25 female
222 32 male
输出为
userid age gender pageId time
111 25 female 1 9:08:01
222 32 male 1 9:08:14
111 25 female 2 9:08:13
reduce 函数输入是
userid age gender pageId time
111 25 female 1 9:08:01
222 32 male 1 9:08:14
111 25 female 2 9:08:13
reduce 函数输出是
userid age pageId
111 25 1
222 32 1
111 25 2
评论