架构师训练营 -- 第 12 周作业
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
Page_view 表和 user 表结构与数据示例如下:
map输入 map输出:
key value key value
偏移量不重要 1 111 9:08:01 111 <1,1>
2 111 9:08:13 111 <1,2>
1 222 9:08:14 222 <1,1>
111 25 female 111 <2,25>
222 32 male 222 <2,32>
reduce输入 reduce输出
key value key value
111 <1,1> 1 25
111 <1,2> 2 25
111 <2,25>
222 <1,1> 1 32
222 <2,32>
评论