架构师训练营第 12 周作业
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
复制代码
page_view 表和 user 表结构与数据示例如下
map 函数的输入是 page_view 和 user 两张表的记录
map 函数的输出是以 userid 作为 key 的 KV 对
reduce 函数的输入是 map 函数的输出经过 Shuffle 后,相同 key 在一起的结果
reduce 函数的输出是 pageid 与 age 对应的结果
评论