HiveQL 分析
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
page_view 表和 user 表结构与数据示例如下
map 函数的输入
page_view和user表的所有记录
map 函数的输出
page_view表经过map阶段之后的输出,key为userid,value为<表编号,pageid>
user表经过map阶段之后的输出,key为userid,value为<表编号,age>
reduce 函数的输入
map的输出经过shuffle之后reduce函数的输入,如下图
reduce 函数的输出
评论