架构师训练营第十二周作业
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
Page_view 表和 user 表结构与数据示例如下:
map输入:
key 偏移量
values:数据表page_view或者user的一行记录
map输出:
key:userid
value:<表1,pageid>或者<表2,age>
reduce输入:
map输出的一个key的数据
reduce输出:<pagid,age>, count
评论 (1 条评论)