极客时间训练营 -12 周作业
HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
map有两个,一个对应page_view中文件的数据,一个对应user中文件的数据,其value值就是每一行数据。page_view的map输入1 111,2 111,1 222 输出为<111,<1,1>>,<111,<1,2>>,<222,<1,1>>
user的map输入111 25,222 32 输出为<111,<2,25>>,<222,<2,32>>
reduce函数输入111 <1,1>,<1,2>,<2,25>;222 <1,1>,<2,32>
输出:<1,25> <2,25> <1,32>
评论 (2 条评论)