架构师训练营作业
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
map有两组,第一组读取pv表的的输入是pageid、userid、 time,输出是userid、pageid、time, 第二组读取user表的输入是userid、age、gender,输出也是userid、age、gender。 Reduce端的输入是上面的两组输出,输出是pageid、age。
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
map有两组,第一组读取pv表的的输入是pageid、userid、 time,输出是userid、pageid、time, 第二组读取user表的输入是userid、age、gender,输出也是userid、age、gender。 Reduce端的输入是上面的两组输出,输出是pageid、age。
评论 (1 条评论)