写点什么

架构师训练营第 12 周作业

用户头像
netspecial
关注
发布于: 2020 年 12 月 12 日
  • 分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

INSERT OVERWRITE TABLE pv_usersSELECT pv.pageid, u.ageFROM page_view pv   JOIN user u   ON (pv.userid = u.userid);
复制代码


page_view 表和 user 表结构与数据示例如下


  • map 函数的输入是 page_view 和 user 两张表的记录


  • map 函数的输出是以 userid 作为 key 的 KV 对


  • reduce 函数的输入是 map 函数的输出经过 Shuffle 后,相同 key 在一起的结果


  • reduce 函数的输出是 pageid 与 age 对应的结果



用户头像

netspecial

关注

还未添加个人签名 2011.07.20 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营第 12 周作业