极客时间训练营 -12 周作业

用户头像
潜默闻雨
关注
发布于: 2020 年 09 月 02 日

HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

INSERT OVERWRITE TABLE pv_users
SELECT
pv.pageid, u.age
FROM page_view pv
JOIN user u ON (pv.userid = u.userid);



map有两个,一个对应page_view中文件的数据,一个对应user中文件的数据,其value值就是每一行数据。page_view的map输入1 111,2 111,1 222 输出为<111,<1,1>>,<111,<1,2>>,<222,<1,1>>

user的map输入111 25,222 32 输出为<111,<2,25>>,<222,<2,32>>

reduce函数输入111 <1,1>,<1,2>,<2,25>;222 <1,1>,<2,32>

输出:<1,25> <2,25> <1,32>



用户头像

潜默闻雨

关注

还未添加个人签名 2018.11.23 加入

还未添加个人简介

评论 (2 条评论)

发布
用户头像
预留的这种还是加上标签吧,否则会做删除处理
2020 年 09 月 03 日 10:28
回复
用户头像
作业请添加“极客大学架构师训练营”标签,便于分类
2020 年 09 月 03 日 10:28
回复
没有更多了
极客时间训练营-12周作业