写点什么

架构师训练营 -- 第 12 周作业

用户头像
stardust20
关注
发布于: 2020 年 09 月 01 日

分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

INSERT OVERWRITE TABLE pv_users
SELECT pv.pageid, u.age
FROM page_view pv
JOIN user u
ON (pv.userid = u.userid);

Page_view 表和 user 表结构与数据示例如下:



map输入 map输出:

key value key value

偏移量不重要 1 111 9:08:01 111 <1,1>

2 111 9:08:13 111 <1,2>

1 222 9:08:14 222 <1,1>



111 25 female 111 <2,25>

222 32 male 222 <2,32>



reduce输入 reduce输出

key value key value

111 <1,1> 1 25

111 <1,2> 2 25

111 <2,25>



222 <1,1> 1 32

222 <2,32>



用户头像

stardust20

关注

还未添加个人签名 2019.11.18 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营 -- 第 12 周作业