写点什么

第 12 周命题作业

用户头像
hifly
关注
发布于: 2020 年 09 月 02 日
第12周命题作业
  • 分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

复制代码

INSERT OVERWRITE TABLE pv_usersSELECT pv.pageid, u.ageFROM page_view pvJOIN user uON (pv.userid = u.userid); 
复制代码

Page_view 表和 user 表结构与数据示例如下:



答: map 函数输入 key 当前行相对文件的起始位置的偏移量,value 为当前行的文本。map 函数输出和 Reduce 函数的输入,输出见下图。



用户头像

hifly

关注

还未添加个人签名 2018.03.08 加入

还未添加个人简介

评论

发布
暂无评论
第12周命题作业