写点什么

2020-08-29- 第十二周作业

发布于: 2020 年 09 月 01 日



作业一



在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?

答:暂未使用到

作业二



分析如下HiveQL,生成的MapReduce执行程序,map函数输入是什么?输出是什么?reduce函数输入是什么?输出是什么?





答:

(1)map的输入的是<key, value>,其中key为数据记录的偏移量,value则是page_view或者user表中的一条记录。

(2)map的输出为<key, value>,其中key代表用户id,value则是一个键值对<m, n>;当m==1时,n代表pageid值,当m==2时,n代表年龄。

(3)reduce的输入为<key, value>,其中key为用户id,value时一个键值对<m, n>;当m==1时,n代表pageid值,当m==2时,n代表年龄。

(4)reduce的输出为<key, value>,其中key为pageid,value为年龄age。



用户头像

还未添加个人签名 2020.05.11 加入

还未添加个人简介

评论

发布
暂无评论
2020-08-29-第十二周作业