第 12 周作业

用户头像
Jaye
关注
发布于: 2020 年 09 月 02 日



  1. 在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?



- 海量数据存储

- 用户画像分析

- 点击率预测

- 精准投放



  1. 分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?



```sql

INSERT OVERWRITE TABLE pv_users

SELECT pv.pageid, u.age

FROM page_view pv

JOIN user u

ON (pv.userid = u.userid);

```



- 过程



- map 函数输入是什么?输出是什么?

- 输入

- Key : userId

- Value : <表编号,pageId>

- 输出

- Key : 相同的userId

- Value : <不同表的编号,pageId Or age>

- reduce 函数输入是什么?输出是什么?

- 输入

- Key : 相同的userId

- Value : <不同表的编号,pageId Or age>

- 输出

- Key : PageId

- Value : age



用户头像

Jaye

关注

还未添加个人签名 2018.01.23 加入

还未添加个人简介

评论 (1 条评论)

发布
用户头像
作业请添加“极客大学架构师训练营”标签,便于分类
2020 年 09 月 03 日 10:27
回复
没有更多了
第12周作业