第 12 周作业
在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?
- 海量数据存储
- 用户画像分析
- 点击率预测
- 精准投放
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
```sql
INSERT OVERWRITE TABLE pv_users
SELECT pv.pageid, u.age
FROM page_view pv
JOIN user u
ON (pv.userid = u.userid);
```
- 过程
- map 函数输入是什么?输出是什么?
- 输入
- Key : userId
- Value : <表编号,pageId>
- 输出
- Key : 相同的userId
- Value : <不同表的编号,pageId Or age>
- reduce 函数输入是什么?输出是什么?
- 输入
- Key : 相同的userId
- Value : <不同表的编号,pageId Or age>
- 输出
- Key : PageId
- Value : age
评论 (1 条评论)