写点什么

架构师训练营第十二周作业

用户头像
张明森
关注
发布于: 2020 年 08 月 30 日

1.在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?

1).海量数据存储及计算

2).商品推荐(猜你喜欢)

3).风控

4).无人超市、无人售货柜

5).无人配送车


2.分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

map 函数输入是: Page_view 表和 user 表 ;

输出是: 111 -><Page_view,1>;111-><Page_view,2>; 222-><Page_view,1>

111 -><user,25>; 222-><user,35>

reduce 函数输入是:111 -><Page_view,1>;111-><Page_view,2>; 111 -><user,25>;

222-><Page_view,1>;222-><user,32>

输出是:

<1,25><2,25>

<1,32>

复制代码

INSERT OVERWRITE TABLE pv_usersSELECT pv.pageid, u.ageFROM page_view pvJOIN user uON (pv.userid = u.userid); 
复制代码

Page_view 表和 user 表结构与数据示例如下:


参考例子:https://blog.csdn.net/qq_24505127/article/details/101687227


用户头像

张明森

关注

还未添加个人签名 2017.10.16 加入

还未添加个人简介

评论

发布
暂无评论
架构师训练营第十二周作业