架构师训练营 - 第 12 周
在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?
对于电商领域,主要用在以下地方
1.用户行为分析
大量采集埋点并上报,提供给大数据,之后进行分析后进行精准推送和搜索智能筛选等地方,提高用户体验。
2.销量统计
根据订单量来统计前百分比的热门商品,智能运营,提高运营销售 GMV
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
复制代码
 page_view 表和 user 表结构与数据示例如下
 
 2 次 map 分别将 2 个表的数据全量输入,输出动作是:
- 输出了 userid、<pv, pageId>的结构,如下: 
- 111 <1, 1> 
- 111 <1, 2> 
- 222 <1, 1> 
- 输出了 userid、<u, age>的结构,如下: 
- 111 <2, 25> 
- 222 <2, 32> 
- 将结果集经过 shuffle 排序后,如下: 
- 111 <1, 1> 
- 111 <1, 2> 
- 111 <2, 25> 
- 222 <1, 1> 
- 222 <2, 32> 
Reduce 操作时,输入的是上述排序后结果,输出如下:
pageId age
- 1 25 
- 1 32 
- 2 25 












 
    
评论