第十二周作业
一、在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?
正在使用大数据的业务:
日志记录与分析。
用户行为分析,用户画像。
用户流失预警。
可以使用大数据实现哪些价值:
根据访问日志,对用户进行分类,找到用户偏好,进行个性化推荐,增加用户粘性,促进成单。
用户画像,根据不同人群,进行分类精准营销,减少 营销成本,提高营销的效果。
用户流失预警,减少用户流失。
二、分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
map 函数的输入分别是 page_view 和 user 表的数据。
map 函数的输出是分别以 userid 为 key,pageid 为数组。userid 为 key,age 为数组。
reduce 函数的输入是 map 函数的输出,以 userid 为 key 的数据。
reduce 函数的输出是相同用户 pageid 和 age 的数据集合。
评论