写点什么

训练营第十二周作业

用户头像
大脸猫
关注
发布于: 2021 年 01 月 08 日
  1. 在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?


之前在一家旅游行业的互联网公司待过,当时使用的是 Hadoop ,用来分析用户的日志,主要是分析用户的搜索词汇,知道用户关心的热点,以给运营部门分析。


现在所在的工业领域,主要是收集大量的机器运行时参数,希望可以给产线优化,生产排程提供更科学的依据


  1. 分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

INSERT OVERWRITE TABLE pv_usersSELECT pv.pageid, u.ageFROM page_view pv   JOIN user u   ON (pv.userid = u.userid);
复制代码


page_view

map 输入:userid,pageid

输出:userid,<pageview 表,pageid>

user:

map 转入:userid,age

输出: userid,<user 表,age>

reduce 输入:userid,<pageview 表,pageid>

userid,<user 表,age>

输出:pageid,age

用户头像

大脸猫

关注

还未添加个人签名 2018.04.27 加入

还未添加个人简介

评论

发布
暂无评论
训练营第十二周作业