训练营第十二周作业
在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?
之前在一家旅游行业的互联网公司待过,当时使用的是 Hadoop ,用来分析用户的日志,主要是分析用户的搜索词汇,知道用户关心的热点,以给运营部门分析。
现在所在的工业领域,主要是收集大量的机器运行时参数,希望可以给产线优化,生产排程提供更科学的依据
分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?
复制代码
page_view
map 输入:userid,pageid
输出:userid,<pageview 表,pageid>
user:
map 转入:userid,age
输出: userid,<user 表,age>
reduce 输入:userid,<pageview 表,pageid>
userid,<user 表,age>
输出:pageid,age
评论