Architecture Phase1 Week12:HomeWork
SAP系统下得生产物料环境追踪管理统计及财务报表分析。关联到生产岗得员工及物料和最终得成品,实现历史年份得数据分析对比。
第一步输入用户ID,第一张表输出用户得表索引和PageID,第二张表输出用户得表索引及年龄。
处理键名称,将键名称一致得归类到一起,分发给Reduce处理。输入key和value,再判断value中得值为第二张表得,将其赋予给其他得值,输出pageID和年龄。
或者用Hive得Map Join方法。将表1得键值进行处理后,带入表二进行替换操作也可得到输出。
版权声明: 本文为 InfoQ 作者【phylony-lu】的原创文章。
原文链接:【http://xie.infoq.cn/article/9d4e8ad610b0c311b12558986】。文章转载请联系作者。
评论