写点什么

第 12 周作业

用户头像
Steven
关注
发布于: 2021 年 01 月 10 日

在你所在的公司(行业、领域),正在用大数据处理哪些业务?可以用大数据实现哪些价值?

做产品时,配合做用户画像,对接用户体验地图,配合营销团队分析数据等等。


大数据的价值,简单列出几项:

帮助企业挖掘市场机会

分析大量数据进一步挖掘市场机会和细分市场,然后可以对每个群体采取独特的行动。获得好的产品概念和创意,挖掘人们的产品观念。


提高决定能力

企业管理者可以基于数据,而不仅仅是依赖个人经验和直觉做决策。


变革商业模式,催生产品和服务的创新

让企业能够创造新产品和服务,改善现有产品和服务,以及发明全新的业务模式。


医疗

提高医疗系统效率,提高诊断和治疗的正确率。而且可以结合患者的历史数据进行分析。


智慧城市

利用大数据提升社会治理水平。这几年国家在智慧城市方面做了很大的投入,为民众带来便利。


分析如下 HiveQL,生成的 MapReduce 执行程序,map 函数输入是什么?输出是什么,reduce 函数输入是什么?输出是什么?

INSERT OVERWRITE TABLE pv_usersSELECT pv.pageid, u.ageFROM page_view pv   JOIN user u   ON (pv.userid = u.userid);
复制代码

把 page_view 表序号定义为 1,user 表序号定义为 2。


map 函数输入

page_view 表,key 值为 userid,value 为 pageid。

user 表,key 值为 userid,value 为 age。


map 函数输出

page_view 表,key 值为 userid,value 为 表序号与 pageid 的组合,表现为 <1,pageid>。

user 表,key 值为 userid,value 为 表序号与 age 的组合,表现为 <2,age>。


reduce 函数输入:

userid 为 key,<1,pageid> 和 <2,age> 的 value list。


reduce 函数输出:

pageid 为 key, age 为 value。


用户头像

Steven

关注

还未添加个人签名 2008.07.18 加入

还未添加个人简介

评论

发布
暂无评论
第 12 周作业