架构师培训十二周练习
1、在你所在的公司(行业、领域) ,正在用大数据处理那些业务?可以用大数据实现哪些价值?
(1)反洗钱资金监测业务
通过海量数据分析,发现异常可疑交易线索,初步筛选出有价值目标,为下一步案件调查做准备。加强反洗钱监管部门之间的信息共享和联动协同,提高对洗钱犯罪行为评估和预测的准确性和及时性,维护社会稳定。
(2)征信业务
充分利用社会各方面信息资源,打破行业间信息孤岛,汇集金融、工商、税务、检察、海关等公共信用数据,通过大数据技术整合互联网、电子商务等相关数据,形成多维度、全覆盖的大数据征信平台,为经济高效运行提供全面准确的基础信用信息服务。
2、题目
(1)map函数的输入为两张表的每条记录
其中key为偏移量,value为每条记录,value值如下:
1 111 9:08:01
2 111 9:08:13
1 222 9:08:14
111 25 female
222 32 female
(2)map函数的输出为key,value键值对,key为userid,value包含两个值,第一个值代表来数据自于哪张表,第二个值是userid或age对应的值,如下:
(3)reduce函数输入是相同key的value集合
(4) reduce函数输出我们需要的结果集合pageid和age,通过对输入的values进行双重循环遍历。
评论