OneData 之 OneID

用户头像
KAMI
关注
发布于: 2020 年 05 月 17 日

在阿里巴巴 OneData 体系中,OneID 指统一数据萃取,是一套解决数据孤岛问题的思想和方法。

 

数据孤岛是企业发展到一定阶段后普遍遇到的问题。各个部门、业务、产品,各自定义和存储其数据,使得这些数据间难以关联,变成孤岛一般的存在。

 

OneID的做法是通过统一的实体识别和连接,打破数据孤岛,实现数据通融。

简单来说,用户、设备等业务实体,在对应的业务数据中,会被映射为唯一识别(UID)上,其各个维度的数据通过这个UID进行关联。



各个部门、业务、产品对业务实体的UID的定义和实现不一样,使得数据间无法直接关联,成为了数据孤岛。



基于手机号、身份证、邮箱、设备ID等信息,结合业务规则、机器学习、图算法等算法,进行 ID-Mapping,将各种 UID 都映射到统一ID上。通过这个统一ID,便可关联起各个数据孤岛的数据,实现数据通融,以确保业务分析、用户画像等数据应用的准确和全面。



发布于: 2020 年 05 月 17 日 阅读数: 77
用户头像

KAMI

关注

这个世界复杂又有趣,和你分享我热爱的一切 2020.05.03 加入

数据挖掘研究员,专注分享数据领域的技术和业务,以及逻辑、思维和方法论 | 网易游戏内推长期有效,欢迎私戳 (微信 KAMI-Wei)

评论

发布
暂无评论
OneData之OneID