从洞察到决策,一文解读标签画像体系建设方法论丨 DTVision 分析洞察篇
一、数字营销是数字化转型排头兵
《⼗四五数字经济发展规划》中强调,要⼤⼒推进数字化转型,形成数据驱动的智能决策能⼒,提升企业整体运营效率。
要做好数字化转型,企业可从产、研、供、销、⽤等多个环节入手,而 “销” 恰好是第一关键要素,企业转型往往从营销场景入手,因此我们说数字化营销是企业数字化转型的排头兵。
在数字化营销转型过程中,由于各个企业的数字化建设进程不同,往往会遇到多种挑战,如:
· 企业数据如何打通?
· 客户画像如何建设?
· 营销 ROI 如何提升?
· 营销策略如何迭代?
要想解决以上问题,在业务⽣产与业务应⽤之前,让产业数字化营销,我们需要进⾏:
· 数据的统⼀存储;
· OneID 的数据打通;
· OneModel 的数据模型建设;
· 数据资产的统⼀管理。
打好这些基础,接下来就能开始建设企业自己的个性化标签体系,让标签作为企业数字化营销的基石,帮助消费者画像更加精确。
实现用数据指导营销,而不再只是含糊的经验;让活动的数据再回流到数仓中,作为标签数据来源的一部分,形成营销业务闭环。
二、标签体系建设方法论
那么如何帮助企业构建完美的标签体系呢?我们总结出“三目标 + 五步法”的方法论:
1、标签体系建设三目标
● 目标一:解决业务问题
要确定我们建设标签体系是为了解决什么具体的业务问题,想要达到什么效果,时间上要做到分期而治、小步快跑,早日推广应用。
● 目标二:业务人员好用、易用
标签体系的建设目标是要灵活可扩展,让业务人员可以轻松衍生标签、生产效率高。同时标签应用方式还需要多种多样,以适应不同的业务要求。
● 目标三:可持续更新迭代
标签体系作为重要数据资产,需要我们对它进行持续完善,形成业务应用与数据开发部门良好互动,助力生产更有价值的数据。
2、标签体系建设五步法
第一步 明确建设目标
在开始建设标签时,我们需要明确建设目标,目标可以指导我们的执行策略无偏差,最终达到想要的结果,否则在建设过程中随着一些信息的输入、困难的出现,容易今天一榔头明天一棒槌,顾此失彼,达不到业务期望的结果。
● 业务建设目标
业务建设目标,指通过标签项目想解决什么样的问题,达到什么样的业务效果。比如
· 现在属于粗略式的运营,需要基于标签体系实现精细化运营,将营销活动的转化率提升 5%;
· 标签加工流程过于缓慢,从业务人员提需求到需求实现需要 1-2 周时间,需要将改时间缩短至 1-3 天;
· 现在数据来源过于单一,只有交易域,需要汇总其他域的数据,比如行为数据、评论数据、活动数据等丰富标签体系维度。
一般列举 5-10 条目标,业务部门与技术部门一起制定,基于这些目标,进行系统建设。
● 系统建设目标
为实现对应的业务目标,需要建设一个怎样的系统,是内部实现,还是外部采购,各自的实现周期与成本,若外部采购,采购的标准是什么等都需要考虑,该问题一般是技术部门来考虑。
· 系统给谁使用:是建设一个标签加工与管理的标签管理工具,主要给技术部门使用,因为企业已经有了营销系统、涵盖标签圈群与推送给的功能。还是需要一个集合加工、管理、圈群、分析一体化的工具,数据分析师、业务人员也要用。不同的使用对象,系统建设的内容不一样。
· 系统的技术架构要求:公司内部的大数据部门若已经用了一些底层平台或技术组件,从节省成本方面,应当尽量用同一套底层存储与计算平台,比如已经采购了 CDH、TDH 的 Hadoop,那标签系统需要可直接对接这些系统进行数据存储与计算。以及标签系统需要和 CRM 系统、营销平台实现对接,便需要有相应的对接方案,如通过标签服务 API 接口,或数据同步、推送等当时,将数据给到下游系统。
· 系统功能要求:基于标签的加工、标签的生名周期管理、标签的数据安全、标签的评估治理、标签圈群、画像洞察、对外服务等多方面梳理需要的功能。
· 系统性能要求:基于司内的数据量,标签加工的速度、并发,标签圈群与分析的查询时间,所需要的部署资源、一年需要花费的成本需要进行评估与计算。
● 参与部门与执行计划
根据我们一些标签项目的建设经理,会出现这样的情况,大数据部门一期项目建好的标签,很难推动业务人员使用起来,主要有以下几点原因:
业务人员觉得建设的标签有用的很少,大多数都用不上;
用了一下标签,觉得数据不准确,不敢用;
领导没有说要用这些标签,还是按照自己的既定模式来工作好了。
基于这些问题,标签项目推进之初,需要拉上业务部门的领导、对接人一起参与,确定一个先应用标签的项目或场景,做出效果,再应用到更多的部门及项目,否则刚开始大而全,周期长、且没有目标性,往往后续推广使用时会遇到阻碍。
● 参与部门包含以下:
· 需要标签项目服务的业务部门(核心):如市场部、运营部、客服部、风控部等,各指定一名对接人员;
· 项目需求收集分析者:数据产品经理、数据分析师;
· 系统建设和标签加工者:数据科技部门。
● 制定执行计划:
· 项目是否需要分期,一期项目的目标和建设的标签有哪些;
· 各期项目时间周期、负责人,上线场景;
· 上线后业务人员需要持续反馈使用情况,业务变化情况,不断的优化迭代。
第二步 标签体系建设
明确好建设目标之后的下一步就是标签体系设计。
在此之前,我们先对一些标签的重要概念做一些介绍:
标签体系设计是一种对对象统一进行本质刻画的数据描述办法,把个体观察升级为群体观察,而非过去对个体现象的归纳,更具有面向未来的场景化适应能力。标签体系设计的整体流程可分为 4 大步骤 + 2 大阶段:
在此过程中我们需要:
● 规划实体对象
确定标签体系的对象,梳理标签间的关系,设计标签体系,做好标签类目创建。
实体指我们要建立标签体系的对象,如客户标签体系、商品标签体系、渠道标签体系、客户经理标签体系,客户、商品、渠道、客户经理都属于我们的实体对象。其类似一颗树的根,后续要基于“实体”,长出树的枝干、叶子、花等,所以划分正确的实体很重要。
关系指多个实体之间的关系,如“客户”购买“基金”,会使客户实体与基金实体发生关系,形成新的标签,比如加工“投资风险偏好”标签,标签值为“高风险”、“中高风险”、“低风险”等,需要利用客户最近一年的交易记录结合基金维表,当用户购买基金的基金类型包含高风险,且最近一年购买金额>5000 时,为高风险偏好。需要用到 2 个实体形成一个关系,来加工这个标签。
● 探查数据
根据标准数据建仓规范,梳理下大概的客户的数据域、业务过程、数据表、表的数据量、数据分布等,掌握基于该数据,可以加工出哪些标签。
● 设计标签类目
基于已采集的业务需求、掌握的数据情况、规划的实体的对象,建立实体对象的标签类目体系。除根据客户业务建设外,也会提供一些行业通用模板,作为参考。
标签类目体系是“实体”树的枝干,为以后标签生长的繁茂建立基础,需要做到枝枝粗壮、分明,即每个类目需要有明显的分割,且标签的数量不能过多和过少,建议一个子类目不超过 20 个标签,不少于 3 个标签。
标签类目层级根据业务实际情况划分,一般 2~3 层即可(不包含标签、标签值)。如下图:
● 设计标签内容
包含标签定义、加工方法判断、加工范围判断等。
根据前面的需求调研、数据调研、类目划分,梳理标签体系中的标签,需包含以下内容:
· 标签中文、英文名:标签的中文名称、英文名称;
· 标签所属类目:标签所属一级、二级、三级类目;
· 标签类型:根据不同维度的划分,采用其中一种。比如事实标签、统计类标签、预测类标签,亦或是原子标签、衍生标签、组合标签、自定义标签等;
· 标签值定义:定义每个标签的标签值,如“近一个月买入金额区间”标签,可根据购买金额的区间段定义“零/低端”、“普通”、“中端”、“准高端”、“高端”等标签值;
· 标签含义(描述):描述该标签业务含义,如“最近 30 天的购买商品的金额区间,对用户消费力进行评估”;
· 业务口径:标签以哪个数据定义为准,如“用户活跃城市”标签,以用户购买次数最多的城市为口径加工,而不是浏览次数、评论次数等;
· 标签技术口径:描述该标签从哪个表的哪个字段取值,SQL 取数逻辑是什么;
· 业务方来源:该标签的业务需求方是谁;
· 标签更新周期:描述标签更新频次,天(如 T+1、T+2 等)、周、月、小时、分钟更新等;
· 标签更新优先级:同一时间端跑多个标签时,若资源有限,先跑优先级高的标签。
第三步 标签加工与更新
标签加工与更新包含各类型标签加工、标签测试和标签上线与更新几个步骤,在技术层面实现营销需求。
● 判断标签加工方法
梳理标签的加工方式,判断哪些是离线标签、实时标签、算法标签,从而引入对应的产品和相应的开发人员来开发。业务场景中,离线标签偏多,实时标签次之,算法标签少之。
· 离线标签:定时跑批,一般为天粒度,T+1 跑批,晚上跑标签结果,业务人员第二天做查询。一些标签若高频率更新,也支持小时、分钟粒度的更新。常需要 Spark、Presto、Impala 等跑批组件及产品。
· 实时标签:实时加工,一般为秒或毫秒级加工,常见于用户行为实时传上来,基于用户的实时行为,打标签,进行商品推荐等。常需要采用 Kafka 消息队列、Flink 实时计算引擎组及产品。
· 算法标签:利用机器学习算法、深度学习算法,做一些预测类标签,如根据用户的购物商品和频率,预测家里是否有小孩、小孩年龄等。常需要 Python 开发环境和机器学习算法包。
不同的加工类型,往往需要采用不同的计算引擎和框架,需判断企业内容是否有这样的能力加工,若无,外部采购的话需要供应商有什么样的能力,需要有大致的判断。
● 划分加工范围
标签的使用人员是业务人员,在以往老的流程中,需要业务人员向数据开发提需求加工新标签,开发一个新标签的周期一般 1-2 周之间。
为了使业务人员能够灵活的加工规则标签,尽快提取自己想要的数据,标签的加工、管理目前多通过产品化的方式,使数据开发、数据分析师、业务人员都能参与标签的开发。
这里便涉及到哪些标签由开发人员加工,哪些标签由业务人员加工,标签加工流程是什么等。
可按照上述流程,在数据开发和业务人员之间有个标签管理团队,用来维护标签的生命周期,包括标签需求的分解、上下架等,可由数据分析师、业务人员组成。
● 大的划分原则是:
基础标签的标签由数据开发团队加工,这类标签是基于数仓数据加工的最细粒度标签(是能打在用户身上的标签,不是某个单纯的字段),不能再被拆解。
基于基础标签可通过规则衍生的,由业务人员完成。
以上图为例:当有一个“是否 30 天登录未注册用户”标签需求时,标签管理团队可判断该标签是否可基于基础标签衍生,若不行,则由数据开发加工对应的标签。
若可以,则判断是否有对应的基础标签可衍生,如举例标签,可拆解成“APP 最近一次登录日期”或”距最近一次登录时间”,与“是否注册”2 个基础标签,便可基于基础标签,业务人员完成这 2 个标签的加工与上线。
第四步 标签生命周期管理
标签生命周期管理是指包含标签评估、标签治理和标签迭代等几个对标签的实际使用状态负责的管理流程,帮助实现标签建设与营销的有机结合,不浪费任何一个动作指标。
● 从以下维度来评估标签的重要性
标签使用度评分:根据标签引用次数、标签分析次数、标签调用次数来评估标签的使用度;
标签关注度评分:根据标签搜索次数、标签浏览次数、标签收藏次数来评估标签的关注度;
标签质量评分:根据标签值的覆盖情况来评估标签的质量,若 null 值过多,则说明标签规则设置不合理;
标签持续优化度评分:根据标签上线后,再编辑优化的次数来评估标签的持续优化情况;
标签安全评分:根据标签是否脱敏、是否设置行级权限、是都需要申请、是否设置可见性来判断标签的安全度。
基于以上 5 个维度计算标签的综合评分,可查看各标签的评分、评估标签的重要性。
同时,基于标签使用度评分、标签关注度评分、标签持续优化度评分来计算热门标签排行、沉默标签排行,找出不太用的标签进行下线,完成标签的“定义——开发——上线——优化——下线”全生命周期管理。
第五步 标签应用与回流
标签应用与回流则是指标签圈群、画像洞察和对外服务几项具体的落地结果操作,也是标签建设必不可少的一环。
● 以一个场景举例:
· 营销策略:为维持老顾客的忠诚度,并引导现在购买初级产品的老客户向高级产品进阶,圈选出为“老顾客升级”用户,为这些客户发放高端产品的优惠券;
· 人群包选择:“最近 1 年购买次数>=1”且“最近 1 年消费金额>=1000”且“性别=女”的客户。
● 基于目前群组进行画像洞察:
· 群组画像:进一步分析“老客户升级”这批用户的会员等级、月消费支出、是否为活跃用户等,进一步掌握群组特征,根据活动预算调整自己的营销策略。
· 群组分析:圈选出一个“高端产品用户”群组,监控每天忠实用户的人数,看是不是有明显波动,某些活动发放后,数据是否有提升;某个时间人数是否有骤减,保障群组的稳定持续上升。
· 群组交并差计算:分析“老顾客升级”群组与“高端客户”的重合度,看是否有重复人群,最终推送优惠券可进行策略调整,不针对这部分重合客户进行本次推送。
确定好人群后,便可进行市场投放,看其对业务带来的作用,除分析活动带来的 GMV、客单价提升外,我们也需要知道活动参与情况也是用户行为数据的一种,需要将这些数据也回流至数仓,生成新的标签。
三、标签体系在某基金的建设案例
在上文中我们介绍了标签体系建设的方法论,如何将理论落地实践,袋鼠云数栈智能标签产品给出了答案。
客户数据洞察平台(DataTag),通过标签萃取、标签管理、群组细分、全面画像,构建以业务价值为导向的标签体系和多样化群组,将数据资产标签化,数据标签价值化,应用于企业智能化运营与营销。
接下来我们以某基金客户的案例,来为大家介绍标签体系建设的实际应用。
1、项目背景
身处一个全方位数字化的平台型经济时代,企业的数字化转型已是由内而外的必然趋势,在数字化浪潮下,基金客户的各项业务迅猛发展、客户数据量急剧增长,公司对客户、产品、渠道、反洗钱等方面的数据分析、运营提出了更高要求,在此背景下,搭建一套完整的标签平台,提升营销效率,无疑是最佳的选择。
2、客户痛点
· 客户数据分散在各个系统,无统一的分析平台;
· 各类数据分析和提取大多采用半自动的工作模式,无科学的标签体系;
· 客户活动开发周期长,运营不精准,营销效果缺乏及时追踪、运行反馈不及时。
3、建设方案
· 对接星环 TDH 引擎;
· 提供标签实施服务,为客户梳理标签体系,完标签开发,建立客户标签体系,支持销售、服务、合规等不同角度的需求;
· 便捷的标签开发、运算、展示和输出等全生命周期管理;支持客户个体及群组画像、客户群圈选和对比,支持快速推广、智能营销、精准服务。
4、建设流程
· 业务层面:以客户实际业务现状和业务需求为基础,量身定制适用于业务的标签体系;
· 数据层面:将各业务系统中消费者数据回流至数据中台,根据标签设计,进行数据探查、清洗、建模、开发等工作并实施上线。
5、业务效果
· 标签体系:建立客户、基金、基金经理、渠道 4 个标签体系;
· 标签数量:600 + 标签;
· 加工效率:标签加工效率从 1 周缩短到 2 天,运营效率提升至 2~3 次 / 周;
· 标签应用:应用在基金营销、反洗钱风险控制、用户流失召回等多个方向。
袋鼠云开源框架钉钉技术交流群(30537511),欢迎对大数据开源项目有兴趣的同学加入交流最新技术信息,开源项目库地址:https://github.com/DTStack
版权声明: 本文为 InfoQ 作者【数栈DTinsight】的原创文章。
原文链接:【http://xie.infoq.cn/article/27db4e3ad1801913b1df3b512】。文章转载请联系作者。
评论