写点什么

基于 OLT(实体、关系、标签)建模方法论的最佳实践 | StartDT Tech Lab 08

用户头像
奇点云
关注
发布于: 11 小时前
基于OLT(实体、关系、标签)建模方法论的最佳实践 | StartDT Tech Lab 08

这是奇点云全新技术专栏「StartDT Tech Lab」的第 8 期。

在这里,我们聚焦数据技术,分享方法论与实战…滑到文末,可以看到我们的往期内容。

本篇由奇点云产品专家「宵夜」带来:

作者:宵夜

阅读时间:约 8 分钟

导读

以提升业务为目标沉淀数据资产,以客户画像分析助力精准营销,是当下数据应用的常见场景。

标签化的数据集市能大大降低数据获取和分析门槛,解耦 IT 人员和运营人员的工作,响应高频运营需求,提升运营效率,并通过灵活的圈群和分析工具,赋能精准营销。

 

上回书说到,加工标签像包粽子(戳我看),通过 DataSimba 的“标签工厂”工具,形象比喻成让 “粽子”的产出更标准、更高效、更闭环,技术门槛更低,也支持更多的自定义场景。

本文,我们将从技术角度由表及里,分享通过实体关系建模,如何将数据从生产加工到以标签为数据应用载体,进行圈群和画像分析的完整链路,以及如何有效实现精细化运营的目标。

 

1# 什么是 OLT 建模?

OLT 建模包括:标签模型、加工标签规则、标签调度同步。围绕实体(Object)和关系(Link)、标签(Tag)对分布在不同数据库中的数据进行网络化的建模方式。

 

治理后的数据以业务化视角进行建模后,再通过标签的自定义规则功能,可为上层应用提供统一的标签数据目录和标签调用接口,进而沉淀上层应用制作的模型标签,实现高价值标签共享复用,形成标签运营生态。

标签将广泛适用于用户、商品、设备、供应商、门店、企业档案等不同数据域的多类分析场景。

 

2# OLT 建模与画像分析的

最佳实践

01

建立标签体系

在企业的实际生产场景中,各部门会向企业的 IT 或数据管理部门提出不同场景下的数据应用需求。IT 或数据管理部门就需要对不同的业务需求及场景建立相匹配的标签体系。

 

举个例子,业务部门会这样描述他们的用数需求:

a. “近期多数新客来自某线上渠道,我想看一下这部分群体的年龄分布和地域分布”;


b. “某门店大量订购了产品 A,是产品 A 的高潜在客户,能帮我给他们打一个‘星级客户’的标签吗”;


c. “只要是提了 10 次以上客诉工单、包含 3 次差评的客户,均是‘满意度低’的客户,需要特殊挽回”;


d. “财务合同保底额满足 XXX 万元,影响力中等,有进一步转化的空间”;


e. “征信重新审核超过 2 次,并且是中征信水平,可推荐商品 B 给这个客户”。

……

接到这样的业务需求后,数据开发或分析同学(标签开发者)需要根据具体需求场景,先对需要引用的数据来源进行集成,例如订单数据、合同数据、商品信息、风险数据、服务数据等等;再制定标签生产的策略规划,确定实体对象的特征类型,以及该标签在标签体系中的分类及位置。

 

02

开发抽象建模

遵循 OLT 方法论,即对象(Object)、关系(Link)、标签(Tag),依托 DataSimba 数据中台的“标签工厂”,可让标签开发者根据制定好的标签开发方案,对于需要打标的实体进行数据建模,明确实体引用的来源表及字段、及输出的目标表处在数仓结构中的哪一级。

图源:DataSimba 标签工厂

03

标签开发

实体来源表及引用字段配置好后,开发人员在标签开发页面上通过下拉或输入的方式配置标签的规则,而无需编写代码及检查代码逻辑,即可快速实现标签的开发。

根据不同的标签来源及生成方式,标签工厂提供了多种标签开发模板可供选择,以支持原生标签、统计计算类规则标签、业务经验类规则标签、数据挖掘类标签的开发。

此外,随着业务的发展,标签的生成规则需要不断调整及挖掘,标签工厂也提供了版本管理功能,可对不同版本的标签生成规则进行对比和回滚操作。

图源:DataSimba 标签工厂 

04

数据服务化

标签开发任务发布后,调度系统将基于标签配置的调度规则定时运行任务,生成标签数据。应用开发同学可根据实际使用需求,将敏感数据设置脱敏后,通过配置数据服务 API 的方式快速同步标签数据、画像分析报告至各业务系统中。

此举可有效提高开发者对高频业务数据运营的支持效率,以几乎零成本的方式帮助业务侧快速积累标签画像资产。

图源:DataSimba-运维 DAG

05

画像分析

对标签资产进行标签圈群,通过单群体或单个度量方式等多个维度进行分析群体。

查看并分析不同群体在属性方面的统计和分布情况,掌握群体特征,分析用户偏好等。以便后续进行定向分析或运营动作。此外,可对多个群体进行交集、并集、差集计算,快速得出分析结果。

 

圈选条件设置:需要在实体关系建模中设置标签值类型,支持的标签类型包含:枚举值、布尔值、字符串、数值和日期。

图源:宵夜

例如当选择【群体数量】时,判断时数值类型标签,度量方式使用 count 聚合函数。

通过多种分析图表例如状图、饼图、折线图和面积图进行画像分析,制定策略。

图源:DataNuza

06

精细化投放

通过画像分析后,需求方可把标签导入消费者运营平台(例如 DataNuza)或企业自有的其他 CDP 系统中,有效支持精细化投放和经营决策。常见精细化运营策略包括应用投放、推荐算法、精准通知、私域自动化营销等。

图源:宵夜

07

标签数据回流

业务侧经过标签数据回流,可形成从数据生产到应用的完整闭环,并利用再次采集到的数据指导下一轮迭代,完善标签体系的指标调优。

统计指标包括数据关系模型统计、标签热度统计、标签生命周期统计、API 热度统计等。

业务数据经过以上七步法生产出的标签,可有效提高复杂业务场景下的运营效率,并达到“精细化”的数据应用要求。

 

3# OLT 建模与画像分析的优势

最后总结一下 OLT 建模与画像分析的几个重要优势:

1. 遵循 OLT 模型进行实体建模、可快速完成标签的创建管理和版本管理;


2. 通过可视化的方式,快速创建原生、统计类、规则类、数据挖掘类等多种类型的标签;


3. 对低频数据开发和高频业务运营需求进行解耦,实现高价值的数据资产共享和复用;


4. 是业务人员能看懂、会使用的数据应用技术,可助力企业实现数据驱动精细化运营。

用户头像

奇点云

关注

AI驱动的数据中台创导者 2019.08.05 加入

还未添加个人简介

评论

发布
暂无评论
基于OLT(实体、关系、标签)建模方法论的最佳实践 | StartDT Tech Lab 08