数据大体系(四)——标签
引
这一节,主要浅谈一下标签。为何是“浅谈”?因为如果要把标签讲清讲透,那么文字、时间成本还是比较高的,涉及标签产品、标签数据的设计、来源抽取、加工、存储、使用,同时也会涉及体系目录等一系列的知识。看完这些,我想,借此寥寥数笔之文字,也许只能谈个大概,瞄个轮廓了。
通过这篇文章,您能对标签及标签体系的建设,有一个大概的了解。
标签
正如其他文章,既然讲标签,那么首先我们需要搞清楚,什么是标签 。这里我摘抄了《标签类目体系》这本书中的内容:
标签是指从原数据加工而来,能够直接为业务所用并产生业务价值的数据载体。
从这句话中我们可以看到,这里从本质上来说,标签也是一种数据。
从本质上讲,标签本身也是一种数据(或映射指向数据),它是对物理层数据信息项的业务化封装,是数据资产的一种良好组织形式。
一般而言,谈到标签,我们基本都离不开数据资产 的概念;从某种意义上来说,标签体系是数据资产 的一种比较好的展现和组织形式。当然,我们的指标体系、报表体系也能够成为我们数据资产 的一部分,但标签因此其可读性好以及易理解性(当然您将标签设计成完全不可读或者无法理解,我也没有太多办法),会成为数据交易过程中的一种首选。
标签体系
正如谈完指标必谈指标体系,说完标签是什么后,我们说说标签体系,为何要有标签体系。
没有规矩,不成方圆。设想将一个个标签散落在各个 BU、部门之间,是否诚如一本本书杂乱无章地扔在地上。而当您想阅读或使用某本图书时,则需要从这一本本杂乱无章的书中一本本拿出来去寻找自己的目的书籍。也许您想说,现在有搜索引擎,直接搜索就可以找到我想要的标签,为何还要整理成体系?设想,当您是标签的使用者,当您也不知道有哪些标签时,搜索的关键词,该是啥呢?即便搜索到,那么又如何能方便消费/使用它呢?
他山之石可以攻玉。我们在说标签体系之前,先来看看刚才的比喻——书籍的管理是怎样做的。对于书籍的管理,最成功的非图书馆莫属。图书馆通过建立起一个个的书架,将不同门类的书籍进行编目,然后放入到属于它的书架之上,以供读者借阅。而当读者需要借阅书籍时,往往先通过书名或其他关于该本书信息的信息(Meta-Data)进行检索,拿到了编目号后,按照书架的编号,找到对应的书籍。正如人类通过仿生学发明了雷达、发明了潜水艇等一样,我们参考图书馆,也可以来对我们的标签进行一些类目的编排,形成我们的标签体系。
目前,根据笔者的经验,标签的体系一级类目可以有人 、企业 、地址 等等,当然这是您企业所拥有的数据情况来界定的。但人 往往是非常常见的,我们常说的用户画像 ,其实就是人 这种标签的一种使用方式。
对于标签的一级类目,我们可以再往下设立二级、三级类目,正如图书馆设立书架,书架上再设立层,层再设立隔板。举例而言,人 的一级类目之下,可设立如基本属性 ,兴趣爱好 ,行为习惯 等多种二级类目。而在三级上,以基本属性 二级类目为例,又可以有教育背景 、年龄阶段 等一系列的类目或者叶子节点的存在。如此一来,一个属于人 的标签体系也基本有了一个大概的雏形。
结
这里,仅对什么是标签 ,以及标签体系 做了概念性的说明。这里如果想要有更深入的了解,我推荐数澜的《标签类目体系》,里面对其整体方法论有比较系统的介绍。而真要把一整个体系讲好, 估计得来个不少 2 万字的长文。再结合一些经验,也许又是一本书了······
于辛丑年冬月初十
版权声明: 本文为 InfoQ 作者【圣迪】的原创文章。
原文链接:【http://xie.infoq.cn/article/46a09c39a171de29ffaec5780】。文章转载请联系作者。
评论