白话大数据 | 元宇宙来了,但是你了解元数据吗?
Hey guys.不知道各位近期是不是被“元宇宙”(Mateverse)这个概念的新闻刷爆,反正小编的朋友圈是被刷屏了。
从 FaceBook 改名 Meta(元)再到某节等大厂纷纷表示投入元宇宙,云宇宙的热度噌噌噌地往上涨,那么元宇宙究竟是个啥,小编带你撕开元宇宙的面纱!
元宇宙最早起源于 1992 年著名的美国科幻小说家尼奥·斯蒂文森(Neal Stephenson)撰写的《雪崩》(Snow Crash),书中描述了一个平行于现实世界的网络世界-元界(Metaverse)。所有现实世界中的人在元界中都有一个网络分身(Avatar),在元宇宙之中人们可以随时随地切换身份,自由穿梭于物理世界和数字世界,在虚拟空间和时间节点所构成的 “元宇宙” 中学习、工作、交友、购物、旅游等。(终于可以体验到宇航员的身份了吗!?)
试着想想你的鸽子 a 大王朋友(或者你是),这时候你就可以通过元宇宙来跟他进行零时间零距离面对面的监督(我看你要多久才好),然后在大数据对你们的喜好与厌恶进行分析得出的一些共同喜欢的活动中做出选择。
又或者可以在元宇宙中上班,瞬间传送到公司,不用费时费力的赶早高峰,妈妈再也不用担心我的考勤了!
元宇宙的功能这么强大,离不开它背后这些人工智能、云计算、虚拟现实、云数据等一大堆一大堆的技术,我们今天来讲讲元宇宙的 “同姓” 兄弟——元数据!
大家鼓掌欢迎元数据进场!
元数据简单来说,就是一个描述数据的数据,对数据及信息资源的描述性信息,还是云里雾里吧?举个栗子:我们来介绍一下我们的国宝大熊猫。
有了这些信息介绍,我们就可以判断大熊猫是一种什么样的生物了。这个例子中的 "中文名"、“别名"、"界",就是元数据,因为它们是用来描述具体数据/信息的数据/信息。
还不能够理解啊?
那就再举个栗子:
试着想一下:如果在短时间内必须要快速精准的从一座图书馆里找到一本书,你会怎么做:
A.通过书籍卡片目录查找 B.在书籍的海洋中,一本本寻找
中国图书馆按照现行法规,将图书分为 22 个基本大类:
知道了自己所要找的书籍是哪种类型的之后,就是按照具体分类了:
例如在 A 系列之中:
这样便可以通过这些具体的元数据类别来进行寻找,不过这只是找到这本书的系列,要找到图书馆内的某本具体的书,还是需要在这个系列的书架之中再寻找的,但也比一本一本的找来得快。把系列的书放在一起,这样读者想要查阅有关信息的时候,就可以更方便的在附近取书,不需要再知道其他书的号码了。
欸嘿,就这个元数据这个东西,又有什么用呢?
元数据的目的在于:识别资源;评价资源;追踪资源的变化;管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。
它的好处在于能够把信息的描述和分类可以实现格式化,为机器处理提供基础。
其实我们日常生活之中每天都会接触到元数据,比如在听音乐的时候,我们通过搜索歌名查找歌曲,就是通过元数据来进行查找,而我们需要找寻的歌曲,就是歌曲名的数据。
然后这些元数据也会记录我们的搜索记录,进行再记录,组合成大数据。
又或者使用手机 app 的时候,这个 app 的图标、名称等也都是用来描述这个 app 的数据,而这个 app 本质上也就只是一串数据。
从企业角度来讲,大数据时代,企业数据量成倍增长,但企业数据环境中究竟有哪些数据,数据和业务之间的关系是什么,数据都在哪里,全部是需要解开的迷。
元数据是对数据的描述,采集企业环境中的各类元数据并统一存储,通过分析元数据,根据业务维度、系统维度等不同维度对数据分类,并梳理出数据和数据之间的关系,将能从多种视角 360°展示出企业的数据资产视图,让企业不同的员工都能方便地看到自己关心的数据情况,使大数据不再 “暗无天日”。
正如图书卡片可以帮助读者快速找到所需要的书籍,元数据为业务人员展示了数据的业务含义、数据在哪里等信息,还可以提供数据之间的业务关系与样例数据,帮助业务人员在理解复杂数据的基础上快速找到需要的数据。
Okay!那么对于元数据的讲解也就这么多了!
元数据很重要,那管理好元数据就更加重要,星环科技的大数据开发工具 Transwarp Data Studio 的子产品——数据资产目录 Transwarp Catalog 支持主流数据源的元数据和血缘信息的自动采集、更新、版本管理,统一异构多源的元数据管理来完成全局化的数据资产管理流程。通过管理元数据可以充分释放数据的价值!!!
评论