写点什么

主题域模型

作者:奔向架构师
  • 2022 年 7 月 22 日
  • 本文字数:523 字

    阅读完需:约 2 分钟

接触数据,都知道数据仓库之父给数据仓库的定义就是“数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。”从数据仓库的定中可以看得出来数据仓库的四种特性,即:面向主题的、集成的、性对稳定的、反映历史变化的,所以什么是数据仓库的主题?


主题是一个比较抽象的概念,对于数仓的主题是指在较高层次上将企业信息系统中的数据综合、归类、并进行分析利用的抽象集合。这是对数据开发人员将的定义。在对非数仓人员解释主题就是:面对企业大量且杂乱的数据进行集中存放是,把一类数据放在一起,这个类就是主题的概念。数据仓库一般都是怎么来划分的?

行业里面比较经典的就是 TD 在金融行业沉淀的 10 大模型领域,包括当事人、客商、协议、事件等等,这是因为数据仓库做的就是将数据解耦,分开存储。这样能够在大型团队比较清晰的认识到企业的数据情况。但是简单的企业,一般也都是按照源系统或者按照业务来划分的。主题域类似数据的蓝图,在数仓之前进行规划,这时候一般是按照企业实际的业务进行划分的。在实际的工作当中,根据入仓的数据种类不同,我们讲实体表放在不同的主题下,供下游系统使用。具体的模型中就会引入模型设计的概念,也就是常用到的“范式”、“维度模型“的概念了。

发布于: 3 小时前阅读数: 11
用户头像

还未添加个人签名 2018.11.20 加入

还未添加个人简介

评论

发布
暂无评论
主题域模型_数据仓库_奔向架构师_InfoQ写作社区