什么是数据流向分析?
数据的业务逻辑流向,可以辅助我们在数据情报分析过程中,直观分析数据的逻辑走向,通过可视化流向方法助力我们观察数据层次、变化、逻辑、特征。在说数据流向分析之前,我们先看一下什么是数据流动、什么是数据流向、什么是数据流向图。
数据流动
数据如何可以流动?数据怎么可以流动?数据流动是一种对数据处理、交互等数据逻辑的一种表述。数据本身是不可以流动的,数据流动早期可以用数据复制移动来解释。在数据和应用建设过程中的数据传输,可以是物理的数据流动。在数据分析过程中,指数据业务逻辑关系流向的阶段过程。
数据流向
数据分析赋予了数据的流动性,结合业务数据方向,比如在数据分析过程中表示是,那我们由此可以总结,数据流向是为了业务表示对业务数据的数据项之前产生的数据关系变化过程记录和认识。可以用图形方式来表示数据,数据流程图,表示宏观的数据传递和业务逻辑变化。
数据流向图
数据流向图,表示业务数据方向,通过顺序方向体现数据中数据值的变化、方向、关系、层级等。数据流向图比数据流程图更微观、更具体,更能体现数据深层次的含义,也因为被热爱数据分析的人喜欢。数据流向图,和 DAG 图类似,DAG 比数据流向图又更具体,是有向无环的图,但在数据分析过程中我们会利用数据流向图去观察是否产生环路,这一点和 DAG 图不一样,DAG 更多是树形结构。
数据流向分析
数据流向分析,数据可以通过任意结构化数据,包含数值类型、数据方向、大小属性表示数据整理逻辑流动方向的分析过程。我们可以通过流向图来表示不同的数据流向,比如资金交易数据、物流数据、通联数据、税务进销项数据等等。
(1)资金流向分析
下面举例说明,首先看一个资金数据的样例,我们看看资金流向是什么样子的效果。
这个资金数据中的金额部分是主要的分析内容,所以金额部分在分析的时候数据类型必须是数值型的,可以是数字、浮点、整数都可以,但不能是文本、时间。
我们先把上面数据生成一个可视化关系图。
在关系图中选中要分析的实体,设置流向图的条件
执行生成流线图,这样我们就获得了一个针对这个分析目标的层级流向图,在这说明一下,如果有多层,可以更具步数调节,来定义流向层级的多少展示分析结果,在对图上进行深入标记分析。
(2)物流流向分析
下面再举例说明,看一个物流数据的样例,我们看看物流流向是什么样子的效果。
这个物流寄递数据里发现没有数值型的数据,但我们还行对这个物流数据进行数据流向分析,我们尝试一下插入一个辅助数值列,操作看一下效果。
辅助数值列,插入的辅助列必须选择数字,我们在做一下数据编辑,找几个发货人,以发货人为单位分类,分别设置几个不同数值,我这里就设置了 1-10 之间的数做演示。效果是这样的。
我们通过辅助修订的数据进行可视化上图,这里如果之前有关系模板,由于我们之前对数据做了更改,对链接属性需要进行“辅助数值列”进行新增。
因为演示数据比较少我们这里就全选看一下效果,设置一下参数,因为我们辅助的数据是 1-10 之间所以这里参数我们选择 1,步数我们设置大一点。
我们看到数据只有二层,前面是发货人电话号码,后面是收货人电话号码。这样我们就把不可能进行流向分析物流数据,进行了流向图展示。
还可以通过演示标记进行进一步的分析。
流向图的方向是从左一直向右。流向图的线宽,表示数值的大小,由于我们物流数据的展示是虚拟了一个辅助列所以这个线宽不能作为分析依据,但我们通过辅助列实现了物流收发的展示。在含有正常数据值的数据里我们可以线宽可以作为分析依据。
今天我们用了二个数据举例说明数据流向分析方法,通过不同技巧和思路,我们可以把不同类型数据都可以通过数据流向图来展现。如果你感兴趣也可以试一试。关注“清林情报分析师”公众。
关注公众号回复暗号“专业版”获取下载链接
关注公众号回复暗号“个人版”获取下载链接
评论