自学数据分析——数据分析方法和模型
一、数据分析方法
数据分析的思维需要培养,先模仿别人,从模仿者到创造者。首先需要建立数据的敏感性,能快速了解数据在说什么,下面我们以抖音教育直播为例,首先来了解核心指标,以及各个指标所表示的含义。
了解完核心指标的含义后,下面我们运用各种数据分析方法对数据进行分析:
1、根据核心指标(直播间数量)对业务的一级品类进行占比分析。
2、根据核心指标(观看次数 PV)对业务趋势进行分析,可通过分析趋势异常拐点以及曲线波动出现的原因,来发现规律。
分析更细粒度的观看用户数 UV,查看细粒度趋势。
3、对 2020 年 1 月和 5 月教育类达人开播直播间数进行对比分析。
同比:相邻时段中某一相同时间点进行比较。
同比的计算公式为:同比增长 =(本期统计周期数据 - 去年同期统计周期数据)÷ 去年同期统计周期数据 × 100%
例如:15 年和 16 年是相邻时段,15 年 2 月和 16 年 2 月是这两个相邻时段的同一个时间点,把这两个时段进行数据对比,就是同比。
环比:相邻时间段的对比。
环比的计算公式为:环比增长 =(本期统计周期数据 - 上期统计周期数据)÷ 上期统计周期数据 × 100%
例如:2015 年 3 月份和 2015 年 4 月份相比较就叫做环比。
4、通过两个以上核心指标将业务对象按照象限划分,进行象限分析。
5、Top 排名分析,可通过面积图曲线分析数据的长尾效应。
长尾效应:英文名称 Long Tail Effect。“头”(head)和“尾”(tail)是两个统计学名词。
正态曲线中间的突起部分叫“头”;两边相对平缓的部分叫“尾”。从人们需求的角度来看,大多数的需求会集中在头部,而这部分我们可以称之为流行,而分布在尾部的需求是个性化的,零散的小量的需求。而这部分差异化的、少量的需求会在需求曲线上面形成一条长长的“尾巴”,而所谓长尾效应就在于它的数量上,将所有非流行的市场累加起来就会形成一个比流行市场还大的市场。
6、对数据按照不通的维度拆解,进行不通维度的数据分析。
二、数据分析模型
这里的模型不一定是指具体分析数据的模型,也是一种思想的模型,下面我们介绍三种常用的数据分析模型。
1、费米问题-大致估算
从供需关系的角度能解决 80%的费米问题,有多少追求就有多少的动机。我们假设加油站能满足需求,然后基于我们已知的信息,计算一个加油站的供给能力,加油站的需求量,最后 需求除以一个加油站的供给能力,就能得到所需的加油站数量。
当然,这个数据不一定是准确的,我们需要知道的是,这个过程叫做建模,用到的数据就叫做参数,根据这些数据我就能预测出想要的数值。供需关系是我们解决费米问题的一种思考方式,利用空间关系、收入关系、时间关系等同样可以解决此类问题。
2、七问分析法-思考角度的拓展
解决问题的时候,我们都可以通过 5W2H 的方式来寻找解决问题的角度。
3、分析互联网产品,AARRR 模型
AARRR 模型中每一个步骤都有一两个关键的指标:比如留存步骤中的留存率,变现步骤的变现率,传播中的引客因子(一个人可以传播几个人)等等,感兴趣可以自己进一步详细了解。
拼多多的砍一刀就是一个很好的案例。
三、总结
通过上面的内容,我们学习了几种常用的数据分析方法和数据分析模型。
数据分析方法包括:占比分析、趋势分析、对比分析、象限分析、排名分析、维度拆解。
数据分析模型包括:费米问题-大致估算模型、七问分析法模型、AARRR 模型。
当我们进行数据分析时,面对数据指标,我们可以使用上面的分析方法进行分析,如果有需要解决的问题,我们可以通过数据分析模型进行分析处理。
参考资料:B 站 python 数分课堂
评论