写点什么

数据不只是数字:描述、分析、展示呈现数据的故事

  • 2023-05-09
    广东
  • 本文字数:3041 字

    阅读完需:约 10 分钟

数据不只是数字:描述、分析、展示呈现数据的故事

对于想要推动业务增长的公司来说,数据分析具有很高价值。 麦肯锡、英国《金融时报》和谷歌等巨头的研究证实,依靠数据分析来推动业务决策的公司,其增长速度相比竞争对手快 2.5 倍。

这篇文章我们介绍如何使用描述性统计,也就是怎么进行描述性分析,介绍描述性分析是如何适应更广泛的数据分析的。

如果我们要做围绕业务进行数据分析,单纯只掌握描述性统计的原理,遇到业务问题仍会一头雾水,这时候就需要懂得如何使用描述性分析。那么怎么理解描述性分析呢❓

数据分析是一个更广泛的领域,起着协助业务提升创收💰 和降低风险⚡等作用。数据分析师通常使用四种类型的分析,用于回答不同的问题和提供不同的见解:


  • 描述性分析:发生了什么?

描述性分析通常用于描述或总结数据,以便更好地理解数据的整体情况,以及趋势和特征。


  • 诊断分析:为什么会发生?

诊断分析则更侧重于了解数据发生的原因,以及如何解决问题。在诊断分析中,数据分析师通常会深入探究数据背后的原因,找到问题的根源。


  • 规范分析:接下来应该做什么?

规范分析则是基于数据分析的结果提出具体的行动计划,为业务提供明确的指导。


  • 预测分析:接下来会发生什么?

预测分析则是通过历史数据预测未来的趋势和结果。在预测分析中,数据分析师会使用统计预测和机器学习技术,为业务提供更准确的预测和决策支持。业务中回答"发生了什么"的场景:

  • 我们上个季度的收入是多少?

可以汇总上个季度的总收入的同时,使用平均数来计算上个季度的月收入。我们将上个季度的每个月的收入加起来,然后除以 3,得到平均收入。

  • 收入是增长还是下降?

计算上个季度的总收入与前一个季度的总收入的差异,以了解收入处于增长或下降趋势。如果差异是正数,表示收入增长,如果是负数,表示收入下降。我们还可以计算收入的增长率或下降率,即当前收入与前一个季度的收入之比减去 1。

  • 我们获得了多少新客户?

可以将时间范围圈在上个季度,计算上个季度获得的新注册客户数,以及上个季度注册的新客户在总客户中的比重(即新老用户占比分布)。

描述性分析可以当作数据分析的一个分支,也可以理解为一种分析角度,是构建所有分支的基础。因为业务在进行更深层次的分析前,我们都需要先对分析对象和业务进行了解。描述性分析通过总结数据、了解数据的基本趋势和特征,来回答业务发生了什么。后续分析再根据当前的业务情况,探究应该采取哪些优化措施。数据分析师通常会将描述性分析后的数据整理成易于理解,并且更直观的图表、报表等,以便更好地展现业务变化情况。

💡举个例子:下面这张仪表板,数据通过折线图、柱状图、词云图、表格等图表,能够让我们很直观地看出数据变化,了解数据趋势以及当前数据的表现。


描述性分析还用于基准测试,即设定对什么是好的表现的期望。通过描述性分析,我们可以了解数据的基本情况,然后设定一个可以接受的基准值或者合理的目标值,以便更好地衡量我们的业务表现。

💡让我们再拿一个例子看看

假设贵公司去年的收入为 100 万美元。听起来很多,令人满意?但如果我告诉你这是收入连续第三年下降呢?是不是觉得需要提升收入了。


通过描述性分析,我们可以查看该公司历史同期的收入,并计算出近几年同期的平均收入作为基准值。如果该公司的当月收入高于基准值,那么我们可以认为收入良好;如果低于基准值,那么我们需要进一步分析原因,并制定措施。因此,基准测试可以帮助我们设定目标、评估表现,并制定改进计划。<br/>如何进行描述性分析要使用描述性分析,需要完成 4 个必要步骤:


  • 确定指标:确定需要分析的指标或变量。

选择正确的指标是最重要的一步。因为不同的指标可以反映数据的不同方面,选择合适的指标能够帮助我们更好地理解数据的分布和趋势。当决定要在报告中展示哪些指标时,就决定了后续应该在哪些指标做优化决策。例如,选择总收入进行同期比较或者环期比较,可能出现两个截然不同的结果。


  • 准备数据:获取、清洗、转换和整合数据,以便进行分析。

数据获取可以来自不同的数据源,例如内部数据库、调查或公开数据集。但需要确保数据是准确的、完整的,并且可以被正确地使用和解读。如果有必要,需要对数据进行清洗和预处理,以减少错误或异常值的影响,方便在后续模型和分析中数据可用。


  • 分析数据:应用适当的统计方法和工具来分析数据。

在分析数据时,需要使用适当的描述性统计方法和工具来探索数据,计算数据的中心趋势、分布等等。随着大数据的出现以及现代企业在其数据仓库中持有的数据量呈指数级增长,不断有新的分析理论和技术应运而生。 在过去,描述性分析主要依赖于传统的统计学方法,它只能提供繁琐而冗长的数据摘要和基本洞察。现在通过使用机器学习和数据挖掘算法,描述性分析得到进一步的增强和扩展。例如,在描述性分析可以使用机器学习和数据挖掘算法来进行数据聚类、分类、预测等操作,以便更全面地呈现数据的特征和变化趋势。


  • 展现数据:将分析结果呈现出来。

除了常规的报告和报表,可视化数据可以使得结果更容易理解和传达,并帮助其他人快速理解数据的趋势、变化和关系,并在此基础上做出决策。

自动化的描述性分析

随着大数据的到来,数据量越来越大,与文字较多的报告和概述相比,增加视觉效果的数据仪表板会让人愿意多花时间在上面。

根据描述性分析的数据趋势和特征结果,转换为易于理解的可视化图表和图形。这有助于数据分析师快速了解数据,发现数据中的趋势和异常。同时大大简化数据分析的过程,提高分析的速度和准确性。


💡下面是一个使用数据可视化来讲述一个百万字的故事的例子:

假设我们要分析某产品的销售数据,我们可以使用数据可视化软件来创建视图,如:

  1. 趋势图:利用折线图展示周期的数据情况,轻松地展示出销售额和利润随着时间的推移的变化情况。通过看到产品销售的增长或下降趋势,对业务的长期发展做出预测,进而调整策略。

  2. 销售地图:利用地图展示不同地区的销售的销售情况,容易地对比不同地区的销售额。直观地了解哪些地区的表现良好,哪些地区需要更多关注。同时,销售地图也可以帮助我们发现一些潜在的销售机会,比如一些销售额较低但是市场潜力很大的地区。

  3. 店铺销量占比图:利用南丁格尔玫瑰图对比不同直营店铺的销量情况,通过比较不同扇形区域的大小,可以直观地了解每个店铺销售额在总销售额中的占比,以及不同店铺之间的销售情况。这种图表也可以用于比较不同产品类别或不同地区的销售情况。

通过将不同类型的图表组合在一起,并使用仪表板来呈现它们,我们可以创造一个完整的可视化页面,让用户更深入地了解产品的销售情况。另外,增加交互式元素如筛选器和下拉菜单可以帮助用户更轻松地探索数据并发现隐藏在其中的见解。

最后,推荐几款免费的数据可视化工具,可以帮助数据分析新手更好地理解和分析数据:


  1. Power BI:微软推出的数据可视化工具,能帮助用户实现大规模数据分析和快速决策;

  2. Tableau Public:流行的交互式数据可视化平台,提供丰富的图表类型和模板,让用户轻松地为自己的数据进行可视化处理;

  3. Metabase:开源数据可视化工具,通过友好的用户体验和集成工具进行快速分析,自行探索数据。

  4. DataEase:开源数据可视化工具, 支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以方便地与他人分享。


Power BI 更适合与 Microsoft Office 应用程序集成使用;Tableau 当前将不再向中国客户提供任何新的产品或服务,可以使用个人版试用。Metabase 和 DataEase:这两款工具均为开源数据可视化工具,但 DataEase 的视图 UI 更加直观友好,Metabase 则更注重于数据采集和处理。可以选择适合自己的工具进行数据可视化和分析。

发布于: 刚刚阅读数: 5
用户头像

如果没有观点,就不值得被关注。 2019-03-26 加入

从事开源与 BI 相关领域。

评论

发布
暂无评论
数据不只是数字:描述、分析、展示呈现数据的故事_数据分析_Data 探险实验室_InfoQ写作社区