数据可视化:图表解析系列之柱状图
释义
维基百科:是一种以长方形的长度为变量的统计图表。长条图用来比较两个或以上的价值(不同时间或者不同条件),只有一个变量,通常利用于较小的数据集分析。长条图亦可横向排列。
作为人们最常用的图表之一,柱状图也衍生出多种多样的图表形式。例如,将多个并列的类别聚类、形成一组,再在组与组之间进行比较,这种图表叫做“分组柱状图”或“簇状柱形图”。将类别拆分称多个子类别,形成“堆叠柱状图”。再如将柱形图与折线图结合起来,共同绘制在一张图上,俗称“双轴图”,等等。
请注意:【条形图】在不同的产品或是概念解析中存在差异,例如在维基百科中,条形图等同于柱状图,认为柱状图为条形图的另一种称呼。而更多时候条形图我们可理解为专指横向的柱状图。
分组柱状图:由子类别来划分一组有几条柱子,形成分组柱状图。
堆叠柱状图:由堆叠项将一个类别拆成多个子类别形成堆叠柱状图。
双轴图(组合图)
双轴图的指标分为左侧指标和右侧指标,对应的坐标轴分别为坐标 Y 轴的左轴(主轴)和右轴(副轴)。通常以柱状图与折线图搭配使用,例如下图展示一年中各个月份的销量(柱状图)与目标完成率(折线图)。
适用场景
柱状图最适合对分类的数据进行比较。尤其是当数值比较接近时,由于人眼对于高度的感知优于其他视觉元素(如面积、角度等),因此,使用柱状图更加合适。
需要避开的陷阱
1.柱状图最核心的功能是比较,比较的核心是高度。如果人为的改变高度,那么数据间的比例关系会失常。
示例(来源为《用数据讲故事》):
2012 年秋季,我们好奇布什的减税政策结束之后会发生什么。图中左侧为现在的最高税率 35%,右侧则是第二年 1 月 1 日的最高税率 39.6%。
看这幅图时,你对未来减税政策结束有什么看法?或许担心税率的大幅提升?让我们仔细看看。注意纵轴的底端(最右侧)是从 34 开始的,而不是 0。这意味着条形图理论上应该向下延伸到页面的底部。事实上,按图中的画法,视觉增长达到了 460% [条形图的高度是 35-34=1 和 39.6-34=5.6,所以(5.6-1)/1=460%〕。如果我们以 0 作为纵轴起点,条形图按实际高度绘制(35 和 39.6),实际视觉增长只有 13%[ (39.6-35)/35]。
2.不管是延续性还是暂时性的时间数据,我们最常想的是从中发现趋势。某个东西是在上升还是下降?是否存在周期性的循环?要想找出这些变化中存在的模式,就必须超越单个数据点,纵观全局。只观察某个时间点上的数值当然更轻松,但只有在了解到来龙去脉之后,你才会对这个数值产生更深刻的理解。
示例(来源为《鲜活的数据》)
从上图看来,似乎新政府对失业产生了显著的积极效果。但如果把当前图表缩小,以更长的时间范围观察呢?你是否会得出不 一样的结论?
版权声明: 本文为 InfoQ 作者【数据分析小能手】的原创文章。
原文链接:【http://xie.infoq.cn/article/42df80a425df2d82846849abe】。文章转载请联系作者。
评论