再谈可视化:如何展示数据

2020-04-14 17:01:23 浏览数 (1)

如何来展现的你的数据?是你有时不得不去思考的一个问题。不同的展示方法,其效果往往差异巨大。这里我将结合近期的一些阅读和实践,试图给出一些方法,希望能帮助到你。

1. 展示之前的思考

在正式开始展示数据之前,希望你去思考几个问题。这些问题将有利于你后面的一些选择。

Who

  1. 首先要确定,这些数据展示的受众群体是谁?
  2. 深入去了解这些受众,以及他们的认知程度如何?
  3. 是否是第一次接受类似的数据?
  4. 最关键的,他们如何看待数据,是否对你很重要?

上述分析将帮助你发现你与受众之间的距离,从而采取必要的展示技巧,来确保他们能听懂你传递的信息。

What

  1. 你希望受众群体了解的数据是哪些?
  2. 这些数据是否准确,经得起推敲嘛?
  3. 数据口径是什么?是否符合人们的通常的认知?

是否包含了反面的数据?人为地清洗数据或只拿出佐证自己观点的正面数据,往往是站不住脚的。

Goal

  1. 你展示数据的目的是什么?
  2. 你想表达的观点是什么?
  3. 现有数据是否足够支撑你的观点?

Where

  1. 是在什么场合展示这些数据?汇报、交流、商务等
  2. 具体的形式是怎样的?PPT、纸质报告、图书等

How

在你回答了上述问题之后,你才能真正准备好面对最后这个问题:如何用数据表达你的观点?

2. 数据展示手段:文本篇

文本,是用来展示数据最简单的方式,也是最容易令人忽略的方式。人们总是有种倾向,希望采用某种炫酷的方式来说明数据;但其实最简单直接的方式效果最为显著。当你只有一两项数据需要分享时,简单文本是绝佳的沟通方法。可考虑只用数字(尽可能突出)和一些辅助性文字来清晰地阐述观点。此时如果使用其他方式,例如在表格或图形里只放入一、两个数字,但这种方式通常只会让展示方式带走人的眼球,而忽略了真正需要表达的信息本身。所以,当你确实只需要表达一两项数据时,不妨考虑只用数据本身。

比较上面两种展示数据的方式,左侧通过常见的柱状图表达,右侧通过简单文本方式表达。哪种更具备表现力,一目了然。

信息失真

在用文本表达数据时,有时是需要将数据收敛归纳出一、两个结论性数据来展示,但此时需要考虑信息失真的问题。例如上面例子表述为“2019年GDP比2018年增加1880亿或增长了6.2%”,这种就会产生数据失真问题。丢失了数据原有部分信息,应避免这种情况。

3. 数据展示手段:表格篇

当需要展示更多的数据时,表格或图形一般来说是好的选择。但需要注意的是,表格形式具有其特殊性,其与我们口头表达系统交互方式类似,这意味着我们是会阅读表格。当面前有一张表格时,通常会用到食指:我会一行一列地读,并且比较每个格子里的值。

表格最适合的场景是,有大量数据需要展示或受众群体关注点不同。但在PPT中使用表格往往不是一个好主意。当受众阅读表格的时候,他们不再听你口头表达的观点。当你在幻灯片或者报告中使用表格的时候,问问自己:你想要表达什么观点?你有可能找到更好的办法可视化这些兴趣点。如果这样做丢失了太多信息,不妨考虑将完整的表格放在附录中,用一个链接来满足受众的需要。

突出原则

使用表格时,因为本身就包含了大量数据,需要受众去阅读。如何在短时间内,突出核心内容,方便受众理解,就是关键所在。这里的原则就是尽量让设计融入背景,让数据占据核心地位。不要让厚重的边框和阴影与数据争夺受众的注意力。相反,要使用窄边框或者空白来区分表格的元素。注意下例中,上下用法的差异。

还可以使用另一种方式,突出你的数据。就是通过运用颜色差异,将表格中的细节和视觉暗示的使用结合起来,那就是热力图。热力图是用表格的形式可视化数据的一种方法,在显示数据的地方(在数据之外)利用着色的单元格传递数据相对大小的信息。用颜色饱和度提供视觉上的暗示,帮助眼睛和大脑更快地捕捉潜在的兴趣点。

在上边的热力图中,色彩的饱和度越高,对应的数字就越大。这使得受众很容易找出最大的数据(GDP值最高的地区和年份)。

4. 数据展示手段:图形篇

与表格的交互方式不同,图形是与视觉系统交互。视觉系统处理信息的速度更快,这也就意味着设计良好的图形通常能够比设计良好的表格更快地传达信息。

1). 线性图

线图是最为常用的一种图形,经常用来表示连续数据间的数据关系。通常,连续性数据都以时间为单位:天、月、季度和年度。如果不具备连续特性的数据,不适合用这种方式。

★ 折线图

最为常见的线性图,就是折线图。

如果存在多组数据,可使用下面分列显示,这样比较清晰。如数据量不大,也可以在一张图内显示,但应该是坐标口径一致,并做好标注工作。

★ 斜率图

还有一种特殊的折线图,被称为斜率图。它适用表现两个时间段或者两组对比数据点,可以快速地展示两组数据之间各维度的相对提升、降低等差异。斜率图组合了很多信息,除了绝对数值(数据点本身)之外,连接数据点的线条能够在视觉上直观地告诉你是提升还是降低以及变化的程度(通过倾斜方向和斜率),而无需解释这些线条的意义和变化程度具体是多少。

2). 条形图

条形图易于阅读。用眼睛比较条形图的末端,很容易快速得出结论:哪一类最大、哪一类最小以及类别之间的增减区别。

★ 水平条形图

水平条形图,顾名思义通过水平条线对比多组数据。人们通过对比右侧末端的位置,很容易比较出各组的差异。这种方式是比较符合人们的阅读习惯,即从左往右,从上至下的方式。特别是对于组别较多的情况,这种方式非常适合。

上面在一张图中展示31个省市自治区的GDP数据,使用条形图展示就非常合适。上图还使用了两个常见的条形图技巧。一个数值排序,这样有利于受众数值对比,二是使用了色温显示进一步加强了对比。

★ 竖直条形图(直方图)

跟水平条形图类似的就是竖直条形图。例如下图

★ 多组条形图

条形图也支持一组以上的数据。但需要注意的是,当你添加多组数据时,专注其中一组并得出结论就变得更为困难,所以谨慎使用包含多组数据的条形图。同时也要注意,有多组数据时,空白会把条形图分隔成视觉组。这使得类别的相对顺序变得重要。考虑你希望受众比较什么,并以此构造分类的层级,使之越简单越好。如下图所示,判读起来已经不太容易。

★ 堆叠图

作为条形图的一种特例,还有一种堆叠图。其旨在比较各类别之间总体区别的同时还能看出每个类别中子成分的占比情况。但这会很快产生视觉上的压力,尤其是采用大多数作图应用中的默认配色方案后。除了底部的子成分,你很难比较其他子成分在跨类别时的情况,因为不再有统一的基线可供比较。

3). 饼图

饼图,是大家经常使用的,但其实也是难以阅读一种图。当饼图的各部分大小相近时,你是无法或者很难判断哪一块更大。当大小相差较多时,你最多也只能判断某一块比另一块更大,却无法确定大多少。为了克服这个问题,你需要像下图一样添加数据标签。但我仍然觉得饼图不值它占据的这块地方。

用水平条形图替代饼图,按从大到小或者反向组织。记住,在条形图中,我们的眼睛会比较条形图的末端。由于以统一的基线对齐,很容易比较相对大小。这样不仅可以很直观地了解哪块最大,还能了解它比其他类别大多少。从饼图转换成条形图可能会有所遗漏。饼图能够传达的一个独特的信息就是整体和部分的概念。但如果图形本身难以理解,

4). 散点图

散点图在展示两个因素的关系时很有用,因为可以同时将数据对应到x轴和y轴上,观察是否存在某种关系以及存在何种关系。散点图在科学领域使用更为频繁。

5). 面积图

人眼不擅于在二维空间进行定量的度量,这使得面积图比我们讨论过的其他图表类型更难阅读。因此通常避免使用面积图,只有一个当需要可视化相差极大的数值时。方形带有第二个维度(同时有长和宽,而条形图只有长或者宽),因而能比单一维度更紧凑地进行可视化。

5.展示原则:认知负荷(简化、简化、简化)

人脑的处理能力是有限的。在展示数据时,应尽量减少受众脑力消耗,即用更低耗的方式展示。消耗受众脑力却对他们理解信息毫无帮助。这是我们需要避免的。最重要的在于受众感知的认知负荷:他们认为需要付出多少精力才能提取出信息。他们并不会通过深思熟虑地做这个决定,但这会影响你的信息能否成功传达。总之,要考虑为受众最小化感知到的认知负荷。这里可采取一些常规的原则:

  • 排序 通过数据排序,让受众更容易消化数据,更快速抓住信息要点。对比下图中的上下对比。
  • 对齐文字 对齐文字,特别是坐标系的文字,方便读者更容易对比数据。常见的策略是左侧坐标系文字右对齐,右侧左对齐,避免居中对齐的情况。
  • 适当留白 边界处避免出现文字和图表。避免拉伸图表撑满可用空间的欲望,根据内容多少决定图表的合适大小。
  • 去除边框 对于图中边框,一般是不需要的。可以考虑使用留白对页面中的图表和其他元素进行合理的区分。
  • 去除网格线 如果网格线对受众寻找数据对应的坐标值有帮助,或者感觉网格线会使数据得到更有效的处理,那可以保留。但也请尽量使用更细以及灰色等浅色的网格线。千万不要让网格线和数据形成视觉上的竞争。尽可能地完全去除网格线,这样会形成更强烈的对比,从而使数据更突出。
  • 去除数据标记 每一个元素都会增加受众的认知负荷。使用数据标记,就是在为本来已经可以根据线条直观处理的数据增加认知负荷。这并不是说永远不要使用数据标记,而是要有目的地使用,尤其不要因为它们默认包含在你的绘图软件里而使用。
  • 清理坐标轴标签 坐标轴的标签,常见的原点标注,一般都是不需要的。除非展示数据过多,且无法标注的情况,可以考虑使用。
  • 选择是否需要坐标轴 作图时常常需要决定是保留坐标轴标签还是省略坐标轴而直接标记数据点。为了做这个决定,你需要考虑特异性的程度。如果你希望受众重点关注整体趋势,可以考虑保留坐标轴,但是将其置灰来削弱其重要性。如果某些具体的数值很重要,直接标记或许更好。在后一种情况下,通常最好省略坐标轴以避免包含重复信息。总是要考虑你希望受众如何使用图表,并以此来作图。
  • 直接标记数据 在图例和数据之间切换是非常麻烦的。可将需要尽量识别出任何可能消耗受众精力的问题自行承担。建议在需要描述的数据旁进行标记。
  • 慎用颜色 在少量使用时,颜色是吸引受众注意的最强大的工具之一。但请克制为了丰富多彩而使用颜色的冲动。有选择、有策略地使用颜色这一工具突出图表中的重要部分。建议自行选择颜色的使用,而不是让工具自动选择。可以考虑统一色调、对比色、品牌色的使用。
  • 强调大小 大小很重要。相对大小代表了相对重要性。如果你需要展示几件重要性相同的事情,请使用相似的大小。相反,如果有一件事情尤其重要,那么用大小来体现这一点:将它变大!
  • 文字体 包围,加粗,斜体,间隔,下划线。这些对文字的处理,也可以帮助突出信息,可酌情使用。
  • 位置 大多数受众会从图表或者幻灯片的左上角开始,按“之”字形扫视屏幕或者页面。他们会最先看到页面的顶端,这使得这里成为了风水宝地。考虑将最重要的内容放在这里。

0 人点赞