Tableau冠军独家秘籍,看可视化语法如何巧妙引导思维

2018-08-08 14:16:30 浏览数 (1)

随着数据使用量的增长,越来越多的人通过数据来寻求专业问题的答案。数据可视化是一个沟通复杂信息的强大武器,通过可视化信息,我们的大脑能够更好地抓取和保存有效信息,增加信息的印象。如何利用好可视化工具?如何炼成可视化大师?在1月17日的数据侠线上实验室,DT君邀请到2017Tableau大赛上海冠军、Merkle数据分析师林雨旸,为大家传授“秘籍”。

▍数据可视化:一场带有目的性的沟通

今天我演讲的主题是从Tableau可视化大赛学数据话术,换句话说就是怎样利用数据可视化的方式,在工作或是生活中达到想要的目的。

在正式进入主题之前,我想先分享两位我非常喜欢的可视化大师。

第一位是美国的前副总统阿尔·戈尔,他在2006年时上过TED的演讲,主题是对气候危机的新思考。令我印象深刻的是,他站在整个屏幕的最右边,利用PPT清楚地向大家展示地球CO2浓度达到了怎样的高度,进而提醒人们CO2对地球升温整体造成的影响。

另一位是苹果的灵魂人物史蒂夫·乔布斯,每一次苹果的产品发表,他都会用浅显易懂的可视化方式去呈现苹果运营数字。

阿尔·戈尔和史蒂夫·乔布斯在和听众沟通时,都利用了数据可视化的方式达到他们的目的,成果是有目共睹的。我一直认为,数据可视化就是这样带有目的性的沟通过程,因此如何有效地利用可视化进行沟通,并且达到目的,在大数据时代非常重要。

接下来,我将以我参加Tableau比赛的经历,来详细讲一讲如何满足双方沟通的期待,赢得比赛。

我身为一个参赛者,在比赛过程中必须满足评委对数据可视化、比赛规则的期待。

这个期待我把它分为两个部分,一部分是合情,另一部分是合理,合情是指一些比较硬性的规则,如需要用什么样的工具操作、用哪些数据来做可视化报告;合理是指如何用可视化语法去解读数据。

▍如何用:基本工具和数据分类

首先我们要先了解实现数据可视化的工具——Tableau。Tableau有三个大的产品线,分别是Desktop、Server (包含Server与Online)和Tableau Public。

也许很多人认为Tableau是很难入门,其实它可以直观地理解成是Excel加上PowerPoint的合体,最后可以呈现出来的效果就像下图,无论是折线图、长条图甚至是地图的功能,它都能够实现。

除了工具以外,我们还需要知道哪些数据可以分析,数据本身如何分类。

我们可以把数据进行高维度地分类:

第一类是分类变量或是名义变量(Think Named…),这类变量像是地区性、姓名等讯息,它们本身不会有先后次序,也不会呈现这背后具体代表了多少的数字。

第二类是顺序变量(Think Ordered…),这类变量的呈现方式是有先后次序的,可能是从1排到100、或是从时间近的排到时间远的。

第三类是区间变量(Think How much/many?),例如重量、成本、折扣,都算是区间变量。

▍如何说:数据可视化的语法

针对不同种类的数据,有这样一个粗浅的认识后,我们就可以进到下一步——数据可视化的语法,如何“说”才会让听众在视觉效果上更舒服,且能够容易地记住你的内容。

我在这里给大家分享3种数据可视化的语法,分别是心理学、实测和通用规则。

首先是完形心理学,也叫做格式塔理论,理论内容是人们总是会先看到整体,再去关注局部,人们对事物的整体感受不等于局部感受的加法,视觉系统总是在不断地试图在感官上将图形闭合。

我们可以来看下面这些如邻近、相似、闭锁、对称等关系,这些关系实际上能怎么利用到设计可视化报表中呢?

下面这张动图可以更明显地解释完形心理学:

大家看到这张动图,这些点从一开始散布在画布上,到特有位置或者特有颜色,甚至是利用外加框的方式实现分群辨别,这些都是在做数据可视化时常常会用到的技巧。

其次就是实测——人眼追踪技术,以此能清楚了解人的视觉路径。

大家可以看到下图所显示出来的,通过追踪眼球落点的先后顺序,或者通过热力图的方式,知道人的眼睛到底停留在画面的哪个部分是较久的,进而去推出一些通用原则用于设计可视化的报表。

其中,眼球追踪技术有两个结论我认为是非常关键的,一是F式布局。

大家可以发现上图热力图的分布布局都像一个“F”,即人的眼球会先从左上角扫描到左下角,接着再从左到右。

二是空白很重要。

大家可以发现上图左边和右边的热力图显示出的密集程度是不一样的,左边密集程度比右边密集程度低,导致这其中的差别就是右边背后的文本,当文字与文字间、图片与图片中间的空白是足够多的,人的眼睛看起来会更舒服,并且愿意停留更久。

最后是在商用条件下的通用规则,这能有效地掌握双方的期待。

上图是由一位美国博士提出来的简单工具,它能够在你看到数据维度时,从原则性的角度出发告诉你在碰到不同情境之下应该用什么样的图表来做呈现。

另一个通用原则是关于仪表板的三种经典类型,分别是战略型、运营型以及分析型。

战略型仪表盘更多的是为高层管理者快速掌握企业的运营情况,并据此快速做出决策和判断,对过去做出总结或是对未来拟定战略性目标。

战略型仪表板的使用情境,就像是你要和公司高管去做简报,必须要在很短时间内把报告里的重点都消化完,所以这样的报告理论上都会是静态的,并且会凸显报告中的一些关键数字,让你的高管一目了然。

运营型仪表板相较于战略性而言,不同的特点在于它的本质是动态且直接的。

当我们给管理者一堆报表,再优秀的管理者,他也不能够及时地反应过来,该如何驾驭好企业的运营之舵。而运营型仪表板背后的数据其实是“活”的,你需要定期去更新仪表板背后的数据内容,从而能够让决策者能够在较短的时间内消化,看出数据中有问题的地方进行追踪。

分析型仪表板的作用主要是让使用者可以获取到各个前端业务信息系统的数据,需要额外的上下文,不能光有一张分析的仪表板,而是需要连续2-3张,能够让你的使用者针对设计出来的仪表板去做更深入的追踪,从而看出数据当中的一些问题。

这里分享一张关于我自己根据这些通用的原则,在比赛现场做出来的作品当中的一张幻灯片。

这张图表现了中国在过去的十几年中所有的创投是怎样分产业的,依据不同产业的情况能够看出金额的分布。Tableau非常强大的地方就在于你可以实时地去做一些操作,也就是像这张动图里面所显示出来的,可以根据下面的小游标,去告诉观众现在眼睛应该要看到什么地方。

▍用创意图表惊艳你的听众

讲完了这些简单的原则后,我认为如果最后想要拿下比赛的冠军,或是要在谈判中取得胜利,你必须要从锦囊当中拿出一些让人惊喜的内容。

大家都知道,我们常见的图表有条形图、折线图、地图等,而通过一些非典型的图表可以实现给听众惊喜的目的。

例如下面展示的四幅图:漏斗图、南丁格尔玫瑰图、路径走向图、甜甜圈图,灵活应用这些图表能够让整体的数据可视化报告增添让人意想不到的惊喜。

除了上面提到的几种图表以外,这里再详细介绍两个我在报告当中非常喜欢用到的图表。

一是Bump Charts(凹凸图):

凹凸图最主要能够呈现出次序的时间类比、次序的数据类型。并且加上时间维度之后,就可以很清楚地看到无论是公司的产品、销售来源或是任何可以排名的东西,在经过时间轴的眼镜之下,可以怎样去做趋势的分布。

二是Sankey(桑基图):

桑基图可以在不同时间节点上看到数据到底是怎么流通的。

比如说客户群体从A到B到底是怎样去变化,可能在节点A时,客户群体有十个人,到节点B时,客户群体变为20个人,那通过桑基图,我们就可以更直观地观察这些人群的分布动态到底是怎样的。

除了这些Tableau里面自带,但你可能要经过一些特别设计甚至写一些数学函数能够呈现出来的图形以外, Tableau也有非常大的弹性,能够让你除了它本身的功能以外,可以结合如JavaScript的一些解决方案。

如利用Tableau和D3(D3即Data-Driven Documents,是一个基于JavaScript在网页上实现数据可视化的工具)更有弹性地去设计出Tableau里没有办法设计出来或是需要较长时间开发出来的图形。

(图片说明:通过Tableau制作的可视化图表,展现权力游戏中每个王国间的互动关系)

回到今天分享的主题——如何通过数据可视化的方式达到谈判的目的。

总结来说,我们可以从最基础的原则开始,例如心理学原则、眼球追踪原则、特殊的可视化效果、结合不同的技术和创新,从而让你的观众留下更深刻的印象并达到沟通的目标。

除此之外,我认为还有最重要的一点——练习。我给大家推荐几个关于数据可视化的学习网站,上面有很多数据可视化大师的作品或丰富的数据源可以拿来练手。

注:以上内容根据林雨旸在数据侠线上实验室的演讲实录整理,已经本人审阅。本文仅为作者观点,不代表DT财经立场。

作者 | 林雨旸

编辑 | 项静 : xiangjing@dtcj.com

题图 | 视觉中国

▍数据侠门派

本文数据侠林雨旸,现任上海电通Merkle数据分析师,协助娱乐、高科技等客户透过数据挖掘的方式发现并创造价值。热爱数据和统计、营销、科技,曾自主创业,担任过跨国销售、上市专案经理等职位。旅居欧洲、美国等地,喜欢旅行、阅读、运动、音乐、Podcast。现与朋友经营RS实验室订阅号,希望利用数据分析的方式发现生活中有趣的事物。

0 人点赞