Tableau 数据可视化:拖拉拽看看 资本巨头都干了些什么

2021-08-03 14:56:09 浏览数 (1)

作者: 黄斐

经常有人问我Tableau可以做什么,简单来说:

1. 拖拉拽就实现数据可视化,但同时能满足高阶需求

它跟excel的透视表类似,只需要把维度拖拉拽到面板,不需要代码,甚至还会自动帮你决定用条形图、气泡图还是箱线图。傻瓜式入门的同时,它有很多高阶功能,快速表计算、参数、LOD等功能基本能满足所有数据展示需求,还能跟R集成、调用函数和模型。

2. 好看

这不太好证明,但我印象很深,Tableau创始人Christian Chabot、Chris Stole和Pat Hanrahan,他们背景分别是风险投资人、计算机博士和奥斯卡视效专家,Hanrahan研发的渲染技术在《指环王》和《哈利·波特》里都有所运用。大概这就决定了Tableau除了擅长数据分析和功能能丰富之外,另一个重要基因是视觉效果。版面、配色、甚至字体,都会考虑数据可视化的需求来设计。

3. 交互和探索

这是tableau最迷人的地方,它不只是一个二维的图表,通过交互可以查看不同层次和维度。它鼓励读数据的人自主探索,可以从总体看到规模趋势、也可以不断下钻看到细节。类比用户研究,相当于除了定量数据,你还能做定性研究,看到每个具体用户的信息和真实的声音。 记住它擅长的事,如果你再拿它来做静态的条形图,那它真的只能是个很贵又很难用的EXCEL。

下面分享一个案例,是今年我在tableau viz 可视化比赛的作品。请看链接:https://public.tableau.com/profile/fei.huang#!/vizhome/TableauViz_sh_final_Feihuang/1

数据是一些投资机构(包括IDG、红杉资本、阿里、腾讯等)的投资数据。数据很简单,11列X1975行。示例如下:

*数据经Tableau方处理,回报率不代表真实回报率

Story-把数据串成一个故事

Teablau形式有worksheet, dashboard, story。worksheet相当于单个的图表,dashboard把多个worksheet拼成一个页面,而story就把多页数据串成一个故事。

现场只有30分钟完成作品,需要呈现故事性,所以我做了个5页的strory。

page1"感受投资风潮" ——“页面”功能实现时间轴动态

这一页只是引入,让观众感受下十年间投资的变化,展示总体趋势。图中每个圆点是一次投资,圆圈大小表示投资额,颜色深浅为时间先后,文字标注展示投资机构和投资对象的名字,每个圆圈鼠标上移有具体每个项目的信息, "页面“可以选择时间,也可以动态播放。

1999~2016的16年期间,这10家机构在各地投资1974个项目,总金额超过2000亿元。

TIPS: 永远记得你的屏幕是个平面,横竖就真的只能展示二维,每增加一个数据维度,就需要在图上增加一种能量化的元素, 比如颜色、圆圈大小。当然对时间数据,还有一个利器是动态图。元素越多、图就越难理解,一定要根据展示意图有所取舍。

page2 "看清投资风向" ——“效果”功能实现两个图表之间的联动

这一页的上图是投资金额在各机构的分布随时间的变化,每个颜色代表一家投资机构。早期是IDG、红杉等专业投资机构为主,2008年会后腾讯和阿里开始入局,在2012年前后逐渐成为投资巨头。

下图展示的是投资的行业分布,每个颜色为一个行业、每个小格子为一个投资对象,通过筛选器选择时间。早期投资对象为房产、旅游业,后期投资行业越来越多,涉及各个领域,在2016年投资行业第一名为金融业,第一名是京东金融、融资66亿。

这图最妙的地方是在鼠标指到上图的某个时间、某个投资机构,下面的图会展示该机构在那个时间的投资行业和对象分布。你会看到腾讯2008年还只投资游戏和广告,2015年它投资涉及16个行业,项目数都数不过来。

TIPS: 每个读者关注的角度可能不一样,比如我会对腾讯的投资感兴趣,阿里的读者可能关注阿里的,因此允许用户自由探索,可以让不同的人关注到不一样的细节。

page3"评估投资及回报"——箱线图 散点,展示个体和整体的水平

这个图比较简单,左图放的是整体的投资金额和回报率曲线。平均投资金额在14年后暴增,平均回报率则基本稳定在0.5。

右图放的是不同轮次的投资金额和回报率变化,投资金额从种子轮到A/B/C/D/E轮融资金额越来越大,但在每一个阶段都可能得到从0到1的投资回报率。也可以看到,并购类的回报率整体偏高,战略投资金额很高、但回报率不高。

除了箱线图展示各轮次的整体水平,每个散点都展示了一个具体项目,鼠标上移到具体的点,就能看到超出平均水平的这些点,具体都是什么项目。

TIPS: 投资金额和回报率跟什么东西有关?有些人会试图强制找到规律,做个回归曲线之类的,但这数据连续变量只有金额和回报率,他两之间并不是正相关关系,再加上极值很多、即使有模型也并不适用。通过桌面研究和整理数据后来发现,金额最重要的变量是投资轮次,而回报率,没有规律就是最大的规律。

page4 “探索优质项目”——聚类分析产生新变量

这一页比较复杂,首先左上角的图,根据投资金额和回报率,把所有项目通过tableau内置的聚类算法分成6类,直观的看到:高投资金额分为高回报和低回报,低投资金额分为低、中低、中高、高回报。

项目分为六类后,右上角图展示的是各家投资机构六类项目的分布,看到高投资项目主要是阿里、腾讯、红杉,而低投资的项目,除了光源资本,各家都有低、中低、中高、高回报项目,只是比例略有不同。

下图则展示的是所有投资项目获得的投资的轮次、以及每一次融资的详情,这时候这个图几乎已经把所有的数据都展示出来了。用LOD功能计算每个项目的投资轮次、按轮次排序。

同样它可以跟上面两个图做联动。比如选择一个高投资、低回报的一次投资,投资对象是美团,可以看到美团在A B 轮时主要是低/中低回报的,C轮是低投资高回报,E轮则进入高投资阶段,投资他的机构有每轮都参与的红杉,以及腾讯和阿里巴巴。

TIPS:tableau的“提示框”,可以把所有相关的明细信息都放进去,鼠标上移的时候,就能马上看到详细的信息。

page5“end”——展示每一个数据点

这一页只是个结尾页,没有很多信息,上面每一个点展示的是一次投资,颜色表示行业、大小表示投资额。

你是不是想投诉我图片都看不清,看不清————说明tableau做的事情不是图片能解决的~

请再看一次tableau public链接:https://public.tableau.com/profile/fei.huang#!/vizhome/TableauViz_sh_final_Feihuang/1

本文仅代

0 人点赞