数据可视化,是数据分析师日常工作中绕不开的内容之一。在工作中,如果只是以完成业务方的需求为目的,其价值会被大大缩水。本节,想和大家聊聊小火龙对于可视化的一些思考,希望你能够有所收获。
01
数据可视化理念
对于数据可视化,其目的是通过统计学方式探索数据本身的价值,并将其以合适的方式呈现出来,降低应用方对于数据的使用成本。
因此,小火龙认为,其核心理念主要涵盖两点:业务驱动性 可扩展性。下面,围绕着两点,谈谈工作中搭建可视化需要思考的因素。
02
搭建数据可视化思考因素
在搭建可视化时,往往会从业务方的需求出发,当然,除了思考能解决需求本身之外,还要考虑以下五点,帮助你获得额外的价值。
1、应用方是谁
为什么要知道应用方是谁?因为,往往不同的数据应用方,对于可视化的关注程度有所不同,优先级也存在差异。
一般,主要的应用方为:研发同学、产品/运营同学、数据/业务LD,下面从这三个方面谈谈差异性。
- 研发同学:研发一般关注的是数据底层情况,在出现异常的时候可以快速找到问题,因此,可将重心放在问题的发现上。同时,一般研发同学都有代码的能力,因此,后续的维护,甚至是搭建,均可交其自行完成。
- 产品/运营同学:一般而言,产品/运营同学对于SQL可能不会很熟悉,因此,在搭建方式的选择上,可以优先选择“拖拉拽”,尽量不写SQL,因为“拖拉拽”可以方便后续应用方更改,减少维护成本。
- 数据/业务LD:领导们对于数据可视化的诉求,往往是:易看 直击问题。易看,也指随时可方便的查看,因此就需要可视化支持移动端;直击问题,指能够在问题出现时,第一时间报警及发现问题本身,因此,需要重点关注报警机制。
2、可视化作用是什么
在知晓应用方后,还要明确此次可视化的目的是什么。一般而言,可视化的目的主要有三个:数据通用模版、数据例行展示、数据问题监控。
- 数据通用模版:此作用一般面向产品/运营侧,当业务定期需要看一些数据,但又不愿每次都等排期。于是会让数据同学帮助搭建数据看板,以便后续相似需求可在其基础上自行修改。此时,需要重点关注数据可视化的通用性 普适性。
- 数据例行输出:数据可视化的核心用途,例行输出需要重点关注数据生成的时效性 核心输出内容 可视化形式。可以做到时效性强 内容有价值 可视化程度好。
- 数据问题监控:对于核心指标进行日常例行监控,通过可视化的方式例行报警。由于一般问题监控都是核心指标,因此需要重点关注数据生成的时效性。
3、选择何种展现方式
针对不同的数据分析类型,选择不同的可视化图形。例如:趋势采用线性图、同环比采用柱状图、分布采用饼图等。
4、关注可扩展性
大多数数据可视化场景,往往是根据需求而来的。而随着需求的增多,可视化的内容也会被扩充。慢慢你会发现,BI平台上,有很多相似的数据可视化内容,这给不明口径的应用者,造成了很多困扰。于是,你会听到有人提出这样的问题:同一个指标,两个看板上的数对不上,麻烦帮忙看看是什么原因!
这里建议大家
- 搭建可视化前:判断之前是否有相似的内容,如有,则优先考虑在原有基础之上做扩充;如没有,在建设数据可视化的时候,要考虑其通用性,未来遇到相似问题,是否有扩充空间。
- 搭建可视化后:定期对存量数据可视化进行复盘,归总相似内容,减少资源开销。
5、例行下线机制
数据可视化,往往是每日例行产出的,需要消耗计算资源 存储资源,长时间下来,对于企业是一笔不小的成本。
这里建议大家
定期review可视化内容,从访问次数、访问人数、访问频次等角度去度量各可视化应用程度,将低频内容,定期下线。并将整套机制规范化 自动化 例行化。
03
可视化闭坑点
最后,谈一谈数据可视化的闭坑点,防止在工作中犯错。
其一:避免华而不实的图形表达。能用简单图形表示,就不用复杂图形,例如:用平面图,不用立体图。
其二:避免核心可视化内容分而治之。对于核心数据的可视化,建议由数据同学统一负责,一方面,防止口径出现偏差;另一方面,防止相同内容多图表展示,给应用同学造成迷惑。
其三:避免权限不设限定。很多部门,对于权限的把控不严格,随便谁申请都给开设。这样做,一方面会导致数据安全性得不到保障;另一方面,会使得搭建可视化的内容质量参差不齐,无法统一管理。
其四:避免问题不做反馈。对于大厂而言,很多都用的自身开发的BI平台,由于并不对司外开放,导致收到的建议反馈有限。因此,为了产品的更好发展,需要应用方定期给平台反馈,通过给平台提需求的方式,让其更好的迭代发展。