数据可视化之美—BI

2020-05-15 16:37:59 浏览数 (1)

作者 | 李谦恒

数据工程师。逻辑重于代码,高效胜过勤奋。崇尚life work balance。

1、引言

本文主要面向对象是,对 BI 完全不了解,或只是初步了解的人。 从宏观角度介绍了 BI 的基本信息,并附以大量的图表作为说明。期望能帮助大家对BI有更深层次的理解。 如有不同见解,也欢迎在评论补充。 至于 BI 中更深层次的东西,笔者将会在未来逐一进行介绍。

2、什么是 BI?

首先引用百度百科的定义:

商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术线上分析处理技术数据挖掘数据展现技术进行数据分析以实现商业价值

通俗一些的解释:

BI 并不仅仅只是一个分析软件,而是一套完整的数据分析解决方案:它将不同数据源(如 ERP、CRM、OA、HIS、EXC 等数据文件)的数据,在整合清洗——保证数据准确性后,进行针对性的数据分析和处理,最终为企业提供报表展现与可视化图表分析,从而为企业提供决策支持

在数据化建设较差的公司,也会将 数据可视化与 BI 直接划上等号。

以下是一些经典的 BI 展示:

不得不承认,BI 给人的第一印象,的确是漂亮的图表。

在实际开发中,整合数据源、清理数据等步骤往往并非由 BI 进行处理,具体分工见下图:

正如上图所示,BI 往往与数据仓库技术、olap 引擎有着直接的上下游关系。其中数据仓库主要起到统一数据源、保证数据准确度的作用;而 OLAP 引擎则帮助 BI 加速查询。它们组合在一起,最终使用户获得良好的数据分析体验。

3、BI 能做什么

BI 对企业的作用是通过两方面实现的,业务方面和技术方面。

3.1 业务方面
  • 数据呈现 我们可以通过 BI 直观、全面的展现企业日常业务的情况;无论是从整个集团的视角出发、还是从业务线或者部门的角度出发。 下图即为一个标准的 数据呈现(大屏)BI。决策层可以通过该图表快速、直观的了解到目前公司的会员数量和相关的销售额——这也往往是决策层最关心的两个指标

为了保证数据更新的实时性和展示的美观性,纯粹的数据呈现往往并不支持联动、下钻、上卷等 BI 常见操作。

联动、下钻、上卷都是 BI 的专业术语,未来会逐一介绍。

  • 异常监测 专业的业务人员会有一些核心指标来监控业务,我们完全可以将其通过 BI 实行可视化监控; 下图即为 某在线教育对每日课程销量的监测,运营人员通过 BI 可以迅速发觉异常变化,从而及时作出调整。
  • 智能预测 在大数据的基础上,BI 也能基于简单的统计学,提供一些拟合线,来帮助业务人员进行相关分析。 下图即 对某超市销售额进行预测。
  • 特定建模分析 特定的建模分析通常是由精通业务的业务人员提出,通过合理的建模找出业务中可能存在的问题,将其反映出来并最终回归到业务,形成闭环决策并不断优化的一个过程。 业务建模可简单,可由一个或多个图表组成,也可复杂,通过一组或多组数据图表支撑。 如下图,即为对客户销售额建立的模型。通过该模型,业务人员能够快捷的了解到目前 CRM 的客户情况。
  • 帮助业务进行快速智能分析 尽管 BI 能满足大部分常见需求,但资深的业务人员总会有一些突如其来的灵感。这种灵感稍纵即逝,如果等到数据部门提供数据再进行分析——可能为时已晚。如果有BI的话,业务人员可以立刻基于业务数据进行灵活分析,从而验证想法。
3.2 技术层面
  • 减少人工处理,提升工作效率 某些指标对每家公司都是非常重要的,无论该公司是否存在 BI、数据部门。 例如 毛利、成本、客户。 在没有 BI 的情况下,如果公司想要收集汇总这些指标信息,大多数时候都需要业务人员手动从各个系统提取数据,然后在 exc 上汇总——这个过程无疑是冗长、枯燥且毫无价值的。同时,还容易产生以下问题: 如果有了 BI 和对应的数据底层,就可以自动化生成相关报表。 智能报表 也属于广义上的 BI
    • 数据准确性无法保证:手工计算,就有可能出错。无法避免
    • 数据及时性无法保证:手工计算的效率由使用者决定,无法控制
    • 修改复杂:任何业务的新增、修改。都需要对复杂的 exc 公式进行修改。
  • 结果倒逼,统一指标口径 成熟的公司必然有一套统一的指标口径;但在其野蛮生长中,指标、维度可能会缺乏统筹规划,从而产生一些遗留问题。 举个例子:库存、销售、运营口中的"销售额"往往不是同一个"销售额"。 最常见的口径不一致问题,就是时间口径不同;销售额可以依照 下单时间,支付时间,发货时间,收货时间,完成订单时间 等不同角度进行分析。在没有统一口径的情况下必然会出现误解。 BI 的使用者必然包括决策层。因此,指标必然会以决策层认可的口径为主,从而消除争议。
  • 整合信息孤岛,统一分析平台 数据仓库是每家公司都应有的东西,但实际上大部分公司并不完善;但分析、统计的需求并不会因为没有数仓而停滞。这个时候,BI 就可以启动汇总数据源进行统一分析的效果 并不推荐长久使用 BI 作为数据汇总层。
3.3 总结:

正如上述描述,BI 更多的是从业务方出发,帮助业务解决问题。它将繁杂的数据库底层进行整理汇总,形成有效的指标维度,让 BI 使用者可以直观、清楚地看到他所关注的数据,从而帮助整个企业更好的发展。在数据的自由探索中找到原因,避免“拍脑袋”式的决策。这就是 BI 的作用,而非仅仅的数据报表呈现。

4、BI 的应用场景

BI 应用场景广泛,以下逐一枚举。

  • 大屏 大屏就是我们在 街头、展览会上常见的超大屏幕,其上大多充满了含义不明的图表。举几个例子

大屏的最大特点 就是。据笔者观察,其上的数据大多都是“虚荣指标”——除了好看外一无是处。但换个角度,对外宣传时,需要的就是好看。

设想一下,假设超市、医院、 会议室能有一个大屏。会吸引多少目光的注意力;增加多少回头客。

大屏的开发,有以下几点需要注意:

  1. 因为展示效果等问题,大屏相比其他 BI,缺少交互性,无法进行联动、钻取等操作。
  2. 硬件成本较高——大屏很贵
  3. BI 开发成本较高——需根据硬件实际大小进行反复调试,才能保证最终结果的展示。
  4. 数据 要求较高——主要是指数据的实时性;
  • 驾驶舱 BI 驾驶舱是一个核心指标汇总系统,将公司的核心指标进行可视化展示,帮助决策层能通过1图直接了解到整个企业的运营情况,也可以下钻到各个细分业务中了解详细数据。

因为面向对象主要为企业高层,因此驾驶舱的数据准确度美观度一般都是最高的。相对而言,开发成本也是最高的;

相比大屏来说,驾驶舱可以自由下钻到任意主题的详细看板中。分析性更强

驾驶舱则要注意这些:

  1. 数据准确性非常高——它不像大屏,错了也没有人知道。驾驶舱对接公司决策层,不允许有任何的数据误差。
  2. 美观度——领导要看的东西,你自然要花点功夫去精心调试。
  • 看板 看板(dashborad)即为最基础的 BI 展现方式。

相比 大屏、驾驶舱而言,dashboard 并不那么浮夸,它的主要使用对象为一般的管理人员和运营人员。一般来说,看板也可以自由的钻取、联动。从而帮助业务人员进行更好的分析。

  • 移动端 部分 BI 产品也支持移动端展示,内容一般为核心指标。

移动端开发时,需要特别注意不同手机的适配度。必要情况下,可以拿用户的实际手机款式做针对性调整。

  • 自助分析 并非所有的仪表板,都一定由数据部门来开发完成。有能力的业务人员更希望自己可以随时进行制作,而不受数据部门的约束。因此在数据部门提供数据底层的情况时,业务部门也会亲自上阵进行开发。
5、BI 的开发方式

BI 的开发,与常见的项目开发并无两样

确认需求——需求分析——指标维度梳理——源数据和数据质量确认——结果表设计——ETL 开发——可视化实现

有几个重点需要注意:

  • 第一步要确定 BI 的最终使用者,直接与使用者沟通会节省大量的时间。
  • 需求分析结束后,一定要与最终使用者进行文档确认,确保双方理解一致
  • 不要轻易相信源头提供的数据,获取到数据后自己一定要初步检查,确保数据质量
  • demo 先行——尽早确定使用者想要的BI样式,免得反复调试浪费时间。
6、部分BI介绍
6.1 Tableau

Tableau 毫无疑问的市场王者,也是目前全球最易于上手的报表分析工具,并且具备强大的统计分析扩展功能。它能够根据用户的业务需求对报表进行迁移和开发,实现业务分析人员独立自助、简单快速、以界面拖拽式的操作方式对业务数据进行联机分析处理、即时查询等功能。

但 Tabealu 也有自己的缺点:最大的缺点就是价格过于昂贵。对于大部分公司来说,如此昂贵的 Tableau 性价比并不高。

6.2 FineReport

帆软是目前国内最大的 BI 厂商,合作厂商也相当多;产品线也遍及大屏、移动端、智能报表。可以说是最适合中国中小型企业的 BI 了。

FineReport 本是一个智能报表软件,但由于集成了大量图表,相比其他 BI 开发效率虽然稍慢,但是自由度更高。

6.3 Superset

Superset 是一款由 Airbnb 开源的“现代化的企业级 BI (商业智能) Web 应用程序”,其通过创建和分享 dashboard,为数据分析提供了轻量级的数据查询和可视化方案。

Superset 的缺点就比较多了

  1. 没有提供图表的下钻功能
  2. 不支持多图表间的复杂联动
  3. 处理大数据集时容易暴毙
  4. 权限管理和图表管理的功能设计基本为0

但它是开源的——你无法要求一个东西又免费又好用,因此技术能力较强的公司可以考虑。

7、其他杂谈

正如开题所言, BI 并非简单的数据可视化,而是一套极度复杂的商业解决方案;

如何做到企业数据化?数据驱动业务?数据治理?

仅凭几个EXC是远远不能满足的——只有建立起良好的 BI 生态体系,企业才能真正迈入数据化。

另一方面,BI 的表象是可视化分析报表的呈现,但它的本质还是业务问题、管理问题。

如何通过 BI ,使得业务、管理能够不断优化,这才是值得我们深度思考的。

全文完

0 人点赞