阿里数据总监来谈谈中台、数仓和报表平台的区别,你看的都不对

2020-07-10 14:23:03 浏览数 (1)

我对一些当下较为热门的概念做了一些梳理,其实想要了解区别,我觉得得先知道它们各自的定义。

1、先说数据中台

它的起源我就不说了,相信大家或多或少都看过这个有趣的故事:15年马云携高管访问supercell这个游戏公司,这个游戏公司为什么牛逼?就是因为它的员工不多,但是却造出了很多知名的游戏,原因就在于它的中台战略深入人心,如何像他们一样提高人效?这才是高管们关心的。

回到国内,中台的概念就被造出来了,从起名可以看出来,是处于中间位置,连接前后的作用,最终的目的是提高员工和企业的效率。

阿里事业部不下十几个,淘宝、天猫、 1688、聚划算、菜鸟物流,每个事业部都有独立的架构体系,对应各个的开发和运维,这会出现功能重复建设,数据格式不统一,口径不一致。

中台的出现就是为了解决这些重复造轮子的情况,打通各个业务系统的数据,有些费时费力的代码,写过一遍了,为什么还要再写呢?此处@各研发。

再拿某公司来说,很多人都觉得它是app工厂,造出了很多知名的产品如X音、X条等,但是他们的研发背后,肯定有一套,和阿里一样的,合理的数据中台体系。

我想提一下数据中台的价值之一:数据服务化

数据中台要能打通烟囱式的数据体系,避免重复开发,做到全域数据打通,构建公司级统一的数据仓库。同时,也提供更方便的数据访问方式:比如数据API、可视化访问、自助提取等。

说到可视化,就不得不提一下企业的数据架构了:

可视化一般是处于展示层或者应用层,你可以没有中台,但是你不能没有可视化,因为中台是为了研发方便,但是可视化就是为了老板和管理层的决策了,谁重要?

市面上有相当多的可视化工具,成熟的也好,开源的也罢,很多很多,但这些大多是门槛挺高的工具,比如Echarts、Highchart等,或许它们在技术层面上很厉害,也很成熟,但是缺点也很明显:人群太少,只有懂技术的能用。

我做可视化也有点经验,这么几个是比较实用的:

(1)FineReport

国内的一款报表工具,如果要论稳定性、适用性、决策性,它可谓是当仁不让,虽然定位是解决IT重复开发、企业数据孤岛的报表工具,但是还能做可视化大屏,你能想象吗?

(2)FineBI

国内BI的前者,并且已经在这个位置上很多年了。

简洁明了的数据分析工具,也是我个人最喜欢的可视化工具,零代码零代码!!!

可视化的场景都在这里了。

(3)Tableau

国外的工具,BI领域的第一,但是论价钱的话....很多企业都会放弃的,而且就我认识的人来看,有很多用了Tableau然后放弃的,最终回到了国产BI,只能说各有选择吧。

2、再来说说数据仓库

在我看来,数据仓库就是用来进行数据分析的,因为企业数据量大到一定程度之后,说明该企业的规模也是非常大的,数据库在进行大量数据查询的时候效率较低。

如果每次分析都从数据库里取数,那么会非常麻烦,所以就有了数据仓库,每隔一段时间把数据库里面的所有数据放到数据仓库里分析。

数据仓库整合多个数据源,进行多维的分析,其架构一共有4层:

3、两者的区别

先对两者的概念进行一个简单的总结:

  • 数据仓库是利用数据平台提供的计算和存储能力,在一套方法论指导下建设的一整套的数据表
  • 数据中台包含了数据平台和数据仓库的所有内容,将其打包,并且以更优雅以及更产品化的方式对外提供服务和价值

然后你就会发现:数据中台其实包含数据仓库,数据中台可以将企业数据仓库建设的投入价值进行最大化。再来扩大一点,说说和BI的关系吧,数据仓库是BI的基石,数据仓库为BI系统提供良好的数据基础。

数据仓库的主要场景是支持管理决策和业务分析,而数据中台则是将数据服务化之后提供给业务系统,目标是将数据能力渗透到各个业务环节,不限于决策分析类场景。

数据中台也可以将已建好的数据仓库当成数据源,对接已有数据建设成果,避免重复建设。当然也可以基于数据中台提供的能力,通过汇聚、加工、治理各类数据源,构建全新的离线或实时数据仓库。

不过数据中台更加偏重于数据使用,较之于传统数据仓库的数据组织形式,数据中台的数据覆盖范围更广、数据关系和处理模式更复杂、数据使用方式更灵活,因而给企业内部数据使用人员的能力带来较大挑战。

0 人点赞