Tapdata 获数千万美元 Pre-A 轮融资,开辟实时数据服务新赛道

2022-09-02 10:07:15 浏览数 (1)

近日,Tapdata 完成数千万美元 PreA 及PreA 连续两轮融资,两轮分别由五源资本独家领投及XVC及德联资本联合领投。

Tapdata 成立于2019年9月,由前 MongoDB 大中华区首席架构师,MongoDB中文社区主席唐建法(别名TJ)创建,早期核心员工来自MongoDB、Oracle、百度、阿里、腾讯等,并在成立之初获得极客公园旗下变量资本等天使机构近千万人民币天使轮投资。成立后的第二年,Tapdata 营收即超千万实现10倍增长,其产品“实时数据服务平台”获得了诸多行业标杆客户认可,包括中国移动、中国一汽、周生生、TCL、南方电网、富邦银行等。

聚焦实时数据即服务(Real Time DaaS)赛道,主打实时业务场景

企业在信息化和数字化建设过程中涉及到数据处理,一般分为两大阵营:OLTP和OLAP。OLTP 指的是Online Transaction Processing 事务型系统,关注的是交互式人机业务,如浏览电商网站,下单购买,转账,打车,内部流程等。而OLAP指的是Online Analytical Processing, 联机分析,通常指的是对企业已经产生的业务数据,通过聚合,分组统计,或者机器学习,人工智能的方式来对数据进行分析并得出一些洞察,用以改进业务流程或提升客户体验。目前市场上面向分析的产品和解决方案层出不穷,从20年前的以Teradata为代表的MPP数仓,到10年前以Hadoop生态为代表的大数据平台,到现在的爆款Snowflake为代表的云数仓。

但是Tapdata创始人TJ则观察到了一个不同的刚性需求:一个打通数据孤岛,面向TP型业务的实时数据服务平台。

TP型业务和AP业务相比的特点是交互式场景为主,响应速度快(毫秒级),并发高,支持数据更新和事务等。但是通常这些业务主流都是使用Oracle,MySQL,MongoDB,TiDB等事务型数据库来作为数据支撑。一个TP型的数据平台,真的有必要吗?

TJ认为,在企业经过了20多年的烟囱式的信息化建设之后,数据孤岛现象对企业数字化转型中快速启动新业务已经在产生巨大的阻碍。举例来说:

  • 某个高端零售业客户,有十多套独立的进销存系统支持不同地区和不同渠道的业务,业务人员都很难确切知道某个商品的准确库存,难以建立一个全渠道营销平台
  • 某保险公司准备上线一个新的SCRM系统,通过微信进行客户关怀。上线前发现需要对接企业的数个业务系统获取客户数据,数据合并去重异常麻烦,额外多出了3个月的上线准备
  • 某传统制造业客户,ERP系统是由Oracle原厂提供,一般业务开发人员没有权限更无胆量去修改核心系统去支撑一些新型营销业务
  • 某内容互联网公司,核心客户和业务数据在多套MySQL、PostgreSQL和MongoDB 之中,但是一些新的搜索或者分析场景需要用到Elastic Search 或者 Neo4J,如何获取最新的客户业务数据进行实时搜索?

一个能够快速打通数据孤岛,为新业务提供一个统一、完整并且实时数据,并且支持十万级并发和毫秒级响应的TP型数据平台,就能很好的解决这些问题。

从另一个角度来讲,现在主流的数据库有几十种,DBEngines上面列出的则有370多种。这种多模异构数据库并存的事实,将会是未来企业在精细化数据业务追求下的一个常态存在。连接这些独立的数据库库,为企业提供一个虚拟的“超级数据库”,会带来极大的业务价值。

所以TJ认为,是时候来提供这样的一个TP型的数据平台了。毕竟,企业在TP和AP业务上的预算投入是9:1,虽然这个比例在随着数据分析价值的凸显在逐渐缩小,它依然可以说明巨大的市场潜力。

Tapdata正是基于这样的一些考量而诞生的一个新型数据产品。

像来自水龙头的自来水一样简单的使用数据

无论企业现在有多少个业务系统,用了多少个不同的数据库,Tapdata希望能够以一种无痛接入的方式,使用基于日志同步的数据虚拟化技术, 为企业构建一个逻辑,虚拟的,统一的数据访问层。如此,企业需要数据时候只需要到一个中央化的地方,通过Tapdata 提供的标准化接口(tap),可以简单方便地获取到想要的数据。这也是Tapdata取名的初衷,使用数据,只要打开水龙头,数据就流出来了。

为了达到这个目标,Tapdata产品具有以下核心优势:

  • 轻量级私有化部署 - 快速安装到客户数据中心或者私有云环境,3台虚拟机即可拥有
  • 强大的实时同步能力:支持Oracle, DB2, SQLServer, MySQL, PostgreSQL , MongoDB, Kafak等近30种数据源
  • 可视化数据开发:从接入数据源到建成第一个模型只需数分钟,拖拉拽方式快速建宽表或者其他数据模型,基本无代码
  • 无代码API发布:任何数据,简单配置即可以RESTful 或 RPC方式发布出去
  • 数据目录:为DaaS管理的数据提供一个可搜索可分类的数据目录

Tapdata有哪些技术核心

Tapdata 提供了以下几个核心技术点:

  • 基于数据同步的虚拟化
  • 流处理引擎 可视化数据开发平台
  • 低代码API发布能力
  • 异构数据源统一访问框架

实现DaaS架构的一个核心技术就是数据虚拟化,类似于计算虚拟化一样,数据虚拟化让你不用关心数据的物理存在,只是以一个服务形式提供给用户,这种是数据使用的最佳用户体验方式。相比于传统的联邦查询,基于同步的虚拟化对技术要求更高,容错性更低,毕竟需要对各种底层实现完全不同的数据库进行事务级别的日志解析,忠实还原并在亚秒级延迟下重放到DaaS平台。这个架构没有捷径,就是通过Tapdata 数据库专业团队经过大量的实战研发,并且在不断优化实现和算法的基础上,形成了一个技术壁垒,能够安全可靠的将源系统数据无需其他ETL工具,就可以实时镜像到DaaS 平台,提供准确的数据服务。

Tapdata的异构数据源统一访问框架通过定义一个支持绝大部分数据库的标准,从统一的URL连接方式,到富结构的数据模型,到标准的DML和DDL,来为具有多源异构数据库的企业用户提供一个简单、一致的数据访问能力。只需要一种语法,就可以对企业所有数据进行浏览查看,甚至简单的更新管理。

在技术选型上,Tapdata勇敢的选择了自研的路线,没有使用主流的类似Flink或者Kafka这样的大数据技术。Tapdata认为在体验为王的时代,客户对建设成本,长期运维,和学习曲线都非常关注。能够提供一个解决客户核心痛点,同时还能保证优秀的产品化体验和可控的成本,这些都意味着自研会是一个更好的选择。即时是存储方面,一些类似的产品往往会包括5-6种存储方案,如MySQL来管理元数据,ES来做搜索,Redis做缓存,Kafka做队列等。相比而言,Tapdata只使用分布式数据库MongoDB加上自研的数据计算中间件,就构成了一个实时DaaS的产品方案,具有架构简单,部署轻量,低成本和上手快等优秀特性。

Tapdata和现有的很多云数仓、大数据平台和数据中台厂商,会是什么样的竞争或合作关系?

Tapdata的核心能力在于多源异构数据库的实时打通,拖拉拽模式的数据开发,以及低代码数据发布及推送能力。从这个角度出发,Tapdata可以用来作为各个云数仓、大数据平台以及数据中台的前置架构,为这些数据平台解决方案提供数据的采集同步,处理加工,各种可视化建模,以及最终落地到这些数仓或中台。同时,对于很多新型数据库系统,也都面临着需要从传统数据库中实时抽取数据为我用的直接业务诉求,所以从这个角度出发,Tapdata将会是各个新型数仓、数据平台和中台的极佳合作伙伴。

帮助企业打通数据孤岛,构建实时数据服务平台,直接应用到TP业务系统,切中企业的核心运营价值链。

Tapdata 实时数据服务平台是以数据服务为导向的,并不企图大而全地支撑起所有数据业务。事实上,大部分数仓、大数据平台和中台建设提供最完整、统一、准确的实时源数据。用Tapdata 创始人唐建法的话说就是:“我只把数据给到你,你把‘水’拿过去以后,是用去做饮料还是啤酒,由你来定。”这也是Tapdata 创立的初衷:Make Your Data on Tap!

开放 开源,加速实时DaaS架构的普及

Tapdata 目前面向的还是CDO,数据或者应用架构师,在定位上更偏向基础软件。关于如何让市场更好的理解这一点并接受,TJ 表示有办法。

开源目前是基础架构软件最快提高市场接受度的一种模式,今年的开源产品融资额看上去可以达到或超越前20年总和。但是作为一个从开源数据库(MongoDB) 商业化大坑里爬出来的老兵,TJ表示他还在寻找Tapdata开源后的最合适的商业化模式。但是本轮融资后,Tapdata就已经启动了一些核心能力的开源路线图。

在开源之前,Tapdata会通过云上开放的方式,以另一种方式将核心产品能力无偿提供给社区。Tapdata Cloud已于近日正式推出公测版(http://cloud.tapdata.net) , 目前这个版本还只是Tapdata 产品的一小部分功能,但是已经可以独立完成多达十几种数据库的异构数据同步能力,为新业务扩展,缓存加速, 全文检索,数据库备份容灾等很多新型业务场景提供生产级的支撑。

TJ表示此前Tapdata的云同步技术已经与移动公有云深度合作,为移动云的各种异构数据库提供上云和云间同步迁移功能,其能力已经得到充分验证。Tapdata Cloud目前的版本现在和将来都不会收费。由于其架构的特性,运营管理成本完全可以将持续由Tapdata公司来承担。TJ希望通过免费云版开放来让大家体会到实时数据的巨大价值,并能够进一步了解并采用Tapdata的Real Time DaaS数据架构及产品。

投资人意见

本轮融资领投机构五源资本表示:“Tapdata 面向OLTP场景的数据处理产品开创了一片待开发的蓝海市场,目前DaaS赛道中比较出名的厂商只有美国的Dremio和Tibco,严格来说,Tapdata 是国内实时DaaS 赛道的开创者,其技术先进性与产品稀缺性是我们所看重的。此外,全球数据库市场中约80%是面向TP数据场景的,因此我们也非常看好这一赛道的市场发展潜力。”

0 人点赞