关系数据库技术,作为计算机技术的基石,兴起于上世纪的80年代。最初的两个系统是IBM Almaden研究院的System R和加州大学伯克利分校的Ingres。
在商业领域,经过一系列的厮杀,在淘汰掉包括Informix和SyBase这些强劲对手以后,Oracle,IBM和微软最终成为了商业数据库领域的三驾马车。
其中Oracle数据库更是一骑绝尘,在相当长一段时间内,Oracle数据库被广泛应用到了包括银行等在内的各种领域,在商业数据库领域是无敌的代名词。
进入21世纪以后,事情逐渐发生了变化。一方面,以MySQL和PostgreSQL为代表的开源数据库逐渐成熟。另外一方面,伴随互联网和电子商务的发展,Oracle数据库也终于遇到了它也搞不定的场景,比如双十一。所以这个时候,对开源数据库进行再次开发,以解决自身业务需求,成了很多互联网和电子商务公司的选择。
伴随着电子商务公司把自己富余的计算和存储资源和能力释放出来,服务其他企业,我们也迎来了云计算时代。云计算时代,也给整个数据库市场带来了巨大的冲击。
这种冲击体现在两个方面。一方面是云计算的计算和存储分离架构,给数据库提供了新的发展空间。从用户角度来看,不但是存储和计算能力上去了,而且性价比也更高了。另外一方面是用户一旦上云,大概率会同时在其上云的厂商那里采购数据库产品。所以失去了云计算,也很可能会同时失去数据库的订单。
Oracle这两年在数据库领域的市场份额不断的丢失,已经掉出了全球数据库第一的厂商,最大的原因就是不断被云厂商比如亚马逊和微软吞食数据库市场。云计算无疑正常重构数据库市场。
作为中国最大的电商,和最早进入到云计算领域的阿里巴巴来说,显然也不可能缺席这场重要的趋势性的改变。
和亚马逊一样,阿里巴巴在数据库领域有着很多中国企业所不具备的优势。阿里巴巴作为中国最大的电商,其内部场景非常的丰富,在开源数据库系统的二次开发上,阿里巴巴积累了丰厚的经验。而阿里云上线了数据库产品后,又为数百万客户提供服务,更是给了阿里全方位的打磨时间。
经过三年的研发,2017年9月阿里云发布了自主研发的云原生数据库PolarDB,并于2018年4月正式商用。这是一个标志性的事件。
PolarDB一诞生就集众多创新技术于一身。PolarDB采用了自研的分布式存储引擎设计,底层使用了RDMA的高速网络。该分布式存储引擎可以提供比原生MySQL大百倍的存储空间,同时还做到了和本地存储类似的访问速度。
更重要的是,PolarDB不但性能优异,而且性价比很高,在100TB的数据容量上提供了10倍于传统商业数据库的性价比,性能已经达到AWS Aurora的2倍。
在PolarDB的基础上,2020年6月,云原生分布式数据库PolarDB-X正式商用。PolarDB-X采用 Shared-nothing 架构进行设计,实现系统的透明水平扩展;采用 MVCC TSO方案及2PC协议实现分布式事务,满足ACID特性;通过原生MPP能力,支持HTAP混合负载。
2021年10月,PolarDB进一步重磅升级。这次升级在业内首次实现计算、存储和内存资源的三层解耦。在业内首次内存池化,使得弹性能力大幅度提升,实现了完全按量使用,按需弹性,大大降低了使用成本。
同时,这次升级还带来了领先行业的多主架构,支持32个节点并发写入。这个功能比亚马逊的Aurora还要好,帮助客户实现了秒级横向写扩容缩容能力,既能帮助SaaS/电商用户能够秒级拥有应对类似双十一流量洪峰的能力,又能实现流量低峰的秒级无感缩容,降低成本。
2022年1月,阿里云PolarDB再次商业化了列存索引和并行查询2.0功能。基于共享内存池的列存索引和并行查询2.0功能,使得PolarDB全面升级为云原生HTAP数据库系统,可同时处理OLTP和OLAP型混合负载,进一步简化运维、节省成本。根据测试,PolarDB在大数据量上运行复杂查询的性能可以与Oracle/SQL Server等业界最顶尖的商用数据库系统处在同一水平。
PolarDB的成功,首先是阿里巴巴独特的环境。作为中国和全球最大的电商,需要面对双十一这种罕见的场景,阿里巴巴的业务场景给数据库团队提供了难得的磨练机会。
而阿里坚持不懈的在云计算上的不断投入,使得其成为中国最早也是最强的云计算厂商,是PolarDB成功另外一个重要的原因。
如果说电商场景是内部客户和内部场景的话,云计算则给阿里带来了几百万大大小小的外部客户。内部场景奠定了产品的基础,这些外部客户和它们的使用场景,则给产品提供了各种各样不同的使用场景,包括很多稀奇古怪的可能性。这些场景持续不断打磨锤炼产品。
但是最重要的,还是阿里有一只强大的数据库团队,还是阿里一如既往的对数据库领域的不断投入。产品最终能够胜出,离不开人一步一步搭起来。阿里巴巴有着位于全球各地的,庞大的数据库团队,这是PolarDB能够脱颖而出的关键。
云计算的出现,已经在重构数据库市场了。而阿里云显然非常的清楚,云数据库这个云大厂必争之地的重要意义,所以对于数据库领域,阿里云一直在重兵。
不但自身在重兵投入,阿里云数据库也不断在和外界合作。2021年8月,阿里云联合中国科学技术大学团队撰写的PolarDB数据库核心架构创新论文被国际数据库顶级会议VLDB 2021录用。这也是国内主流云数据库厂商第一次在VLDB Research Track上发表数据库核心架构方面的创新论文。
除了学术合作以外,阿里云2021年5月悬布“数据库开源计划”,并率先开源PolarDB for PostgreSQL分布式版。2021年10月PolarDB-X正式开源。通过开源,阿里云数据库进一步聚合开源社区力量,大力发展云原生分布式数据库技术。
PolarDB的成功,既是云计算时代重构数据库市场的机遇给的机会,也是阿里巴巴内部和阿里云客户提供的各种场景的锤炼的结果,更是阿里云大力投入数据库领域,阿里云数据库团队的不懈努力的必然。