其中,有以MySQL、Oracle、PostgreSQL为代表的传统产品,也有以Aurora、Spanner等为代表的创新路线产品,还有工业数据库、时序数据库、图数据库等面向应用场景的产品。
无论是信息技术进步的必然结果,还是科技巨头们出于商业利益的推动,如今数据库百花齐放的盛景,对于该领域的技术发展来讲,都无疑是一件幸事。
从数据库的诞生说开去
关系模型依旧把持江湖地位
20世纪60年代中期,数据库系统的研究和开发便已经开始,在将近60年的时间里,技术经历三代演变,取得了十分辉煌的成就:造就了C.W.Bachman、E.F.Codd和J.Gray三位图灵奖得主;发展了以数据建模和数据库管理系统核心技术为主,带动了一个巨大的数百亿美元的软件产业。
数据库技术从诞生到现在,形成了坚实的理论基础、成熟的商业产品和广泛的应用领域,吸引了越来越多的研究者加入。
数据库的诞生和发展给计算机信息管理带来了一场巨大的革命。几十年来,国内外已经开发建设了成千上万个数据库,它已成为企业、部门乃至个人日常工作、生产和生活的基础设施。
同时,随着应用的扩展与深入,数据库的数量和规模越来越大,数据库的研究领域也已经大大地拓广和深化,这个领域依旧充满活力和创新精神。
今天,随着计算机系统硬件技术的进步以及互联网技术的发展,数据库系统所管理的数据以及应用环境发生了很大的变化。
其表现为数据种类越来越多、越来越复杂、数据量剧增、应用领域越来越广泛,可以说数据管理无处不需无处不在,数据库技术和系统已经成为信息基础设施的核心技术和重要基础。
从概念的提出到早期的数据库,再到流行至今的关系型数据库,可谓是发展迅猛。
从这条时间线来看,数据库的发展好像是井然有序的,是什么原因导致了大量的数据库出现,是理论的突破?还是市场的需求?或者两者皆有。
直到今天,数据模型依旧是数据库的核心和理论基础。
我们在划分数据库的时候,仍然会按照其基于的数据模型来分类。
从一开始的层面模型、网状模型、关系模型,到对象模型、对象关系模型、半结构化等等。
可以说,基础理论并没有得到更大突破。关系型模型刚提出的一段时间里,学术界发生了数据系统语言协会(CODASYL)关于有向图模型和关系模型的辩论。
有向图的复杂,使得数据库的技术门槛太高,而关系模型扎实的数学理论支撑以及更好的逻辑独立性赢得了市场认可。
从此,关系模型一统江湖,新出现的各类数据库依然是关系模型。
从MongoDB、Redis、Hbase、KV一路发展过来,最终在DB-Engines的统计中,Oracle带着MySQL和微软的SQLServer常年一路领跑,关系模型在数据库分类中仍然占据较大比例。
从SQL到NoSQL再到NewSQL,每一次技术演进都有推翻传统数据库的统治,迎接新时代的感觉。
此外,数据库还有另一个分支,是与计算技术相结合。
比如这两年火热的分布式数据库,有着各种光环加持,为数据库的发展带来了一抹亮色。
分布式数据库、并行数据库、多媒体数据库、主动数据库都是数据库技术和某个计算技术结合的产物,通过将两个技术体系进行融合,可以满足特定的市场需求。
数据库技术面临四大趋势
一把重锤不能解决所有问题
作为应用程序的一部分,数据库的发展与应用架构的变化紧密相关,亚马逊云科技大中华区产品部总经理顾凡认为,云原生关系型数据库、开源数据库、现代化应用、软件架构的迭代和转型,将影响着数据库未来的发展走向,也驱动着整个数据库技术和生态发生变化。
随着互联网和移动互联网的发展,电商、视频、社交、出行等越来越多的应用产生海量数据存储需求,在高并发请求、高可用、高可扩展性等方面提出了巨大挑战,这对数据库提出了非常高的要求,传统的关系型数据库在应付这些调整时已经显得力不从心,暴露了许多难以克服的问题。
由此,各种各样的NoSQL数据库作为传统关系型数据的一个有力补充得到迅猛发展,它驱动着云原生关系型数据库的出现。
与此同时,越来越多的用户不希望把自己的应用架构捆绑在一个有着严苛授权、会被锁定的数据库引擎上,而是更倾向于MySQL、PostgreSQL这样的开源数据库引擎上。
业内普遍观点认为,眼下数据库已经到了变革的重要关口,最直观的表现就是传统数据库持续衰落和云原生数据库、开源数据库等新一代数据库加速崛起。
开源代表了“多方协同、合作共赢、未来共享”的开放生态趋势,拥抱开源将有助于合作伙伴和开发者了解和熟悉其数据库特性。
应用厂商可以做到更好原生的适配。合作伙伴可以围绕其产品进行运维工具的开发。同时,开源社区将有助于经验分享,为实施和研发提供便利。
第三个改变,快速构建现代化应用程序已成为企业提高敏捷性、实现更快创新、发挥数据价值的关键。
企业希望可以将更多时间和精力花在核心业务的应用开发上,这当然是一个非常美好的愿望,这个愿望背后的含义就是:客户希望把那些无法让自己在市场竞争中脱颖而出的脏活累活尽量抛掉,让开发人员专注于应用和数据。
这个变化也驱动更多企业向全托管式的云数据库服务进行转型。
第四个改变,软件架构的迭代决定数据库技术变化。
从早年的PC、互联网、移动互联网,到现在的万物互联,软件架构基本上都是从Server到SOA再到微服务,这样的软件架构迭代和转型,也在驱动着数据库选型的变化。
伴随一个客户业务体量越来越大,复杂度越来越高,在这种情况下选择将一个超级复杂的单体应用拆分成多个微服务和多个大的功能模块就显得十分必要。
在进行应用重构之后,必然也会对数据进行拆分,根据应用所使用的数据类型和数据访问特点,来决定究竟应该选择云上的哪一个专门构建的数据库。因此,软件架构的迭代和转型,也在驱动着数据库选型的变化以及数据库技术和架构的迭代。
这应对数据库技术未来变化时,亚马逊云科技显得更加务实一些。
其认为,当手中只有一把超重的锤子时,看什么都是钉子,一把锤子无法完成所有的事情。
为此,亚马逊云科技针对不同应用场景需求,已推出十多种数据库服务,为客户提供兼具高性能、高可用性、可扩展及成本效益的专用数据库服务,支撑客户现代化应用的快速部署及创新。
你会发现,关于数据库的一切需求用户都能在亚马逊云科技找到对应的产品。
如果客户想用托管的关系型数据库就选Amazon RDS,它开启了托管数据库服务的新模式,从最初只支持MySQL,到目前支持多种常用的数据库引擎,包括MySQL、PostgreSQL、Oracle、SQL Server、MariaDB。
如果客户非常青睐开源数据库,但又担心它的可用性达不到专用数据库的级别,那就选择Amazon Aurora。
如果客户想用非关系型数据库,需要一个托管的键值数据库,而且针对海量数据场景,应用的吞吐无论扩展到多大,都能够提供毫秒级响应,那就用Amazon DynamoDB。
很多客户需要的是极致响应延迟,常用于缓存、排行榜、广告等场景,就可以选用Amazon ElastiCache和Amazon MemoryDB。
如果客户需要一个托管的图数据库,就选Amazon Neptune,适用于欺诈检测、社交网络、推荐引擎。
如果需要一个托管的时序数据库,可以去看Amazon Timestream,像IoT中比如车联网的场景,或者是DevOps的场景都可以用到时序数据库。
如果需要的是数据库可以像一个不可篡改的账本,那就选Amazon QLDB。
今天,亚马逊云科技不断加速数据库相关服务在中国区域的落地,2021年至今已经通过与光环新网和西云数据的合作新发布60多个数据库相关服务与功能。
作为亚马逊云科技核心级咨询合作伙伴,伊克罗德信息科技总经理桂梓捷也从侧面印证了亚马逊云科技的竞争优势。
桂梓捷表示,亚马逊云科技在数据库的服务效能、可靠性、伸缩性方面花了非常多的时间进行持续优化,这可以让服务商更放心的将其数据库产品推荐给全球用户。
除了技术方面领先全球,亚马逊云科技无服务器数据库服务在计价模式等方面也与众不同。
比如传统的数据库服务是依据服务器的规格、大小、效能来收费,亚马逊云科技的Amazon Aurora , DynamoDB等无服务器数据库服务则是通过应用程序的读/写量来计价,而不用预先考虑客户需要多少存储空间和服务器。
始终站在客户角度,为客户的便利性与成本考虑,成为亚马逊云科技能够受到全球用户青睐的关键。
未来,数据库将会如何发展?首先不能抛开市场因素,也就是企业对数据库在安全、性能、扩展性、易用性方面的要求;特定场景、业务类型、数据特征对数据库的依赖。
而在数据库内部,会不会出现产生下一个“关系模型”?比如XML会不会成为主流模型?数据库的结构定义会不会动态变化甚至取消?我们不用再先建表再写入数据,数据库随着数据的写入动态适配数据类型、动态适配索引、动态适配查询计划?越来越多的算法代码将内置到数据库中,比如对AI算法的支持、对搜索算法的支持……这些都有待行业进一步探索。
在这个一切皆可数据化的时代,无论是传统企业,还是互联网企业,数据库都是底层系统的核心构成,其重要性不言而喻。
从最初的人工管理、文件管理,到后面的数据库系统,以及新兴的NoSQL、NewSQL数据库,都伴随着时代发展在更替前进。
作为技术发展的亲历者,我们有感于数据库行业的持续活力,希望随着技术的演进这个领域能够通过科技创新迸发出更加耀眼的光芒。