报告解读下载 | 八点概览数据库技术发展的路径复盘及展望

2022-03-14 10:10:07 浏览数 (1)

编者注:本系列选择行业分析报告进行分享,与读者共同分析分享数据库行业的最新进展与动态。关注“数据和云”公众号回复:下载 。可以找到获得下载链接。

中金公司在2022年1月发布了一篇报告:《数据库系列报告开篇:技术路径复盘及展望》,报告中很多的总结和分析,对数据库行业做出了非常详细的分析,在这里我们摘录其中一些观点和大家分享,详细报告可以下载阅读。

报告的核心观点是:

  1. 数据库的过去技术架构演进的背后是四股创新⼒量 1)数据模型的变迁 2)分析型需求的兴起 3)分布式架构的演进 4)开源思潮的流⾏。
  2. 数据库的未来技术栈收敛与新兴技术潮流下的分化发展。 部署多套系统带来⼀致性与运维⽅⾯的挑战,出现技术栈收敛的趋势;数据库和新兴的 IT 技术结合以进⼀步提升性能, 对应原⽣分布式、云数据库、智能⾃治、结合新硬件等⽅向。

观点摘录:

  1. 关系型数据库有两⼤核⼼优势,⼀⽅⾯符合事务ACID,使其能够应⽤在核⼼业务场景中;另⼀⽅⾯,⽀持SQL能够降低使⽤⼈员的学习成本,快速⽅便查询,并且容易形成⾏业统⼀的语⾔和接⼝标准.
  1. Google Spanner 、 F1 两套论 ⽂ 是 NewSQL 的开⼭⿐祖。NewSQL ⼀ 词是最早由 451 Group 的分析师Matthew Aslett在研究论⽂中提出的。2012 ~ 2013年 Google 相继发表了 Spanner和 F1 两套系统的论⽂,让业界第⼀次看到了关系模型和NoSQL的扩展性在⼀个⼤规模⽣产系统上融合的可能性,这是绝⼤多数NewSQL数据库架构灵感来源。
  2. 从技术⻆度来看,分布式架构实现路径有⼆,⼀为借助中间件,⼆为原⽣分布式。从技术先进性上⽐较,原⽣分布式数据库系统在服务器利⽤率、管理复杂性、分布式事务实现等⽅⾯均明显优于中间件⽅案,但其开发难度⼤、发展历史较短、技术成熟度较低。综合考虑理论先进性、⼯程化实现和产品能⼒输出等,⽬前两种技术栈共存,各有适⽤场景
  1. 分布式数据库核⼼需要解决 “ 数据如何有效分散存储 ” 和 “ 在分散存储中如何保证强⼀致性”两个问题,分别对应分⽚/分库/分表和分布式事务两⼤核⼼技术:
  1. 早期OLAP基本均采⽤MPP架构,适合中等规模的结构化数据分析。MPP每个节点都有独⽴的磁盘存储、内存和计算系统,业务数据按照数据模型和应⽤需要划分到各个节点上,每台数据节点通过⽹络互相连接、并⾏计算,作为整体提供数据库服务。MPP的优点主要为扩展性,在分布式的同时保障较⾼的⼀致性、 ⽀持事务ACID和SQL兼容,常⽤于关系型OLAP。
  1. 新兴技术潮流下原⽣分布式演进⽅向。分布式是⼤势所趋,原⽣分布式开发难度⼤但优势明显。中间件解决⽅案虽然较为成熟、整体能⼒接近单机数据库,但存在可拓展性差、对业务侵⼊性强、中间件负担过重、运维管理复杂等问题,⽽原⽣分布式数据库的整体架构设计逻辑天然⾯向分布式数据管理需求,⽀持⾃动分⽚、迁移、复制,更容易实现分布式事务。我们认为,虽然原⽣分布式技术实现难度更⼤,但是下⼀代数据库产品的颠覆式创新⽅向之⼀,且和云计算天然契合。
  1. 智能⾃治是数据库重要的演进方向。⼈⼯智能延伸DBA的能⼒半径,优化数据库性能。数据库技术栈⽇益丰富,但⼤多优化任务仍需要DBA进⾏⼿动调优,⼈⼯能⼒逐渐跟不上数据库的发展,⽽AI技术的成熟可以弥补该不⾜,解决资源调度、索引设计和优化、查询优化、负载均衡设计、缓存 失效等问题。AI通过优化算法,对任务进⾏预测、分析和⾃动化,能够减少⼈⼯成本并提⾼数据库的性能,将⼈⼯智能新技术与数据库运维管理相结合是各供应商需要⾯对的重要课题。
  1. 客户选择数据库产品的评定体系:决定性要素是产品技术和企业需求的适配程度, 同时考虑品牌、资质、⽣态、价格、服务等。不同的企业业务场景对数据库的要求不同,⼀般会从性能、 可扩展性、⼀致性等⽅⾯进⾏考量,需求适配是选型的第⼀要义,⽽可靠、可⽤、稳定性则是不同企业场景下都要满⾜的基本要求。

数据库的性能指标聚焦于6个⽅⾯:吞吐量、负载均衡、读写速度、分区分⽚、并发性和可⽤性,通过核心方向上的攻关发展,国产数据库正在加速发展,走上担当大任的道路。


云和恩墨大讲堂 | 一个分享交流的地方

长按,识别二维码,加入万人交流社群

请备注:云和恩墨大讲堂

点个“在看”

你的喜欢会被看到❤

0 人点赞