报告解读与下载 | 数据库深度复盘与2022国产数据库展望

2022-03-08 17:40:20 浏览数 (1)

编者注:本系列将选择一些行业分析报告进行分享,同时提供下载,与读者共同分析分享数据库行业的最新进展与动态。关注本公众号回复:下载 。可以找到获得下载链接。

本报告的核心观点

数据库作为信息化的核心环节,是底层硬件基础资源与上层应用之间的重要支撑。随着海量数据的涌现和分析能力需求增长, 预计未来数据库存储量将出现严重错配 ,需求迫切性将显著提升 。

  • 从信息产业链角度来看,数据库作为信息化系统承上启下的关键环节 ,向下调用硬件基础资源, 向上为应用软件提供重要数据支撑,是信息化中间的核心环节 ;
  • 从国家政策角度来看, 数字经济作为国家“ 十四五 ”建设的重中之重, 数据作为新型关键生产要素 ,是推动数字经济发展的关键一环,同时,国内数据库长期由海外厂商主导,在国内数据库行业快速发展下,国产数据库将迎来重要发展机遇。

不断顺应市场需求变化 ,数据库行业正持续进化。报告回顾了数据库70年发展历程, 从数据模型逻辑 、技术架构、 需求功能、 部署方式、 商业模式、 存储介质、 治理模式等七大维度对数据库发展脉络进行详细梳理。我们发现, 由于数据规模 、读写需求量等指数级增长 ,为避免数据冗余与架构的复杂化, 叠加分布式架构技术日趋成熟,将多技术 、多模型融合成为数据库发展的重要方向。如将NoSQL非关系型的分布式拓展性与关系型数据模型融合诞生的NewSQL,保留了关系型数据逻辑的同时, 大幅提升了系统的灵活拓展能力;数据模型方面,将结构化、半结构化、非结构化等多种数据融合的多模数据库正快速发展;需求功能方面,将OLTP与OLAP融合的HTAP数据库正逐渐成为企业首选等均显示出行业技术融合的发展特点。

在国内大力发展数字经济建设的大背景下, 数据库行业规模将保持快速增长 。根据信通院统计,2020年中国数据库市场规模为35亿美元 (约合240.9 亿元人民币 ),预计2025 年市场总规模将达到688亿元,CAGR 为23.4 %。基于对数据库发展趋势与国家政策导向的分析,我们认为,未来数据库市场增量需求主要来自于以下三方面:

  1. 国产化进程正逐步加速 :通过对金融行业国产化数据库建设案例梳理发现, 国产数据库已经从边缘系统逐步实现核心系统国产化 ,显示出国产数据库产品功能、性能水平不断增强 。预计随着行业信创逐步落地, 对国产数据库需求将进一 步提速。
  2. 分布式架构凭借在经济性 、安全自主、 灵活性、可伸缩性等方面的优势,逐步实现对集中式架构替代:目前,互联网、 金融、 电信等行业分布式升级进展较快 ,其中金融 、电信行业已有分布式数据库在股份制银行 、城商行、 二三线城市运营商等实现了核心业务系统的改造落地 ,同时 ,墨天轮 前十大热门数据库均为分布式架构 ,其应用场景涵盖各行业,显示出国产分布式数据库已经趋于成熟,正成为各行业数据库建设重要选择。
  3. 随着工业互联网、互联网创新型业务 、车联网等应用的快速发展,非关系型数据库应用将加速落地:非关系型数据库 应用场景不断丰富 ,如 图数据库能够支撑社交网络、金融反欺诈等互联网新型应用场景的关联分析业务;时序数据库可以高效存储和快速处理海量时序大数据 ,在工业互联网快速发展下 ,传感器与设备产生的大量实时数据, 将推动时序数 据库应用快速发展等。
  • 数据模型逻辑 、技术架构、 需求功能、 部署方式、 商业模式、 存储介质、 治理模式等七大维度对数据库发展脉络进行详细梳理。
  • 在当前关系、非关系并行时代,新型NewSQL与多模数据库快速发展。传统SQL受限于其拓展性,在大数据发展下逐渐面临瓶颈, 而NewSQL提供了与NoSQL相同的可扩展性 ,而且仍基于关系模型 ,保留了极其成熟的SQL作为查询语言,从而保证了数据的强一致性;同时,基于分布式架构,对接多种数据模型引擎,避免搭建多种类数据库的多模数据库快速发展。
  • 分布式架构逐步由分库分表中间件向原生分布式发展 ,以应对不同应用场景。分库分表中间件早期主要以电商 、社交起家的互联网公司自研为主, 但由于其对复杂查询事务的支持较差 ,难以应对业务瞬时高峰需求, 因此更加便捷 、可靠的原生分布式数据库应运而生 。 按照具体实现方式可以分为两类:以 Greenplum 为代表的主流MPP架构和以Cassandra、HBase为代表的分区分片架构。
  • 开源有助于强化数据库生态建设, 已逐渐成为数据库产业的共识。2021年1月,根据DB-Engines ,全球数据库开源许可证流行度首次超过商业许可证,开源数据库逐渐成为行业主流。截至2021年6月, 开源与商业许可证数量分别为198和185个 ,流行度分别 占比51.4% 和48.6% 。开 源有助于扩大人才规模及上下游生态影响力, 通过运营开源社区快速获得反馈并加快产品开发、提升产 品质量,同时反哺社区开发者及独立软件开发商(ISV)等生态伙伴,能够达到多方共赢目的。 
  • 智能自治成为保障数据库安全可控的重要发展趋势。数据安全是数据库建设的重要前提 ,自动检测、 防范系统故障、 运维保护和修补安全漏洞对数据库而言至关重要;随着信息化的发展 ,应用系统和数据规模井喷式增长,数据库的负载调优压力增 大。因此,摆脱对DBA的经验决策依赖,基于人工智能自动执行安全 、备份、 打补丁和其他需要大量人工重复劳作、从根本上彻底消除人为差错、减轻DBA工作压力的自治数据库成为历史的必然选择。目前自治数据库仍停留在事后判断阶段,展望未来, 提前预判数据规模增长趋势和数据库负载状况,事前主动调优是自治数据库的发展新方向。
  • 金融、电信、政务、制造、互联网五个行业为数据库行业下游主要需求领域,大数据应用快速发展为数据库提供增长动力。根据信通院统计,其合计市场份额高达80%以上,2020年整体采购额超过192亿元。此外,根据赛迪顾问,2020年国内大数据市场结构数据 ,其中互联网、政府、金融 、电信 、工业位列前五, 占比分别为48% 、14%、12%、9 %、5%, 合计约88%, 大数据应用与数据库需求结构基本吻合,预计随着大数据应用领域拓展与规模持续增长,将为数据库行业规模增长提供充足动力。
  • 根据信通院统计,目前我国金融行业海外Oracle与IBM DB 2占比约74 %,占据主导,基于MySQL与PostgreSQL二次开发的国产数据库合计占比约为19%, 国产化仍有广阔空间。 其中,我们通过对金融行业国产化数据库建设案例梳理发现, 国产数据库已经从边缘系统逐步实现核心系统国产化, 显示出国产数据库产品功能 、性能水平不断增强 。预计随着行业信创逐步落地, 对国产数据库需求将进一步提速。
  • 分布式架构凭借在经济性、安全自主、灵活性、 可伸缩性等方面的优势,逐步实现对集中式架构替代。目前,互联网、金融、电信 等行业分布式升级进展较快,以金融和电信行业 为例,其核心业务数据类型均为关系型数据库, 此类集中式数据库所面临的业务体量将呈现爆发性增长。由于单一硬件能力增长有限,所以无法依靠纵向升级硬件扩展存量数据库能力上限。而分布式数据库采用多 种模式实现数据的分散存储,将压力分散到不同服务器上,并不断通过增加存储或计算节点来实现弹性升级,克服了集中式数据库 的诸多缺点,业界已有分布式数据库在股份制银行、城商行、二三线城市运营商等实现了核心业务系统的改造落地,同时,去年12 月,腾讯分布式数据库TDSQL落地东吴证券核心交易系统,也标志着分布式数据库在券商核心系统领域取得突破。
  • 墨天轮国产数据流行度排行(截至2022/02), 前十大热门数据库均为分布式架构,其应用场景涵盖各行业,显示出国产分布式数 据库已经趋于成熟,正成为各行业数据库建设重要选择。
  • 华为GaussDB是一个企业级AI-Native分布式数据库,将AI能力植入到数据库内核的架构和算法中, 智能诊断 、 索引推荐 , 为 用户提供更高性能、更高可用、更多算力支持的分布式数据库。GaussDB系列基于统一架构,底层选用分布式存储 ,中间层是每个DB特有的数据结构,上层是各个生态接口,支持关系型与非关系型数据库引擎,开启数据库极速与多模融合时代。
  • OceanBase是由蚂蚁集团完全自主研发的企业级分布式关系数据库 。OceanBase始创于2010年 , 具有数据强一致、高可用、高 性能、在线扩展、高度兼容SQL标准和主流关系数据库、低成本等特点 。据国际事务处理性能委员会(TPC) 测评 ,OceanBase 在TPC-H榜单中排名第一,是唯一一个在OLTP和OLAP领域测试均摘取桂冠的国产自研数据库。
  • PingCAP 成立于 2015 年, 是一家企业级开源分布式数据库厂商,致力于为全球用户提供稳定高效、安全可靠、开放兼容的新型数据服 务平台 、解决方案与咨询、技术支持与培训认证服务, 解放企业生产力, 加速企业数字化转型升级。PingCAP 在帮助企业释放 增长空间的同时,也提供了一份具有高度可参考性的开源建设实践样本。

云和恩墨大讲堂 | 一个分享交流的地方

长按,识别二维码,加入万人交流社群

请备注:云和恩墨大讲堂

  点个“在看”

你的喜欢会被看到❤

0 人点赞