NoSQL与SQL:主要区别及选型

2022-12-21 16:56:31 浏览数 (1)

翻译:[原文地址](https://www.upwork.com/resources/nosql-vs-sql#use-nosql)。

有少量对原文的补充,以(补充:xxxx)的形式穿插在文中。

译文开始:


根据是否可以使用结构化查询语言(SQL),可以把数据库分为 SQL 和 NoSQL 两种类型。

本文将探讨 SQL 是什么,它如何使这些数据库与众不同,以及如何确定应该使用哪种数据库。

什么是 SQL 数据库

SQL 数据库 - 也称为关系数据库 - 并以其编写的编程语言命名,结构化查询语言 (SQL)。这是一种更严格、更结构化的数据存储方式。关系数据库管理系统 (RDBMS) 通过更新、删除或创建新记录来执行查询、检索数据(retrieves data)和编辑数据。SQL 是一种轻量级的声明性语言,它充当数据库版本的服务器端脚本,以此为关系数据库完成繁重的工作。

SQL 数据库至今仍然很受欢迎,因为它们天然适合许多经典的技术栈,例如:LAMP 和基于 Ruby 的技术栈。这些数据库得到了很好的支持,应用也非常广泛,在使用中遇到问题时更容易找到解决办法。SQL 的一个特殊优势是其简单而强大的 JOIN 子句,允许开发人员使用单个命令检索存储在多个表中的相关数据。(补充:JOIN 虽然方便,但是使用要慎重,尤其是在一些并发要求高的场景中。)

什么是 NoSQL 数据库

NoSQL 数据库——也称为 “non SQL” 或者 “not only SQL”,以关系表以外的格式存储数据。如果您的数据需求在一开始不够清楚或者您正在处理大量非结构化数据,您最好选择非关系型数据库,因为它们更加灵活。

NoSQL 数据库如何工作?NoSQL 数据库不是表,而是面向文档的。它们更像是文件夹,汇集了所有类型的相关信息,但不一定对数据进行分类。

注意,NoSQL 数据库提供了更大的灵活性,这使得它们更加直观。NoSQL 数据库根据其数据模型分为多种类型。主要类型有 document、key-value、wide-column 和 graph 。

NoSQL 数据库的常见类型有哪些?

NoSQL 数据库常见的有四种类型,分别是:

  1. 「Key-value store model:」最简单的 NoSQL 类型,它以索引键和值组成的无schema(schema-less)方式存储数据。示例:Cassandra、Azure、LevelDB和Riak。
  2. 「Column store:」wide-column 以列的形式存储数据,而不是行。它不仅仅是一张行列变换的表--按列存储可实现出色的可伸缩性和高性能。例如:HBase, BigTable, HyperTable。
  3. 「Document database:」采用 key-value 的概念,并经过更加复杂的设计;在这种类型的数据库中每一个文档都有它自己的数据,而且有一个唯一 ID 和数据对应。它是存储、检索和管理面向文档但仍是半结构化数据的绝佳选择。例如:MongoDB, CouchDB。
  4. 「Graph database:」互相关联的数据,最好是可以用图表示。这种存储方式复杂性比较高。例如:Polyglot, Neo4J。

SQL 和 NoSQL 数据库之间的差异

当决定使用 SQL 还是 NoSQL 数据库时,你需要了解他们的一些关键差异。

数据结构或模型

请记住, SQL 和 NoSQL 数据库的一个关键区别在于数据的结构。SQL 数据库是基于表的, NoSQL 数据库是非关系型的。这意味着 SQL 数据库包含结构化数据,并且可以使用关系模型执行分析。NoSQL 数据库包含非结构化数据,这意味着无法通过预定义的模型对其进行分析。

SQL

SQL 或关系模型更适用于结构化数据。这是因为结构化数据易于搜索和分析,就像在具有列和行的表中布置的数据一样。

NoSQL

NoSQL 模型适用于结构化程度较低的数据集,因为它不依赖预定义的模型来分析数据。

扩展性

当存储的数据量大幅增加时,请考虑扩展您的数据库。您可以通过向数据库添加额外的服务器来水平扩展,也可以通过增加现有服务器的存储大小来垂直扩展。但是,对于 SQL 数据库和 NoSQL 数据库,有不同的扩展方式。

SQL

大多数 SQL 数据库都是垂直可扩展的,这意味着您可以向现有的单个服务器添加更多 RAM 或 CPU 以增加存储空间。(补充:这里只考虑数据库自身支持的扩展,没有考虑分库、分表的扩展方式)

NoSQL

绝大多数 NoSQL 数据库是支持水平扩展的,这意味着您只需向数据库中添加更多服务器即可获得更多存储空间。因为能通过添加服务器来扩容, NoSQL 数据库更接近分布式数据库。水平扩展数据库的一种流行方法是分片(sharding)。分片是指将数据库拆分为多个组件部署在多个服务器上的概念。

数据查询

在查询数据时,SQL 数据库往往能够执行比 NoSQL 数据库更复杂的查询,但无论您使用哪种数据集,您运行查询的方式取决于相关数据库。

SQL

SQL 系统在数据查询方面很简单,因为它们依赖于一种语言。因为它已经存在了很长时间,所以很多东西也比较稳定,这使不太懂技术的团队成员更容易掌握这种语言。

NoSQL

NoSQL 系统在运行查询时要复杂一些。由于没有固定的查询语言,您的团队可能需要与开发人员或信息技术知识更丰富的人合作来进行数据查询。

数据存储

在数据存储方面,SQL 更直接,而 NoSQL 提供更复杂的数据存储解决方案。

SQL

SQL 存储模型是具有固定行和列的表,程序员将其称为关系数据库。

NoSQL

NoSQL数据库有多种存储模型,包括键值模型、列存储、文档数据库和图数据库。

性能

为了性能,程序员开发了 NoSQL 数据库来解决传统的 SQL 数据库面临的一些性能问题——特别是在可扩展性方面。

SQL

如果您的 SQL 数据库遇到性能问题,您可能需要更高配的服务器来容纳不断增长的数据量。但是,更高配置的服务器并不是管理数据,最节约成本的方式。

NoSQL

NoSQL 数据库无需购买具有更多内存的大型服务器,而是可以水平扩展,这意味着您可以根据需要向已有的集群添加新服务器。

受欢迎程度和易用性

最后,在流行度和易用性方面很大程度上取决于您将要处理的数据类型。

SQL

SQL 数据库往往适合复杂查询。

NoSQL

当您使用非结构化数据时,NoSQL 数据库往往是最佳选择。

SQL 数据库示例

以下是一些流行的 SQL 数据库或 RDBMS

  • 「Oracle」—用 c 语言编写的一个 object-relational DBMS。如果您有预算, 购买 Orcale 可以获得很棒的服务,并且系统有很高的可靠性。Oracle 还发布了 Oracle NoSQL 数据库。
  • 「MySQL」—最流行的开源数据库,非常适合 CMS 网站和博客。
  • 「Google Cloud SQL」—通过 Google 提供的用于 MySQL、PostgreSQL 和 SQL Server 的完全托管的关系数据库服务。(补充:国内的云厂商比如阿里云、腾讯云也有类似的服务。)
  • 「Sybase」—一种主要用于 Unix OS 业务的关系模型数据库服务器产品,这是第一个用于 Linux 的企业级 DBMS。
  • 「Amazon RDS」—Amazon RDS for SQL Server 让您可以轻松地在云中设置、操作和扩展 SQL Server 部署。(补充:国内的云厂商比如阿里云、腾讯云也有类似的服务。)
  • 「Microsoft Azure」—一个支持任何操作系统的云计算平台,同时让您可以在一个地方存储、计算和扩展数据。最近的一项调查甚至认为其领先于亚马逊网络服务和谷歌云存储用于企业数据存储。
  • 「MariaDB」—MySQL 的增强型嵌入式版本。
  • 「MS SQL Server」—Microsoft 为企业级数据库开发的 RDBMS,支持 SQL 和 NoSQL 架构。
  • 「PostgreSQL」—一个企业级的对象关系 DBMS,除了 SQL 级代码外,它还使用 Perl 和 Python 等过程语言。

NoSQL 数据库示例

以下是一些流行的 NoSQL 数据库

  • 「MongoDB」—最流行的 NoSQL 数据库,尤其在初创企业中。一个面向文档的数据库,用动态 schema 生成类似 JSON 的文档,而不是在 Craigslist、eBay、Foursquare 等网站的后端使用的关系表。它是开源的、免费的,而且具有良好的客户服务。
  • 「Apache’s CouchDB」—是一个真正的网络数据库。它使用 JSON 数据交换格式来存储其文档;使用 Javascript 来索引、组合和转换文档;提供 HTTP 接口 API。
  • 「Redis」—一个流行的键值数据库。
  • 「Riak」—一个用 Erlang 编写的开源键值存储数据库。它具有容错复制和内置的自动数据分发功能,可提供出色的性能。
  • 「HBase」—作为 Hadoop 的一部分开发的另一个 Apache 项目,这个开源、非关系“列存储”NoSQL DB 是用 Java 编写的,并提供类似 BigTable 的功能。
  • 「Oracle NoSQL」—Oracle 提供的 NoSQL 数据库.
  • 「Apache’s Cassandra DB」—Cassandra 诞生于 Facebook,是一个分布式数据库,擅长处理大量结构化数据。不断增长的应用程序?Cassandra 擅长扩容(补充:数据库层面支持分布式部署)。使用方:Instagram、Comcast、Apple 和 Spotify。

何时选择 NoSQL 或 SQL 数据库

何时选用 SQL 数据库

谈到数据库技术,没有万能的解决方案。这就是为什么许多企业同时依赖关系数据库和非关系数据库来完成不同任务的原因。尽管 NoSQL 数据库因其速度和可扩展性而广受欢迎,但在某些情况下,高度结构化的 SQL 数据库可能更受欢迎。以下是您可能选择 SQL 数据库的几个原因:

  • 「确保对 ACID 特性的完整支持 (Atomicity, Consistency, Isolation, Durability).」 ACID 特性通过规定事务与数据库的交互方式来减少异常并保护数据库的完整性。通常,NoSQL 数据库为了灵活性和处理速度而牺牲了 ACID 支持的完备性,但对于许多电子商务和金融应用程序来说,符合 ACID 的数据库仍然是首选。
  • 您的数据是结构化且不变的。假设您的业务没有经历需要更多服务器的大规模增长,并且您只使用一致的数据。在这种情况下,可能没有理由使用旨在支持各种数据类型和高流量的系统。

何时选用 NoSQL 数据库

当服务器端应用程序的所有其他组件都需要快速、无缝的设计时,NoSQL 数据库可以防止数据成为瓶颈。大数据是这里真正的 NoSQL 动力,它可以做传统关系数据库无法做到的事情。它推动了 MongoDB、CouchDB、Cassandra 和 HBase 等 NoSQL 数据库的普及。

  • 存储大量几乎没有结构的数据。NoSQL 数据库对可以存储在一起的数据类型没有任何限制,并允许您根据需要更改添加不同的新类型。使用基于文档的数据库,您可以将数据存储在一个地方,而无需预先定义数据的“类型”。
  • 充分利用云计算和存储。基于云的存储是一种出色的节省成本的解决方案,但需要将数据轻松地分布在多个服务器上以进行扩展。自己采购或在云产品中使用价格合理、体积更小的硬件可以为您节省软件的开支,并且像 Cassandra 这样的 NoSQL 数据库旨在开箱即用地跨多个数据中心进行扩展,使用起来非常方便。
  • 方便快速迭代。假设您在两周的敏捷冲刺中进行开发,进行快速迭代,或者需要对数据结构进行频繁更新,而版本之间没有大量的停机时间。在这种情况下,关系数据库会减慢您的速度。NoSQL 数据库会省去很多准备工作。

结论

使用 SQL 和 NoSQL 数据库的方式有很多种,而决定哪种数据库最适合您使用的最大因素之一很大程度上取决于您存储的数据类型。如果您正在处理不会随时间发生太大变化的结构化数据,您将需要使用 SQL 数据库。如果您正在处理非结构化或半结构化的大量数据,您将需要考虑使用 NoSQL 数据库。


译文结束。

New SQL

随着数据库技术的发展,除了 SQL 和 NoSQL 数据库,新型的 New SQL 数据库往往能具备二者的优点。既能为线上事务处理 (OLTP) 工作提供 NoSQL 系统的可扩展性,同时保持传统数据库系统的 ACID 的特性。

总结

数据库的选择对一个系统来说非常关键,往往影响系统能承载的数据量,影响系统的可扩展性、稳定性。在选型时需要对具体的数据库做功能分析、性能分析、可用性分析,评比数据库和系统数据的适配性;需要了解数据库的存储结构、索引类型、ACID、分片、持久化等多个特性。当一种数据库无法满足系统需求时,需要多种数据库一起使用。

0 人点赞