随着大数据时代的来临,数据的重要性不言而喻,很多人谈论数据如何指数增长,以及我们将在多久之后可能会拥有更多的数据。但是,讨论数据库方面的人并不多,实际上,随着数据的增长,数据库需要能够跟上潮流。这就是为什么不仅要了解如何分析不断增长的数据量,而且要拥有能够高性能处理这些数据的数据库知识也变得格外重要。
这就是DZone编辑团队汇总了51个数据库术语列表的原因,作为数据库开发人员,你需要知道这些专业术语。在阅读数据库相关文档或专业领域书籍时,会经常见到。
以下排名根据字符排序,不分先后:
A
ACID (Atomicity, Consistency, Isolation, Durability - 原子性,一致性,隔离性,持久性)
: 指的是数据库事务的模型属性,传统上用于SQL数据库。
Aggregate(聚合)
: 域对象的群集,可以将其视为一个单元。大型分布式系统上数据存储的理想单元。
Apache
: 一个开源的分布式数据库系统,可以跨服务器存储和管理大数据,并且可以是大型BI(商业智能)系统的读取密集型数据库。
Apache Lucene
: 一个开放源代码的文本检索库,通常用于全文搜索,实现搜索引擎和实现推荐系统。
Apache Spark
: 一个开源并行处理框架,用于处理大规模数据分析应用程序,实时分析和数据处理工作负载。
B
BASE (Basic Availability, Soft State, Eventual Consistency)
: 指数据库事务的模型属性的术语,专门用于需要管理非结构化数据的NoSQL数据库。
B-Tree
: 一种数据结构,其中所有终端节点到基础的距离都相同,并且所有非终端节点都在n到2n个子树或指针之间。它针对读取和写入大块数据或主要执行读取操作的系统进行了优化。
C
Cloud-native database
: 建立在云计算交付模型上并在其上运行的数据库。
Complex event processing
: 一种用于从多个流收集数据以进行分析和计划的组织过程。
Consistency
: 一致性,数据库事务的四个主要属性之一,ACID中的C,这意味着如果事务失败,则数据将返回到其原始状态,或者如果它没有失败,则将创建新的数据状态。
D
Database
: 将两个或多个服务器和实例连接到数据库,通常是出于容错,负载平衡和并行处理的优势。
Data lineage(数据溯源)
: 有关数据来自何处,如何更改以及如何移动的信息;可用于解决数据库中的验证和调试问题。
Data management(数据管理)
: 组织处理存储,处理和分析数据集的完整生命周期。
Data mining(数据挖掘)
: 发现大量数据中的模式并将该信息转换为可理解的格式的过程。
Database management system (DBMS)
: 一套用于管理最终用户和数据库之间的数据的软件和工具。
Data warehouse(数据仓库)
: 可以协同工作并看起来像一个系统的单个计算机的集合。这要求访问中央数据库,每台计算机上的数据库的多个副本或每台计算机上的数据库分区。
Distributed relational database(分布式关系数据库)
: 包含对象(例如表)的数据库,这些对象是不同但相互连接的系统的一部分。
Distributed system(分布式系统)
: 一起工作并且看起来像一个单一系统的单个计算机的集合。这要求访问中央数据库,每台计算机上的数据库的多个副本或每台计算机上的数据库分区。
Document store(文档存储)
: 一种数据库类型,它聚合来自文档而不是已定义表的数据,并用于以可搜索的形式显示文档数据。
Dynamo DB
: 来自AWS的NoSQL数据库服务,具有低延迟,可以轻松存储和检索大数据并提供大量流量。
E
ElasticSearch
: 在Apache Lucene下构建的基于Java的搜索引擎,可以近乎实时地搜索和索引文件,并自动为JSON文档建立索引。
Eventual consistency(最终一致性)
: 符合BASE模型的数据库将包含随着时间推移变得一致的数据的想法。
F
Fault tolerance(容错)
: 系统在不中断其他系统的情况下响应硬件或软件故障的能力。
G
Graph store(图形存储)
: 一种数据库类型,用于处理具有大量关系的实体,例如社交图,标签系统或任何链接丰富的域;它也经常用于路由和定位服务。
H
Hadoop
: 专为高可伸缩性,数据密集型分布式计算而开发的Apache Software Foundation框架。它主要用于非常有效地批处理大型数据集。
High availability (HA)(高可用)
: 指即使发生组件故障,计算机系统中资源的连续可用性。这可以通过冗余硬件,软件解决方案和其他特定策略来实现。
Hybrid transaction/analytical processing(混合事务/分析处理)
: 一种应用程序体系结构,据说可以“打破常规”,实现事务处理和分析之间的实时交互。
I
In-memory
: 作为通用的行业术语,它描述了将数据加载到RAM或闪存而不是硬盘或固态驱动器中的数据管理工具。
J
Join
: SQL中的一个子句,它使用每个关系表的公共值来组合关系数据库中一个或多个表的列。
Journaling
: 是指同时实时记录数据库中所有数据更新。生成的日志用作审核跟踪,如果原始数据已损坏或删除,则可用于重建数据库。
JPA (Java Persistence API)
: 一种Java规范,用于访问,管理和持久化Java对象/类与关系数据库之间的数据。
K
Key-value store
: 一种数据库,以简单的键值对形式存储数据。它们用于处理大量小的,连续的和潜在易失的读写操作。
L
Lightning memory-mapped database (LMDB)
: 写时复制B-Tree数据库,它完全是事务性的,符合ACID,体积小,并使用MVCC。
Log-structured merge (LSM) tree
: 一种数据结构,它使用通常组织为级别的不可变段或运行来写入和编辑数据。有几种策略,但是第一级通常包含最新的活动数据。
M
MapReduce
: 由Google创建的一种编程模型,用于高度可扩展性和分布在多个群集上,用于数据处理。
Multi-version concurrency control (MVCC)
: 多版本并发控制,一种用于处理机器同时读写数据库的情况的方法。
N
Non-first normal form query language (N1QL)
: 由Couchbase开发,它为分布式面向文档的数据库提供通用的查询语言和基于JSON的数据模型。
NewSQL
: 关系数据库系统的简写描述符,提供与NoSQL系统相同的水平可伸缩性和性能。
NoSQL
: 一类数据库系统,它结合了传统SQL之外的其他查询方式,并且不使用标准的关系结构。
O
Object-relational mapper (ORM)
: 一种工具,提供数据库抽象层,使用面向对象的编程语言(而不是数据库的查询语言)在不兼容的类型系统之间转换数据。
P
Parallelism(并行)
: 操作系统能够有效地协同工作以解决问题的状态。
Persistence(持久性)
: 指程序中的信息超出了创建它的进程的寿命,这意味着在关闭或清除RAM时不会将其删除。数据库提供持久性。
Polyglot persistence
: 指组织针对不同类型的数据使用几种不同的数据存储技术。
R
Relational database(关系型数据库)
: 一个数据库,它以表,记录和列的形式构造相互关联的数据集。
Replication(复制)
: 共享数据的术语,以确保冗余资源之间的一致性。
S
Scalability(可伸缩性)
: 数据库或其他系统具有占用更多资源和容量并连接多个实体以提高效率的能力。
Schema
: 单个数据库的唯一数据结构的术语。
Sharding(拆分)
: 也称为“水平分区,”分片是其中一个数据库是分割成数块,通常是提高应用程序的速度和可靠性。
Strong consistency(强一致性)
: 数据库概念,指的是无法提交违反数据库数据有效性规则的事务。
Structured query language (SQL)
: 一种用于管理和处理数据的编程语言;主要用于关系数据库中。
W
Wide-column store
: 由于它们与Google早期的BigTable数据库有关系,因此也称为“ BigTable存储区”,这些数据库将数据存储在可以容纳大量动态列的记录中。列名和记录键不是固定的。
附、一张有故事的照片(十一)
战场上的四年 很长,很长 他的眼中再也没有最初的那份憧憬 活着,或许就是莫大的荣幸。