InfluxDB 3.0简介:InfluxDB IOx的演变

2023-05-08 18:11:55 浏览数 (2)

InfluxDB 3.0 现在是当前和未来所有 InfluxDB 产品的基础,首次为 InfluxDB 平台带来了高性能、无限基数、SQL 支持和低成本对象存储。InfluxDB 3.0 在 Rust 中作为列式数据库开发,在单个数据存储中引入了对各种时间序列数据(指标、事件和跟踪)的支持,以支持依赖于高基数时间序列数据的可观测性、实时分析和 IoT/IIoT 用例。

InfluxDB 3.0现已在InfluxData的云产品中推出:InfluxDB Cloud Serverless(我们的完全托管,弹性,多租户数据库)和InfluxDB Cloud Dedicated (InfluxDB的完全托管,单租户版本)。请继续关注今年晚些时候推出的两款计划中的自我管理产品:

  • InfluxDB 3.0 集群:InfluxDB Enterprise的演变。
  • InfluxDB 3.0 Edge:用于本地和边缘部署的单节点实例,将于今年晚些时候推出。

InfluxDB 云专用现已正式发布

InfluxDB Cloud Dedicated 是处理大型数据集的客户的理想解决方案,这些客户需要对专用单租户集群中隔离的数据提供保证和安全性。它提供自定义配置和增强的安全选项(包括企业 SSO、专用连接和基于角色的访问控制)以及基于容量的定价模型。

优化 InfluxDB 3.0 以...

如果您属于以下类别之一,我们认为您需要查看InfluxDB 3.0:

  1. 您是现有的 InfluxDB OSS 用户 — InfluxDB 3.0 可能会以最少的更改更快、更便宜地运行您现有的工作负载。此外,它还使您能够访问新功能,并能够将 InfluxDB 用于更多不同类型的数据。
  2. 您不是现有的 InfluxDB 用户,但您需要一个具有实时功能的分析数据库来处理大量数据,或者您正在努力充分利用现有的分析数据库,那么 InfluxDB 3.0 将满足您的需求。

无限扩展的性能

InfluxDB 3.0在某些重要方面超越了InfluxDB 1.x和2.x。InfluxDB 3.0 的增强功能使 InfluxDB 处于分析数据库的最前沿,允许开发人员大规模实时摄取和查询所有类型的全保真时间序列数据,并且没有任何妥协。

InfluxDB 3.0现在支持无限基数,这将InfluxDB的用例扩展到任何带时间戳的数据。与其他分析数据库不同,InfluxDB 3.0 在摄取性能、可扩展性、弹性和效率方面具有巨大的提升,即使数据复杂性和基数增加也是如此。

例如,与以前版本的 InfluxDB 相比,新的 InfluxDB 3.0 在以下方面提供了性能提升:

  • 对高基数数据的查询速度提高 100 倍,提供实时查询响应
  • 10 倍的摄取性能,每秒摄取、存储和分析数十亿个时间序列数据点,不受限制或上限
  • 使用 Apache Parquet 文件格式的数据压缩率提高了 10 倍,该格式专为高效的数据存储和检索而设计

Arrow 生态系统中的 InfluxDB

我们围绕 Apache Arrow 项目开发了 InfluxDB IOx,并扩展了 InfluxDB 3.0,这是一个用于列式数据的开源内存规范,是分析用例高性能计算的黄金标准。我们在 Arrow 上构建了 InfluxDB IOx 引擎,以利用其性能和生态系统。

InfluxDB 3.0现在使用Apache Parquet文件格式来存储数据。Parquet 的压缩在有效利用磁盘空间方面实现了几个数量级的收益。能够在更小的空间内存储更多数据对于控制成本以及大型分析工作负载的整体效率非常重要。

利用Apache DataFusion,InfluxDB 3.0具有现代且超快的SQL实现。因为它基于开放标准,所以您可以将现有的 SQL 知识和工具带到您的 InfluxDB 体验中。我们甚至增强了DataFusion的SQL方言,以包含关键的时间序列函数。

我们还将InfluxData的时间序列查询语言InfluxQL引入DataFusion。现在,InfluxQL 的运行速度比以往任何时候都快。

在InfluxData,我们相信Apache Arrow生态系统。秉承我们的开源精神,我们的工程师为上游 Arrow 项目做出了重大贡献,以确保性能和功能符合 InfluxDB 及其专用用户群的标准。InfluxDB 3.0 的引入首次将时序数据引入 Arrow 生态系统,使分析工作负载能够更轻松地合并时序数据。这确保了 OSS 贡献更易于构建和集成。

0 人点赞