数据库库信息速递:MySQL HeatWave 引入AI 功能 (译)

2023-09-25 21:31:49 浏览数 (1)

Oracle在年度CloudWorld大会上宣布,在数据分析云服务MySQL HeatWave增加Vector Store和新的生成式AI功能。

MySQL HeatWave将OLAP(在线分析处理)、OLTP(在线事务处理)、机器学习和基于人工智能的自动化功能结合到一个单独的MySQL数据库中。新增加的生成式AI功能包括一个大型语言模型驱动的接口,允许企业用户以自然语言的方式与服务的不同方面进行交互,包括搜索不同的文件。

这个功能允许用户通过自然语言的询问和指令来与数据分析云服务进行交互,而无需熟悉复杂的查询语言或命令。用户可以通过提问、描述或指示来搜索和获取不同文件,使得使用数据分析云服务变得更加简便和直观。

这种大型语言模型驱动的接口借助生成式AI技术,可以理解用户提出的自然语言查询并进行相应的响应和操作。这种接口不仅提高了用户的使用体验,还提供了更高效、智能的文件搜索和操作功能。新增加的生成式AI功能为数据分析云服务提供了一个大型语言模型驱动的接口,使得企业用户可以以自然语言的方式与服务进行交互,并在搜索和使用不同文件时更加方便和智能。

据公司介绍,私人预览阶段的新功能Vector Store可以接收多种格式的文件,并将其作为编码器模型生成的嵌入存储起来,以便更快地处理查询。“对于给定的用户查询,Vector Store通过在存储的嵌入和嵌入查询之间执行相似性搜索,识别出最相似的文件,”Oracle的一位发言人说道。这些文件可以后续用来增强传递给LLM驱动接口的提示,从而返回更有上下文的答案。

简而言之,新的Vector Store功能可以将多种格式的文件转换为嵌入,并存储起来,以便更快地处理查询。通过执行相似性搜索,它可以识别出与给定查询最相似的文件。这些文件随后可以用于加强传递给LLM驱动接口的提示,以获得有效人性化的答案,据公司表示,去年十月发布的Oracle的MySQL HeatWave Lakehouse已经更新,以支持自动机器学习(AutoML)。HeatWave的AutoML是该服务中的一个机器学习组件或功能,除了MySQL数据库中的数据外,还支持对对象存储中的数据进行训练、推断和解释。AutoML的其他更新包括对文本列的支持,增强的推荐系统以及训练进度监控。

据该公司表示,对于文本列的支持现在将允许企业在这些列中存储的数据上运行各种机器学习任务,包括异常检测、预测、分类和回归。

今年三月,Oracle为MySQL HeatWave添加了几个新的机器学习功能,包括AutoML和MySQL Autopilot。Oracle的推荐系统,即AutoML中的推荐引擎,也已更新以支持更广泛的反馈,包括隐式反馈(例如过去的购买和浏览历史)和显式反馈(例如评分和喜欢),以生成更准确的个性化推荐。还添加了一个名为Training Progress Monitor的独立组件到AutoML中,以便企业可以监控使用HeatWave进行训练的模型的进展情况。Oracle 还更新了在 HeatWave 中的 MySQL Autopilot 组件,以支持自动索引。这一新功能目前只在有限的环境中可用,旨在帮助企业消除为其在线事务处理工作负载创建并随着工作负载演变而维护最佳索引的需求。

公司在一份声明中表示:“MySQL Autopilot通过使用机器学习基于个体应用工作负载预测来自动确定客户应该创建或删除的表索引,以优化其在线事务处理吞吐量。Autopilot还添加了一项名为自动压缩的功能。自动压缩帮助企业确定每个列的最佳压缩算法,从而提高加载和查询性能,并降低成本。Autopilot中的其他更新还包括自适应查询执行和自动加载和卸载功能。

正如其名称所示,自适应查询执行帮助企业优化查询的执行计划,通过使用从查询的部分执行中获取的信息来调整数据结构和系统资源,从而提高性能。另外,自动加载和卸载通过自动加载正在使用的列到HeatWave中,以及卸载从未被使用的列来提高性能。“此功能会自动卸载从未或很少被查询的表。这有助于释放内存并减少客户成本,而无需手动执行此任务,”该公司表示Oracle还将为MySQL HeatWave添加对JavaScript的支持。目前,该功能仅在有限可用性中,它将允许开发人员使用JavaScript编写存储过程和函数,并在数据分析云服务中执行它们。

其他更新还包括JSON加速,用于将更多工作负载迁移到HeatWave的新分析运算符,以及将数据批量导入MySQL HeatWave的功能。批量导入功能支持从CSV文件加载数据时并行构建索引子树。公司表示,这将提高数据导入的性能,从而使新加载的数据能够更早地进行查询。

0 人点赞