最新 最热

时间序列在数据embedding方面有哪些创新方法和工作?

我们看到的很多论文,大多把注意力集中到模型结构的改进上,比如:注意力机制、编码器、解码器设计和改进等。但是,却少有人关注到时间序列数据的embedding上。...

2024-09-18
1

AI: 探索大模型权重的分类:Chat、Code、Embedding和Rerank

在机器学习和自然语言处理领域,大模型(如GPT-3、BERT等)已经成为了强大且广泛应用的工具。大模型的权重通常可以根据其应用场景分为不同的类别,如Chat、Code、Embedding和Rerank。了解这些分类及其差异对于我们在实际应用...

2024-07-31
3

PyMilvus 与 Embedding 模型集成

现在,Milvus 的 Python SDK——PyMilvus 中已集成模型模块,支持直接添加 Embedding 和重排(Reranker)模型,大幅简化了将数据转化为向量以及对搜索结果进行重排的流程,十分适用于检索增强生成(RAG)应用。...

2024-07-10
1

语义检索-BAAI Embedding语义向量模型深度解析:微调Cross-Encoder以提升语义检索精度

语义向量模型(Embedding Model)已经被广泛应用于搜索、推荐、数据挖掘等重要领域。在大模型时代,它更是用于解决幻觉问题、知识时效问题、超长文本问题等各种大模型本身制约或不足的必要技术。然而,当前中文世界的高质量...

2024-07-09
1

tree2retriever:面向RAG场景的递归摘要树检索器实现

腾讯云开发者社区是腾讯云官方开发者社区,致力于打造开发者的技术分享型社区。提供专栏,问答,沙龙等产品和服务,汇聚海量精品云计算使用和开发经验,致力于帮助开发者快速成长与发展,营造开放的云计算技术生态圈。...

2024-05-31
1

大模型相关技术-为什么需要rerank

在RAG(RetrievalAugmented Generation)中,embedding模型的向量检索可以帮助提高文本生成的效果,但仍然需要

2024-05-07
2

大模型相关技术-embedding与分词

接上一篇文章大模型相关技术-初识RAG-腾讯云开发者社区-腾讯云 (tencent.com),我们已经对RAG(搜索增强)有了一定的了解,知道了为什么需要RAG和RAG的技术基石,本篇我们将详细学习一下RAG的两大关键技术中的embedding...

2024-04-30
1

「X」Embedding in NLP|一文读懂 2023 年最流行的 20 个 NLP 模型

在上一篇文章中,我们已经科普了什么是自然语言处理(NLP)、常见用例及其与向量数据库的结合。今天,依然是「X」Embedding in NLP 系列专题,本文为初阶第二篇,我们将深入介绍在 2023 年爆火的大语言模型 NLP 模型,包括 BERT、X...

2023-11-24
1

【腾讯云云上实验室-向量数据库】Tencent Cloud VectorDB在实战项目中替换Milvus测试

亮点:Tencent Cloud VectorDB支持Embedding,免去自己搭建模型的负担(搭建一个生产环境的模型实在耗费精力和体力)。

2023-11-24
1

「X」Embedding in NLP|初识自然语言处理(NLP)

为了方便大家能够深入了解向量数据库与 NLP 的关系及应用,我们上线了「X」Embedding in NLP 系列专题,分为初阶和进阶两部分。本文为初阶第一篇,将详细介绍 NLP 以及以 Zilliz Cloud、Milvus 为代表的向量数据库是如何为...

2023-11-22
1