上回我们已经学习了一些简单的搜索功能,比如设置搜索语句、分页方法、数量查询以及高亮和折叠的查询效果。而今天,我们将更加深入地学习其它搜索相关的内容。最核心的,就是布尔查询,也就是类似于我们在数据库中的 AND 和 ...
近期简单学习了一下向量数据库 qdrant 与 sentence-transformers 库,两者结合可以构建一个简单的自然语言搜索引擎。顺着官方的教程实操了一遍之后,稍微调整一番,我在中文数据集上构建了一个自然语言搜索引擎。...
近期在研究开源的 rust 实现的向量数据库 qdrant。顾名思义,向量数据是用于存储和查询向量的数据库,而向量本质上是一个多维空间中的点。如果要用向量数据库处理文本数据,就需要将文本转换为向量表示,机器学习术语叫做文...
Pip是Python的包管理工具,用于方便地安装、升级和管理Python包。在本文中,我们将深入探讨Pip的基本命令和使用方法,以便读者能够更好地利用这一强大工具进行Python开发。...
Linux 三剑客一直以来都是备受赞誉的工具集合。它们分别是:grep、sed 和awk。这三个工具,常常被形容为Linux系统中的"魔杖",因为它们提供了无与伦比的文本处理和分析能力,是每个程序员的得力助手。本文将深入探讨这三个强...
搜索引擎由众多模块组成,包括数据采集模块、文本分析模块、索引存储模块、搜索模块,那么接下来我们依次分析每个模块的作用
打开谷歌, 输入关键词, 谷歌往往可以很精准的返回你所需要的内容, 这个是怎么实现的呢?简单的思考一下就能得出一个结论:一定是关键词能极为快速和准确的命中具体的内容及地址, 但是搜索引擎的收录页面数量往往是千亿万亿级...
如果你有本地代码需要推送到远程Git仓库,并且远程仓库中已经存在一个README.md文件,你可以按照以下步骤操作来完成这个任务。
食用方法:只需将下面的JS代码复制到自己博客的全局JS文件中即可;并将其中必要的信息更换成自己的