【ES三周年】轻量级的搜索引擎MeiliSearch

2023-02-14 17:54:08 浏览数 (1)

一、MeiliSearch简介

谈到搜索引擎,可能大家最先想到的是Elasicsearch。Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎,能够在大量的数据中搜索、分析和探索需要的数据。在后端架构中,Elasticsearch通常需要与Logstash的数据收集和日志解析引擎Kibana一起配合来搭建可视化平台,而这三个产品也被设计成一个集成解决方案,称为ELK。

虽然Elasticsearch足够灵活强大、扩展性和实时性也较好。但是对于中小型项目来说,Elasticsearch还是显得有些庞大,对硬件设备的要求也较高。那么,在要求不是很高的情况下,我们可以考虑另一种搜索引擎方案:MeiliSearch。

MeiliSearch是一个功能强大、快速、开源、易于使用和部署的搜索引擎,并且MeiliSearch的搜索和索引都是高度可定制的,提供开箱即用的功能属性,如错字容忍、过滤器和同义词。而最重要的一点是,它【支持中文搜索】,而不需要添加额外的配置。

MeiliSearch使用RUST语言进行编写 ,RUST语音最重要的特点就是并发安全,同时它还是支持函数式和命令式以及泛型等编程范式的多范式语言。并且在性能方面,MeiliSearch也是媲美C 语音的存在,所以使用RUST语音编写的MeiliSearch搜索引擎,可以说在性能上也是非常的优秀。

二、基本使用

2.1 安装软件

MeiliSearch的安装方式有很多,支持Homebrew、Docker 容器、二进制、以及RUST 环境下克隆项目源码方式进行安装。

由于我使用的是MacOS,所以直接使用的是Homebrew方式,安装的命令如下:

代码语言:javascript复制
# Update brew and install MeiliSearch
brew update && brew install meilisearch


# Launch MeiliSearch
meilisearch

启动成功后,系统会允许一个 MeiLiSearch 服务 (opens new window)。

同时,MeiLiSearch服务自身提供可视化的 Web 搜索页面,我们可以访问一下这个页面来验证服务是否运行成功。

由于还没有创建索引和文档,所以上面的页面是没有数据的。MeiliSearch的数据部署和ES十分相似,但又要简单许多。一般需要经历【添加索引】和【添加文档】两步。

2.2 CURL方式部署

2.2.1 添加索引

首先,我们使用简单的 CURL 创建索引。

代码语言:javascript复制
curl 
  -X POST 'http://localhost:7700/indexes' 
  -H 'Content-Type: application/json' 
  --data-binary '{
    "uid": "movies",
    "primaryKey": "id"
 }'

执行成功后,如下图所示。

2.2.2 添加文档

索引是存储文档的地方,文档代表的是真正的数据,我们同样使用CURL批量创建文档。

代码语言:javascript复制
# 添加文档到 movies 索引
curl 
  -X POST 'http://localhost:7700/indexes/movies/documents' 
  -H 'Content-Type: application/json' 
  --data-binary @movies.json
# movies.json为测试数据,具体数据可到meilisearch官网下载

涉及的movies.json为测试数据,下载链接:movies.json。为了方便上传数据,我们使用PostMan等工具来添加数据,上传成功系统会返回一个Json的结果,如下图。

需要说明的是,Body部分由于使用的是二进制方式,所以需要选择binary按钮。当我们再次刷新浏览器,就会发现数据已经搜索出来。

可以看到,由于数据并不是很多,所以搜索出来也是很快的。

2.3 Python方式部署

使用Python方式部署需要先安装Elasicsearch插件,安装的命令如下。

代码语言:javascript复制
pip3 install meilisearch

然后,再调用add_documents方法新增文档。

代码语言:javascript复制
import meilisearch
import json


client = meilisearch.Client('http://127.0.0.1:7700')


json_file = open('movies.json')
movies = json.load(json_file)
client.index('movies').add_documents(movies)

接着,我们可以使用search方法搜索数据,比如:

代码语言:javascript复制
client.index('movies').search('botman')

当然,除了上面介绍的两种部署方式,MeiliSearch 还提供PHP、JAVA、Python 等语言的 SDK,直接直接集成到项目,开箱即用。

三、总结

总的来说,对于数据量不是很大的中小型企业来说(几百万到几千万的数据),都可以使用 MeiliSearch 搜索引擎。同时,它的使用场景基本可以覆盖当前主流的平台和技术,如管理后台搜索、小程序搜索等场景中。是一款真正轻量级安装部署、搜索速度快到极致,名副其实的轻量级且美丽搜索引擎。

官网文档链接:https://docs.meilisearch.com/

0 人点赞