前言
好久没有更文,先给广大读者致个歉!最近新找了工作,新工作前面的试用期几乎全力投入工作中去了,另外自己这段时间也在研究一些开源项目,在笔者本为了跑起来花时间填了不少坑,以致于公众号更文的事情被一推再推而被耽误就是一个多月,实在是感觉光阴似箭,虚度不起!下面我们进入正文。
ElasticSearch(简称ES)是一个支持海量搜索引擎服务,当一个分布式系统需要支持海量搜索服务时都会优先上ES。因此掌握ES技术也是一门进入大厂拿高薪的必修课,笔者一直在追求深入掌握ES技术,一方面希望自己有机会还能进大厂并站稳脚跟。退一步讲就算进不了大厂,自己也要能具备做出大厂程序员能做出来的产品,到那时就算自己经营一个日活上万的网站或者App
也能有一份不错的收入。
之所以会选择7.12版本的ES是因为这个版本的ES算是一个比较新稳定的新版本,与之关联的Kibana
版本的界面也有了较大的更新,所以选择了安装这个版本的ES。笔者之前在Linux和Windows系统下也安装过单独的ES服务,但是发现都安装和配置非常麻烦,还容易报各种安装失败的错误。后来看到很多大牛都推荐使用Docker安装贼顺利,而且还方便维护,于是笔者也尝试在自己的云服务器中使用Docker安装ES和Kibana
及中文分词器,下面我们正式进入安装步骤,本文假设读者已经在自己的云服务器中安装好了Docker服务,并通过执行systemctl start docker.service
命令启动了Docker服务。
1. 创建网络
因为我们还需要部署kibana容器,因此需要让es和kibana容器互联,这里先创建一个网络。
使用FinalShell登录自己的Linux云服务器客户端(阿里云或腾讯云)
代码语言:javascript复制docker network create es-net
2. 加载镜像
执行 cd /usr/local
进入云服务器的 /usr/local
目录执行拉取ES和Kibana
安装包的docker命令
docker pull elasticsearch:7.12.1
docker pull kibana:7.12.1
这个elasticsearch镜像体积非常大,接近1G。
3.运行容器
执行如下docker命令运行ES服务:
代码语言:javascript复制docker run -d
--name es
-e "ES_JAVA_OPTS=-Xms512m -Xmx512m"
-e "discovery.type=single-node"
-v es-data:/usr/local/elasticsearch7.12.1/data
-v es-plugins:/usr/local/elasticsearch7.12.1/plugins
-v es-logs:/usr/local/elasticsearch7.12.1/logs
--privileged
--network es-net
-p 9200:9200
-p 9300:9300
elasticsearch:7.12.1
命令解释:
-e "cluster.name=es-docker-cluster"
:设置集群名称-e "http.host=0.0.0.0"
:监听的地址,可以外网访问-e "ES_JAVA_OPTS=-Xms512m -Xmx512m"
:分配内存大小-e "discovery.type=single-node"
:单节点模式-v es-data:/usr/local/elasticsearch7.12.1/data
:挂载逻辑卷,绑定es的数据目录-v es-logs:/usr/local/elasticsearch7.12.1/logs
:挂载逻辑卷,绑定es的日志目录-v es-plugins:/usr/local/elasticsearch7.12.1/plugins
:挂载逻辑卷,绑定es的插件目录--privileged
:授予逻辑卷访问权--network es-net
:加入一个名为es-net的网络中-p 9200:9200
:端口映射配置
开通9200端口防火墙
执行如下命令开通9200端口防火墙
代码语言:javascript复制# 开放9200端口用于http通信
firewall-cmd --zone=public --add-port=9200/tcp --permanent
# 开放9300端口用于ES集群间通信
firewall-cmd --zone=public --add-port=9300/tcp --permanent
# 重新加载防火墙使开放的端口即时生效
firewall-cmd --reload
# 查看开放的公共端口列表
firewall-cmd --zone=public --list-ports
同时需要登录云服务器控制台通过【服务器详情】-> 【防火墙】菜单下点击【添加规则】,在弹出的对话框中分别添加9200和9300端口,如下所示:
这里笔者一并加入了Kibana的5601端口规则
验证安装结果
在浏览器地址栏中输入URL:http://<你的云服务器公网IP地址>:9200/
返回如下结果表示Docker安装和运行ElasticSearch服务成功
代码语言:javascript复制{
"name" : "1193428353da",
"cluster_name" : "docker-cluster",
"cluster_uuid" : "9iSQFg-BT5KLZlLnZhvSeQ",
"version" : {
"number" : "7.12.1",
"build_flavor" : "default",
"build_type" : "docker",
"build_hash" : "3186837139b9c6b6d23c3200870651f10d3343b7",
"build_date" : "2021-04-20T20:56:39.040728659Z",
"build_snapshot" : false,
"lucene_version" : "8.8.0",
"minimum_wire_compatibility_version" : "6.8.0",
"minimum_index_compatibility_version" : "6.0.0-beta1"
},
"tagline" : "You Know, for Search"
}
可以看到7.12版本的ES对应的lucene引擎已经到了8.8.0版本,可见ES的升级也是非常快的,最新的ES已经来到8以上版本。
4. 部署Kibana
Kibana
使操作ES数据的可视化界面,使用Kibana
操作ES非常方便。
在/usr/local目录执行如下docker命令
代码语言:javascript复制docker run -d
--name kibana
-e ELASTICSEARCH_HOSTS=http://es:9200
--network=es-net
-p 5601:5601
kibana:7.12.1
--network es-net
:加入一个名为es-net的网络中,与elasticsearch在同一个网络中-e ELASTICSEARCH_HOSTS=http://es:9200"
:设置elasticsearch的地址,因为kibana已经与elasticsearch在一个网络,因此可以用容器名直接访问elasticsearch-p 5601:5601
:端口映射配置
kibana启动一般比较慢,需要多等待一会,可以通过命令:
代码语言:javascript复制docker logs -f kibana
也可以通过浏览器访问:http://<你的云服务器公网IP地址>:5601/app/home#/
kibana Home界面右上角中提供了一个DevTools操作按钮,点击该按钮即可进入如下所示的开发操作界面:
在左边的控制台输入框中输入如下命令,然后点击右上角的三角形按钮执行请求即可在右边的界面看到查询结果。
代码语言:javascript复制GET _search
{
"query": {
"match_all": {
}
}
}
这个界面中可以编写DSL来操作elasticsearch,并且对DSL语句有自动补全功能。从查询结果来看,ES创建的同时就已经自动创建了很多个文档集合,如:.kibana-event-log-7.12.1-000001和.kibana_7.12.1_001等。
5 安装IK分词器
进入容器内部
代码语言:javascript复制docker exec -it es bash
进入bin目录
代码语言:javascript复制cd /usr/share/elasticsearch/bin
在线下载并安装
代码语言:javascript复制./elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.12.1/elasticsearch-analysis-ik-7.12.1.zip
退出
代码语言:javascript复制exit
重启容器
代码语言:javascript复制docker restart es
K分词器包含两种模式:
- ik_smart:最少切分
- ik_max_word:最细切分
在左边的控制台输入框中输入如下中文分词请求:
代码语言:javascript复制GET _analyze
{
"analyzer": "ik_smart",
"text": "程序员青年阿福2023年发表的文章集合"
}
然后点击右边的执行请求按钮,可以看到右边的结果窗口返回如下结果
代码语言:javascript复制{
"tokens" : [
{
"token" : "程序员",
"start_offset" : 0,
"end_offset" : 3,
"type" : "CN_WORD",
"position" : 0
},
{
"token" : "青年",
"start_offset" : 3,
"end_offset" : 5,
"type" : "CN_WORD",
"position" : 1
},
{
"token" : "阿福",
"start_offset" : 5,
"end_offset" : 7,
"type" : "CN_WORD",
"position" : 2
},
{
"token" : "2023年",
"start_offset" : 7,
"end_offset" : 12,
"type" : "TYPE_CQUAN",
"position" : 3
},
{
"token" : "发表",
"start_offset" : 12,
"end_offset" : 14,
"type" : "CN_WORD",
"position" : 4
},
{
"token" : "的",
"start_offset" : 14,
"end_offset" : 15,
"type" : "CN_CHAR",
"position" : 5
},
{
"token" : "文章",
"start_offset" : 15,
"end_offset" : 17,
"type" : "CN_WORD",
"position" : 6
},
{
"token" : "集合",
"start_offset" : 17,
"end_offset" : 19,
"type" : "CN_WORD",
"position" : 7
}
]
}
可以看到一句中文"程序员青年阿福2023年发表的文章集合"被ik_smart类型的中文分词器拆分成了7个token对象,每个token对象包含了token、start_offset(开始位移)、end_offset(结束位移)、type(类型)和position(位置)等5个字段。
结束语
本文详细演示了使用docker容器安装7.12版本的ES和Kibana及中文分词器,为我们深入学习ES分布式搜索引擎数据库打个入门的基础,后面笔者会结合项目经验连续写几篇深入学习ES技术的文章,敬请期待!