1.获取基本信息
用于获取 Elasticsearch 集群的根节点信息。这个请求通常用于检查 Elasticsearch 服务是否正常运行,以及获取一些基本的状态信息。
代码语言:apl复制get /
- 名称:集群的名称。
- 集群 UUID:集群的唯一标识符。
- 版本:Elasticsearch 服务的版本号。
- 标签:集群的标签信息,如果有的话。
- HTTP 地址:集群可以访问的 HTTP 地址列表。
- 构建:关于 Elasticsearch 构建的详细信息,包括构建哈希、构建日期等。
{
"name": "node-1",
"cluster_name": "my-application",
"cluster_uuid": "gmjBLVYEQFO6ZR2bveXFig",
"version": {
"number": "7.12.0",
"build_flavor": "default",
"build_type": "tar",
"build_hash": "78722783c38caa25a70982b5b042074cde5d3b3a",
"build_date": "2021-03-18T06:17:15.410153305Z",
"build_snapshot": false,
"lucene_version": "8.8.0",
"minimum_wire_compatibility_version": "6.8.0",
"minimum_index_compatibility_version": "6.0.0-beta1"
},
"tagline": "You Know, for Search"
}
2._cluster 获取 health
代码语言:apl复制GET /_cluster/health
解释:Status:集群状态。
- Green 所有分片可用。
- Yellow 所有主分片可用。
- Red 主分片不可用,集群不可用。
{
"cluster_name": "my-application",
"status": "yellow",
"timed_out": false,
"number_of_nodes": 1,
"number_of_data_nodes": 1,
"active_primary_shards": 8,
"active_shards": 8,
"relocating_shards": 0,
"initializing_shards": 0,
"unassigned_shards": 1,
"delayed_unassigned_shards": 0,
"number_of_pending_tasks": 0,
"number_of_in_flight_fetch": 0,
"task_max_waiting_in_queue_millis": 0,
"active_shards_percent_as_number": 88.88888888888889
}
3._cat 获取 health
代码语言:apl复制GET /_cat/health?v
- green:每个索引的 primary shard 和 replica shard 都是 active 状态的.
- yellow:每个索引的 primary shard 都是 active 状态的,但是部分 replica shard 不是 active 状态,处于不可用的状态
- red:不是所有索引的 primary shard 都是 active 状态的,部分索引有数据丢失了
4.命令区别
GET /_cluster/health 和 GET /_cat/health?v 区别
GET /_cluster/health
和 GET /_cat/health?v
都是用于获取 Elasticsearch 集群健康状态的 API,但它们有一些区别:
- 用途:
_cluster/health
:这是一个监控集群整体健康状态的 API,它可以提供集群级别的健康状态,包括索引的健康状态。它通常用于自动化脚本和应用程序中。_cat/health?v
:这是一个用于人类阅读的 API,它提供了易于阅读的表格格式输出,通常用于命令行或 Kibana 控制台中快速检查集群状态。
- 输出格式:
_cluster/health
:返回 JSON 格式的数据,适合程序解析和自动化处理。_cat/health?v
:返回纯文本格式的数据,包含列标题,更易于人类阅读。
- 功能:
_cluster/health
:除了提供集群健康状态,还可以等待直到集群达到期望的健康状态,并且可以指定返回分片级别的健康信息。_cat/health?v
:提供了集群健康状态的快照,包括节点总数、数据节点数、分片数等信息,但不提供等待功能。
- 参数:
_cluster/health
:支持多个参数,如wait_for_status
、timeout
、level
等,可以细化请求和控制返回的信息。_cat/health?v
:参数较少,v
参数用于显示列标题,ts
参数用于控制是否显示时间戳。
- 适用场景:
_cluster/health
:适合用于应用程序和自动化脚本中,需要详细和程序可操作的数据。_cat/health?v
:适合用于快速检查和监控集群状态,以及在命令行界面中进行故障排除。
5.查看索引
代码语言:apl复制GET /_cat/indices?v
6.主键 id
手动 id
文档的 ID 被指定为 2
。
当这个请求被发送到 Elasticsearch 服务器后,服务器会处理这个请求,将提供的 JSON 数据存储在指定的索引和文档 ID 下。如果索引 book
不存在,Elasticsearch 会根据默认设置创建它。如果文档 ID 2
已经存在,则该文档将被更新;如果不存在,将创建一个新的文档。
PUT /book/2
{
"id":1,
"title":"这是一11文章",
"content":"xxxxx",
"comment":"备注信息",
"mobile":"13344556677"
}
自动 id
POST /book/
{
"id":1,
"title":"这是一11文章",
"content":"xxxxx",
"comment":"备注信息",
"mobile":"13344556677"
}
自动id特点:
长度为 20 个字符,URL 安全,base64 编码,GUID,分布式生成不冲突
{
"_index": "book",
"_type": "_doc",
"_id": "Qk9rAIgBMxAD_MReKtAQ",
"_version": 1,
"result": "created",
"_shards": {
"total": 2,
"successful": 1,
"failed": 0
},
"_seq_no": 8,
"_primary_term": 1
}
Elasticsearch是一个基于Apache Lucene的开源搜索引擎,它提供了分布式、多租户的搜索服务及数据分析功能。Elasticsearch的架构是面向文档的,它将所有数据存储为JSON文档,每个文档都有唯一的ID,而且处理结构化和非结构化数据非常容易。它使用诸如分片、副本、修订等技术来确保存储方案具备可靠性、高可用性和可伸缩性。Elasticsearch采用基于RESTful API(HTTP)的接口,提供非常完善的查询语句;同时还支持实时字段计算、聚合分析、搜索建议、中文分词以及Geo查询等复杂操作。
Elasticsearch的主要优点包括:
- 分布式设计:Elasticsearch天然支持分布式,可以很容易地横向扩容,处理PB级结构化或非结构化数据。
- 高效的搜索能力:Elasticsearch提供了全文搜索功能,支持模糊查询、前缀查询、通配符查询等,并且具有强大的聚合分析功能。
- 快速的查询速度:Elasticsearch的底层使用Lucene作为搜索引擎,并在此之上做了多重优化,保证了用户对数据查询的需求。
- 易用性:Elasticsearch提供了简单的RESTful API,天生的兼容多语言开发,上手容易,开箱即用。
- 丰富的生态圈:Elasticsearch有丰富的插件和工具,如Logstash、Kibana、Beats等,形成了强大的Elastic Stack生态。
Elasticsearch的使用场景包括:
- 应用搜索:为网站或应用程序提供搜索功能,如电商、社交媒体等。
- 日志记录和日志分析:收集、存储和分析服务器日志、应用日志等。
- 基础设施监控:监控服务器、网络设备等基础设施的性能指标。
- 安全分析:分析安全日志,进行入侵检测和威胁分析。
- 地理位置数据分析:处理地理空间数据,提供地理位置搜索服务。
- 商业智能:对商业数据进行分析,提供决策支持。
Elasticsearch的引入主要是为了应对大数据环境下的海量数据检索和实时分析需求,它通过分布式架构和高效的索引机制,提供了快速的搜索和分析能力。然而,Elasticsearch也存在一些潜在风险,如响应时间问题和任务恢复延迟等,需要通过优化配置和维护来降低这些风险的影响。