【全文检索_06】Elasticsearch 基本使用 ㈡

2021-02-02 15:38:54 浏览数 (1)

1.1 简单搜索

1.1.1 全文档检索

  在 MySQL 中查询所有数据使用 SELECT * FROM table,在 Elasticsearch 中我们使用 GET 索引/_search 来查询所有数据。响应内容不仅会告诉我们哪些文档被匹配到,而且这些文档完整的内容也包含在其中。

1.1.2 简单 query

  在 MySQL 中进行简单的条件查询使用关键字 WHERE,在 Elasticsearch 中我们使用 GET 索引/_search?q=filed:value 来查询。如下图所示,我们查询 author:唐 没有查出结果,而查询 author:唐家三少 查出了结果。这时为什么呢?我们知道 ES 是倒排索引,如果没有找到 就没有结果,那么是不是 author Field 域没有分词或者没有分出 这个词。

  我们先来看一下这个索引中的数据类型,author 是 keyword 类型的,我们知道 keyword 类型的不会被分词,只能作为一个整体查询。所以我们猜测 author 没有被分词是正确的是正确的。

  我们再来看看 title 这个数据类型可是 text,是会被分词的。如下图所示,我们明明查询的是 title:斗罗 为什么 斗破苍穹 中没有 斗罗 也会被查出来。这是因为我们没有指定 title 的分词器,它就是用了默认的分词器,在查询时,会按照存储时的规则来。所以查询 title:斗罗 时会拆分为 斗、罗 两个字去查询。

1.2 复杂搜索

1.2.1 字段全值检索

  全值检索使用 term 具体语法如下图所示,我们查询 title:斗罗,但是结果为空。不对啊?我们之前查询是有两条结果的呀!顾名思义,全值检索,就是将关键字作为一个词,不分词的去查询,而 title 使用的是默认分词器,被拆分为只有一个字的 term,所以无法匹配。

1.2.2 字段分词检索

1.2.3 字段模糊检索

  模糊检索使用 fuzzy 具体语法如下图所示,需要注意的是该关键字会被当作一个整体去匹配 term,不会被分词(不论添加时该 Field 是否分词)。同时根据 term 的长度,被模糊的程度也有相应的限制,不可能四个字只有一个字对也能查出来。

1.2.4 结果过滤

  如上图所示,就可以显示需要的 field,但是,其实我们这里省略了包含属性 includes,完整的写法如下图所示。那么,有包含肯定有排除,不然需要显示的 field 有 99%,不需要显示的 field 只有 1%,岂不是要疯。排除使用 excludes

1.2.5 排序

  如下图所示,我们可以指定按照那个 field 升序或降序排序,默认是根据匹配度 _score 分值降序排列的。

1.2.6 分页

1.3 多条件查询

1.3.1 AND

1.3.2 OR

1.3.3 NOT

1.3.4 条件区间

1.4 高亮

1.4.1 默认高亮

1.4.2 自定义高亮

0 人点赞