Elasticsearch:Elasticsearch 中的数据强制匹配

2021-01-08 16:12:00 浏览数 (1)

腾讯云 Elasticsearch Service】高可用,可伸缩,云端全托管。集成X-Pack高级特性,适用日志分析/企业搜索/BI分析等场景


在实际的使用中,数据并不总是干净的。 根据产生方式的不同,数字可能会在 JSON 主体中呈现为真实的 JSON 数字,例如 5,但也可能呈现为字符串,例如 “5”。 或者,应将应为整数的数字呈现为浮点数,例如 5.0,甚至是 “5.0”。

coerce 尝试清除不匹配的数值以适配字段的数据类型。 例如:

  • 字符串将被强制转换为数字,比如 "5" 转换为整型数值5
  • 浮点将被截断为整数值,比如 5.0 转换为整型值5

例如:

代码语言:javascript复制
PUT my_index{  "mappings": {    "properties": {      "number_one": {        "type": "integer"      },      "number_two": {        "type": "integer",        "coerce": false      }    }  }} PUT my_index/_doc/1{  "number_one": "10" } PUT my_index/_doc/2{  "number_two": "10" }

在上面的例子中,我们定义 number_one 为 integer 数据类型,但是它没有属性 coerce 为 false,那么当我们把 number_one 赋值为"10",也就是一个字符串,那么它自动将"10"转换为整型值10。针对第二字段 number_two,它同样被定义为证型值,但是它同时也设置 coerce 为 false,也就是说当字段的值不匹配的时候,就会出现错误。

运行上面的结果是:

  • number_one 字段将包含整数10。
  • 由于禁用了强制,因此该文档将被拒绝

Index 级默认设置

可以在索引级别上设置 index.mapping.coerce 设置,以在所有映射类型中全局禁用强制:

代码语言:javascript复制
PUT my_index{  "settings": {    "index.mapping.coerce": false  },  "mappings": {    "properties": {      "number_one": {        "type": "integer",        "coerce": true      },      "number_two": {        "type": "integer"      }    }  }} PUT my_index/_doc/1{ "number_one": "10" }  PUT my_index/_doc/2{ "number_two": "10" } 

上面的运行结果是:

  • number_one 字段将覆盖索引级别设置以启用强制。该文档将被接受
  • 该文档将被拒绝,因为 number_two 继承了索引级强制设置。

参考:

【1】https://www.elastic.co/guide/en/elasticsearch/reference/current/coerce.html#coerce


最新活动

包含文章发布时段最新活动,前往ES产品介绍页,可查找ES当前活动统一入口

Elasticsearch Service自建迁移特惠政策>>

Elasticsearch Service 新用户特惠狂欢,最低4折首购优惠 >>

Elasticsearch Service 企业首购特惠,助力企业复工复产>>

关注“腾讯云大数据”公众号,技术交流、最新活动、服务专享一站Get~

0 人点赞