es fielddata理解

时间：2018-12-30 13:57:07 阅读：747 评论：0 收藏：0 [点我收藏+]

　　在es中，text类型的字段使用一种叫做fielddata的查询时内存数据结构。当字段被排序，聚合或者通过脚本访问时这种数据结构会被创建。它是通过从磁盘读取每个段的整个反向索引来构建的，然后存存储在java的堆内存中。

　　fileddata默认是不开启的。Fielddata可能会消耗大量的堆空间，尤其是在加载高基数文本字段时。一旦fielddata已加载到堆中，它将在该段的生命周期内保留。此外，加载fielddata是一个昂贵的过程，可能会导致用户遇到延迟命中。这就是默认情况下禁用fielddata的原因。如果尝试对文本字段进行排序，聚合或脚本访问，将看到以下异常：

　　“Fielddata is disabled on text fields by default. Set fielddata=true on [your_field_name] in order to load fielddata in memory by uninverting the inverted index. Note that this can however use significant memory.”

　　在启用fielddata之前，请考虑使用文本字段进行聚合，排序或脚本的原因。这样做通常没有意义。text字段在索引例如New York这样的词会被分词，会被拆成new，york。在此字段上面来一个terms的聚合会返回一个new的bucket和一个york的bucket，当你想只返回一个New York的bucket的时候就会出现问题。在kibana中执行如下的命令即可：

PUT my_index
{
  "mappings": {
    "_doc": {
      "properties": {
        "my_field": { 
          "type": "text",
          "fields": {
            "keyword": { 
              "type": "keyword"
            }
          }
        }
      }
    }
  }
}

然后使用my_field字段进行搜索。使用my_field.keyword字段进行聚合，排序或脚本。

可以使用PUT映射API在现有文本字段上启用fielddata，如下所示：

PUT my_index/_mapping/_doc
{
  "properties": {
    "my_field": { 
      "type":     "text",
      "fielddata": true
    }
  }
}

为my_field指定的映射应包含该字段的现有映射以及fielddata参数。

es fielddata理解

标签：memory bsp 分词加载映射 iba 生命周期用户 put

原文地址：https://www.cnblogs.com/chenmz1995/p/10198967.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行