码迷,mamicode.com
首页 > 其他好文 > 详细

multi_match 的 minimum_should_match

时间:2019-09-23 12:12:48      阅读:66      评论:0      收藏:0      [点我收藏+]

标签:title   word   match   code   个数   数值   token   col   off   

 

minimum_should_match 只能用在multi_match

可以这样写:

{
  "query": {
        "multi_match": {
          "query":"徐峥沈腾黄渤吃火锅",
          "fields":["title"],
          "minimum_should_match":4
        }
    }
}

表示命中4个词的文档才会返回

也可以这样写:

{
  "query": {
        "multi_match": {
          "query":"徐峥沈腾黄渤吃火锅",
          "fields":["title"],
          "minimum_should_match":"80%"
        }
    }
}

这里的80%是指query的分词个数的80%

我们调一下分词接口,看结果:

{
    "tokens": [
        {
            "token": "徐峥",
            "start_offset": 0,
            "end_offset": 2,
            "type": "CN_WORD",
            "position": 0
        },
        {
            "token": "沈腾",
            "start_offset": 2,
            "end_offset": 4,
            "type": "CN_WORD",
            "position": 1
        },
        {
            "token": "黄渤",
            "start_offset": 4,
            "end_offset": 6,
            "type": "CN_WORD",
            "position": 2
        },
        {
            "token": "吃火锅",
            "start_offset": 6,
            "end_offset": 9,
            "type": "CN_WORD",
            "position": 3
        }
    ]
}

query被分成了4个词,所以minimum_should_match:"80%" 在这里等于 minimum_should_match:4*0.8

还要注意下,这里的小数值会向下取整,也就是命中3个词的就会返回。

 

multi_match 的 minimum_should_match

标签:title   word   match   code   个数   数值   token   col   off   

原文地址:https://www.cnblogs.com/feng07/p/11571152.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!