码迷,mamicode.com
首页 > 其他好文 > 详细

ElasticSearch基本查询

时间:2017-08-31 14:32:53      阅读:172      评论:0      收藏:0      [点我收藏+]

标签:cat   values   必须   构建   pos   逻辑运算   查找   multi   position   

词条查询 
这是一个简单查询。它仅 匹配给定字段中包含该词条的稳定,且是2未经分析的确切的词条。 

“query” :{ 
“term”:{ 
“title”:”crime” 



多词条查询 
匹配内容中包含某些词条的文档。 

“query” :{ 
“terms::{ 
“tags”:[“novel”,”book”], 
“minimum_match”:”2”//至少n个匹配 



mathc_all 
匹配索引中的所有文件

常用词查询
    这是在没有使用停用词的情况下,为了提高准确性和相关性而提供的一个解决方案
    该查询会将词组分成高频和低频两组,使用低频查询并计算分数。然后用高频词组查询但不计算分数。
match查询
    该查询讲query参数中的值拿出来加以分析,然后构建相应的查询

    布尔值查匹配查询
        {
            "query":{
                "match":{
                    "title":{
                        "query" :"crime and punishment",
                        "operator":"and"   -- 连接创建布尔条件的运算符默认or
                        "analyzer" :"",    -- 分析器的名字
                        "fuzziness":"",    -- 构建模糊查询
                        "prefix_length",   -- 控制模糊查询的行为
                        "max_expansions",  -- 同上
                        "zero_terms_query" -- 指定当所有的词条都被分析器移除时,查询的行为。可以为all或者none。默认后者
                                    不反悔或者返回所有文档
                        "cutoff_frequency" -- 将查询分解成两组,一组高频一组低频
                    }
                }
            }
        }
    mathc_phrase查询
        从分析后的文本中构建短语查询
            {
            "query":{
                "mathc_phrase" :{
                    "title" :{
                        "query":"crime and punishment",
                        "slop":"1"                    -- 一个整数值,构建短语时,中间允许的未知词条数。默认为0
                        "analyzer":""                 -- 分析时用到的分析器
                    }
                }
            }
        }


    match_phrase_prefix查询
        和上类似,增加了两个参数
        {
            "query":{
                "mathc_phrase" :{
                    "title" :{
                        "query":"crime and punish",   -- 允许最后一个字条只做前缀匹配
                        "slop":"1"                    -- 一个整数值,构建短语时,中间允许的未知词条数。默认为0
                        "analyzer":""                 -- 分析时用到的分析器
                        "max_expansitions" :"20"      -- 控制多少前缀将被重写成最后的词条。?????
                    }
                }
            }
        }

multi_match
    针对多个字段尽心查询
    {
        "query" :{
            "multi_match":{
                "query":"crime and punishment",
                "fileds":["title","otitle"],
                "use_dis_max":""                  --定义一个布尔值,true时使用析取最大分数查询-默认。false使用不二查询
                "tie_breaker":""                  -- 在use_dis_max时使用,指定低分数和最高分数之间的平衡          
            }
        }
    }


query_String
    本查询支持全部的lucene语法
    A{
        "query":{
            "query_string":{
                "query":" title:crime^10 + title:punishment -otitle:cat +author:(+Fyodor +dostoevsky)",
                "default_field":"title"                    --指定默认的查询字段。默认为all,由index.query.default_field指定
                "allow_lending_wildcard"                   --指定是否允许通配符作为词条的第一个字符,默认true
                "default_operator"  :""                    --逻辑运算符or and 默认or
                "lowercase_extend_terms":""                --查询重写是否把词条变成小写,默认为true,意味重写后的词条讲小写
                "enable_position_increments":""            --指定查询结果中的位置增量是否打开,默认true
                "fuzzy_max_expansions":"    "              --使用模糊查询时,此参数指定模糊查询可被扩展到的最大词条数,默认50
                "fuzzy_prefix_length" :                    --指定生成的模糊查询中的前缀的长度。默认0
                "fuzzy_min_sim" :                          --此参数指定模糊查询的最小相似度,默认0.5
                "phrase_slop" :""              --指定参数溢出值,默认0.
                "analyze_wildcard":""                      --指定是否应该分析通配符查询生成的词条,默认false
                "auto_generate_phrase_queries":""          --指定是否自动生成短语查询,默认为false。
                "minimum_should_match" :                   --控制有多少生成Boolean should子句必须与文档词条匹配,才能认为是匹配。
                                        可以使百分比,也可以是整数值-个
                "lenient":" "              --格式方面的失败是否忽略。
            }
        }
    }
    针对多字段的query_string
            {
                "query_string":{
                    "query":""
                    "fields"[title,otitle]
                }
            }
simple_query_string:
    查询使用lucene最新查询解析器之一:SImpleQueryParser
标识符查询
    仅使用提供的标识符来过滤返回的文档。其针对内部的_uid字段运行,所以不需要启用_id字段
    {
        ”query“:{
            "ids":{
                "type":"book"
                "values":["10","11"]
            }
        }
    }
前缀查询
    t他们指定字段以给定的前缀开始的文档
    {
    ”query":{
        "prefix":{
            "title":"cri"
        }
    }
    }
fuzzy_like_this查询
    类似more_like_this查询。
    它查找所有与提供的文本类似的文档,与more不同的是,它利用模糊字符串并选择生成的最佳差分词条
    {
        "qury":{
            "fuzzy_like_this":{
                "fields":[],
                "like_text":""
                "ignore_tf:false        --指定在相似度计算期间,是否忽略词频。
                "max_query_terms"       --指定生成的查询中能包括的最大查询词条书,默认25
                "min_similarity"        --指定差分词条应该有的最小相似性。默认0.5
                "prefix_length"         --指定查分词条的公共前缀长度,默认为0
                ”boost"
                "analyzer
            }
        }
    }
fuzzy_like_this_field查询
    和上类似,但是只针对单个字段
fuzzy查询
    是第三种模糊查询类型,它基于编辑距离算法类匹配文档。很占用CPU
通配符查询
    在查询中使用*和?等通配符。
more_like_this查询
    {
        “query":{
            "more_like_this":{
                "fields" "[],
                "like_text":""
                "min_term_freq" :              --最低词频,低于将忽略
                "percent_terms_to_match"       --百分比,高于才会被认为是类似的
                "max_query_terms"              --指定生成的查询中能包括的最大查询词条数,默认25
                "stop_words"                   --
                "min_doc_freq"                 --包含我能当的最小数目,低于次数目,该词条将被忽略,默认5
                "max_doc_freq"
                "min_word_len"                 --单词的最小长度,低于将被忽略
                ”boost_terms"
                "boost"
                "analyzer"

                }
        }
    }
more_like_this_field查询
    针对单个字段
范围查询
    gte:>=
    gt: >
    lte:<=
    lt:<
最大分值查询
    他会生成一个由所有子查询返回的文档组成的并集并将他返回。,这样我们可以控制较低得分的子查询对文档最后得分的影响
    最后得分的计算:
        最高分数的子查询的得分之和,奖赏其余子查询的得分之和乘以tie参数的值
正则表达式查询
    支持正则
复合查询

    布尔查询
        should
        must
        must_not
        minimum_should_match:
    加权查询
        封装了两个查询,并且降低其中一个查询返回文档的得分。其由三个节点必须定义
            positive: 包含所返回文档得分不会被改变的查询
            negative: 得分将被降低
            negtive_boost 降低negative部分查询得分的加权值
    constant_score查询
        其封装了另一个查询或过滤,并为每一个所封装查询返回的文档返回一个常量得分
    索引查询
        {
            "query":{
                "indices::{
                    "indices":[‘library‘],--library索引上查询
                    "query" :{
                        "term":{
                            "title":"crime"
                            }
                    },
                    "no_match_query":{--其他索引上查询
                        "term":{
                            "user":"crime"
                        }
                    }
                }
            }
            }

ElasticSearch基本查询

标签:cat   values   必须   构建   pos   逻辑运算   查找   multi   position   

原文地址:http://www.cnblogs.com/a-du/p/7457792.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!