标签:方式 特定 cpp agg lock ext 文档 ber percent
ES中的聚合被分为两大类:Metric度量和bucket桶(原谅我英语差,找不到合适的词语.....就用单词来说吧!)。说的通俗点,metric很像SQL中的avg、max、min
等方法,而bucket就有点类似group by
了。
metric的聚合按照值的返回类型可以分为两种:单值聚合 和 多值聚合。
这个聚合返回的是单个值,dsl可以参考如下:
"aggs" : {
"intraday_return" : { "sum" : { "field" : "change" } }
}
返回的是change字段的和:
{
...
"aggregations": {
"intraday_return": {
"value": 2.18
}
}
}
其中intraday_return是聚合的名字,同时也会作为请求返回的id值。另外,聚合中是支持脚本的,这里就不过多赘述了,详细参考官方文档即可。
{
"aggs" : {
"min_price" : { "min" : { "field" : "price" } }
}
}
{
"aggs" : {
"max_price" : { "max" : { "field" : "price" } }
}
}
{
"aggs" : {
"avg_grade" : { "avg" : { "field" : "grade" } }
}
}
{
"aggs" : {
"author_count" : {
"cardinality" : {
"field" : "author"
}
}
}
}
{
"aggs" : {
"load_time_outlier" : {
"percentile_ranks" : {
"field" : "load_time",
"values" : [15, 30]
}
}
}
}
返回的结果包含多个值:
{
...
"aggregations": {
"load_time_outlier": {
"values" : {
"15": 92,
"30": 100
}
}
}
}
{
"aggs" : {
"grades_stats" : { "stats" : { "field" : "grade" } }
}
}
请求后会直接显示多种聚合结果:
{
...
"aggregations": {
"grades_stats": {
"count": 6,
"min": 60,
"max": 98,
"avg": 78.5,
"sum": 471
}
}
}
{
"aggs" : {
"grades_stats" : { "extended_stats" : { "field" : "grade" } }
}
}
在统计的基础上还增加了多种复杂的统计信息:
{
...
"aggregations": {
"grade_stats": {
"count": 9,
"min": 72,
"max": 99,
"avg": 86,
"sum": 774,
"sum_of_squares": 67028,
"variance": 51.55555555555556,
"std_deviation": 7.180219742846005,
"std_deviation_bounds": {
"upper": 100.36043948569201,
"lower": 71.63956051430799
}
}
}
}
上面并没有列举全面,比如2.0版本的ES,还支持多值的percentile Rank百分比排名,Geo Bounds地理位置信息,Scripted Metric脚本;单值的top hits等等。
很多内容还需要在实践中使用,才能了解它的优势。
标签:方式 特定 cpp agg lock ext 文档 ber percent
原文地址:http://www.cnblogs.com/zknublx/p/7279325.html