码迷,mamicode.com
首页 > 其他好文 > 详细

es中的分片查询方式

时间:2015-05-29 18:30:50      阅读:153      评论:0      收藏:0      [点我收藏+]

标签:es   hadoop   超人学院   

Es查询的时候默认是随机从一些分片中查询数据,可以通过配置让es从某些分片中查询数据

1:_local

指查询操作会优先在本地节点有的分片中查询,没有的话再在其它节点查询。

技术分享 

2:_primary:指查询只在主分片中查询

技术分享

3:_primary_first:指查询会先在主分片中查询,如果主分片找不到(挂了),就会在副本中查询。

技术分享

4:_only_node:指在指定id的节点里面进行查询,如果该节点只有要查询索引的部分分片,就只在这部分分片中查找,所以查询结果可能不完整。如_only_node:123在节点id为123的节点中查询。

技术分享

5:_prefer_node:nodeid 优先在指定的节点上执行查询

技术分享

6:Custom (string) value:随机指定一个值就可以。

技术分享

7:_shards:0,1,2,3,4:查询指定分片的数据

技术分享

8:自定义:_only_nodes:nodeid1,nodeid2,nodeid3根据多个节点进行查询

Es默认没有提供这种查询方式,所以就只能修改源码了。

首先找到org.elasticsearch.cluster.routing.operation.plain.PlainOperationRouting这个类,es搜索时获取分片信息是通过这个类的。它的preferenceActiveShardIterator()方法就是根据条件来找出响应的分片。

技术分享



看源码可知其主要是根据preference这个参数来决定取出的分片的。如果没有指定该参数,就随机抽取分片进行搜索。


下面的代码就是根据上面说的不同情况进行的一些判断,使用的switch case语句。

在里面多增加一项ONLY_NODES,这个可以接收多个节点id,这个参数需要配置到preference枚举类中,还要在这个类中的switch判断中判断参数_only_nodes。添加case语句。

技术分享


技术分享




技术分享




接下来就需要完善PlainOperationRouting类中的case语句判断逻辑了。

首先获取传递过来的所有节点id,以逗号分割。获取一个节点id的数组,下面循环判断传递的节点是否存在,如果不存在就抛异常。

下面就返回一个方法的返回值,这个方法是需要我们自己实现的,这个方法可以参考上面的onlyNodeActiveInitializingShardsIt这个方法。

技术分享


接下来完善onlyNodesActiveShardsIt这个方法,

技术分享 


这样的话就可以从用户指定的多个节点中获取数据。

把项目重新打包,放到服务器上重新启动。

更多精彩内容请关注:http://bbs.superwu.cn

关注超人学院微信二维码:技术分享

关注超人学院java免费学习交流群:技术分享


es中的分片查询方式

标签:es   hadoop   超人学院   

原文地址:http://crxy2013.blog.51cto.com/9922445/1656410

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!