Elasticsearch是一个搜索引擎,建立在Lucene之上 集群 (cluster) 节点(node) 索引(index) 分片(shards) 副本(replicas) recovery river gateway discovery.zen Transport 索引(Index) 文档(D ...
分类:
编程语言 时间:
2018-01-01 20:44:40
阅读次数:
540
一、Elasticsearch对复杂分布式机制透明的隐藏特性 1、分片机制: (1)index包含多个shard,每个shard都是一个最小工作单元,承载部分数据,lucene实例,完整的建立索引和处理请求的能力 (2)shard分为:primary shard和replica shard。 pri... ...
分类:
其他好文 时间:
2017-12-30 18:18:09
阅读次数:
104
一、核心概念 1、近实时(Near Realtime NRT) (1)从写入数据到数据可以被搜索到有一个小延迟(大概1秒); (2)基于es执行搜索和分析可以达到秒级 2、集群(Cluster)一个集群下有多个节点。集群名称,默认是elasticsearch 3、节点(Node)集群中的一个节点,节... ...
分类:
其他好文 时间:
2017-12-30 18:11:01
阅读次数:
202
其实完全版的管理,在web页面上就有。 同时,在官网文档上,也有:https://lucene.apache.org/solr/guide/6_6/coreadmin-api.html#CoreAdminAPI-Input.3 记录一下自己常用到的,不定期更新吧。 admin/cores?actio ...
分类:
其他好文 时间:
2017-12-29 10:16:23
阅读次数:
155
一. 问题: 在使用solr时, 分词器解析中文的时候, 是一个一个字解析的. 这并不是我们想要的结果. 而在lucene中, 使用的中文分词器是 IKAnalyzer. 那么在solr里面, 是不是任然可以用这个呢. 二. 整合 ik 1. 修改schema配置文件 打开如下路径中的managed ...
分类:
其他好文 时间:
2017-12-27 23:54:07
阅读次数:
210
lucene初探, 是为了后面solr做准备的. 如果跳过lucene, 直接去看solr, 估计有点懵. 由于时间的关系, lucene查询方法也有多个, 所以单独出来. 一. 精确查询 在查询的时候, 新建一个Term对象, 进去精确匹配. 前一篇提到过, 经过分词器分下来的每一个词或者一段话, ...
分类:
Web程序 时间:
2017-12-27 22:40:22
阅读次数:
262
lucene初探, 是为了后面solr做准备的. 如果跳过lucene, 直接去看solr, 估计有点懵. 由于时间的关系, lucene查询方法也有多个, 所以单独出来. 一. 精确查询 在查询的时候, 新建一个Term对象, 进去精确匹配. 前一篇提到过, 经过分词器分下来的每一个词或者一段话, ...
分类:
Web程序 时间:
2017-12-27 20:26:12
阅读次数:
207
前面 lucene 初探 都是为了solr打基础的. 虽然lucene 的filter 没有涉及, 但是打基础, 差不多够用了. 一. solr 和 lucene 的区别 这里我就用自己的理解来说了, 可能不全, 但是应该够用了, 网上能搜到官方一点的. 首先, solr 是基于 lucene的. ...
分类:
其他好文 时间:
2017-12-27 20:22:58
阅读次数:
142
上面的查询匹配就会进行分词,比如"宝马多少马力"会被分词为"宝马 多少 马力", 所有有关"宝马 多少 马力", 那么所有包含这三个词中的一个或多个的文档就会被搜索出来。并且根据lucene的评分机制(TF/IDF)来进行评分。 { "query_string":{ "default_field": ...
前言:目前自己在做使用Lucene.net和PanGu分词实现全文检索的工作,不过自己是把别人做好的项目进行迁移。因为项目整体要迁移到ASP.NET Core 2.0版本,而Lucene使用的版本是3.6.0 ,PanGu分词也是对应Lucene3.6.0版本的。不过好在Lucene.net 已经有 ...
分类:
Web程序 时间:
2017-12-26 17:47:03
阅读次数:
525