前言 至于为什么要用solr5.5,因为最新的6.10,没有中文的分词器支持,这里使用的是ik分词器,刚好支持到5.5 ik分词器下载地址 :https://github.com/EugenePig/ik-analyzer-solr5 , 下载完之后使用maven命令, mvn package 即可 ...
分类:
其他好文 时间:
2019-07-19 21:03:56
阅读次数:
103
一、Elasticsearch单机安装 1.将es安装包传到服务器上 这是安装包 这里我是用的是WinSCP上传工具,上传到/home/plugins文件下。 进入Xshell,验证一下是否上传成功。 2.创建es目录 mkdir -p /usr/local/es(es1,es2,es3暂时不要安装 ...
分类:
其他好文 时间:
2019-07-07 16:06:40
阅读次数:
123
1.创建索引 举例子: 文档一:solr是基于Lucene开发的企业级搜索引擎技术 文档二:Solr是一个独立的企业级搜索应用服务器,Solr是一个高性能,基于Lucene的全文搜索服务器 首先经过分词器分词,solr会为分词后的结果(词典)创建索引,然后将索引和文档id列表对应起来,如下图所示: ...
分类:
其他好文 时间:
2019-06-17 11:00:43
阅读次数:
99
创建自定义分词器 测试分词器 DELETE /test_analyzer PUT /test_analyzer { "settings": { "analysis": { "char_filter": { "sign_to_word": { "type": "mapping", "mappings" ...
分类:
其他好文 时间:
2019-06-16 21:36:31
阅读次数:
161
对于类似于这篇文章中的需求,Elasticsearch实现英文区分大小写搜索,创建了两个采用不同分词器内容相同的字段,实施搜索时,正常如果只有一个搜索条件,直接搜索某一个字段即可,但是如果有多两个搜索条件,比如:有两个搜索框,一个是区分大小写搜索,另外一个时正常的模糊搜索,这时在显示高亮的时候就会有 ...
分类:
其他好文 时间:
2019-06-15 15:52:42
阅读次数:
124
在使用ElasticSearch过程中,一般中文使用IK分词器,英文使用默认的分词器即可,但是对于上述分词器满足不了需求的情况下,需要自定义分析器。 以下思维导图包含ES分析器的结构和内置的一些组件: ...
分类:
其他好文 时间:
2019-06-15 15:24:28
阅读次数:
79
"id":1, "title":"Elasticsearch是一个基于Lucene的搜索服务器", "content":"它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的 ...
分类:
其他好文 时间:
2019-06-05 21:52:32
阅读次数:
137
1. 在50和52的 config/elasticsearch.yml 中增加以下配置 index: analysis: analyzer: string_lowercase: tokenizer: keyword filter: lowercase 2. 重启es 3. 创建一个测试 index: ...
分类:
其他好文 时间:
2019-05-20 19:07:09
阅读次数:
660
1、什么是分词器 作用:切分词语,normalization(提升recall召回率),如给你一段句子,然后将这段句子拆分成一个一个的单个的单词,同时对每个单词进行normalization(时态转换,单复数转换),分词器 recall,召回率:搜索的时候,增加能够搜索到的结果的数量 3个功能: 一 ...
分类:
其他好文 时间:
2019-05-19 18:16:21
阅读次数:
114