搜索引擎三大过程 爬取内容、进行分词、建立倒排索引。 分词器 分词器使用IK,通常为了保证索引时覆盖度和搜索时准确度,索引分词器采用ik_max_word,搜索分析器采用ik_smart模式。可在IK的配置文件中配置自定义的词典、停词词典。 倒排索引 Elasticsearc依赖Lucene建立倒排 ...
分类:
其他好文 时间:
2020-09-07 19:19:25
阅读次数:
60
一、安装IK分词器 下载ik分词器插件 wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.4.2/elasticsearch-analysis-ik- 使用linux下载会很慢,于是我自己去git ...
分类:
其他好文 时间:
2020-09-07 19:07:17
阅读次数:
48
django 对接elasticsearch实现全文检索 第一步:安装elasticsearch环境(docker安装) 拉取镜像 # docker image pull delron/elasticsearch-ik:2.4.6-1.0 运行容器 # docker run -d -p 9200:9 ...
分类:
其他好文 时间:
2020-08-19 19:21:30
阅读次数:
67
1. 获取 ES-IKAnalyzer插件 一定和ES的版本一致( 7.8.1) 地址: https://github.com/medcl/elasticsearch-analysis-ik/releases 1 //解压zip文件到指定文件夹unzip elasticsearch-analysis ...
分类:
其他好文 时间:
2020-08-18 15:41:29
阅读次数:
88
下载eslasticSearch(本次使用6.5.4的windows版本) https://www.elastic.co/cn/downloads/past-releases 下载ik中文分词器(对应es的版本 下载zip) https://github.com/medcl/elasticsearc ...
分类:
其他好文 时间:
2020-08-01 12:35:01
阅读次数:
94
DockerFile构建ElasticSearch镜像安装IK中文分词器插件 为什么要安装IK中文分词器? ES提供的分词是英文分词,对中文做分词时会拆成单字而不是词语,非常不好,因此索引信息含中文时需要使用中文分词器插件。 一、环境及文件准备 环境准备 VMWare版本:15.5.5 操作系统:C ...
分类:
其他好文 时间:
2020-07-29 17:44:12
阅读次数:
85
PUT /jzt_study_content { "mappings": { "content":{ "properties":{ "id":{ "type":"keyword" }, "title":{ "type":"text", "analyzer":"ik_max_word" }, "sor ...
分类:
其他好文 时间:
2020-07-24 16:26:16
阅读次数:
81
题目链接 题目大意:求$(\sum\limits_{i=0}^n C_{nk}^{ik+r})\ mod \ p$的值。 讲真,一开始看到这个题我都没往DP方面想,以为是什么大力推式子的数学题。 设$f_{i,j}$表示考虑前$i$个物品,选出的物品$mod \ k=j$的方案数。最后输出$f_{n ...
分类:
其他好文 时间:
2020-07-20 22:53:33
阅读次数:
96
1,讲分词器的文件夹放入es安装包的plugins,重新启动elasticsearch //查询es运行中的进程pid ps -aux|grep elasticsearch //杀死进程 kill -9 pid //使用es账户启动 nohup ./elasticsearch & 2,重启es,然后 ...
分类:
其他好文 时间:
2020-07-17 19:24:23
阅读次数:
67
1,讲分词器的文件夹放入es安装包的plugins,重新启动elasticsearch //查询es运行中的进程pid ps -aux|grep elasticsearch //杀死进程 kill -9 pid //使用es账户启动 nohup ./elasticsearch & 2,重启es,然后 ...
分类:
其他好文 时间:
2020-07-17 16:22:28
阅读次数:
69