实操重写IK分词器源码,基于mysql热更新词库参考网址:https://blog.csdn.net/wuzhiwei549/article/details/80451302 问题一:按照这篇文章的介绍,遇到一个问题:No suitable driver found for jdbc:mysql,搞 ...
分类:
数据库 时间:
2018-12-12 20:32:02
阅读次数:
228
分词器概念介绍: Analyzer类(分词器)就是把一段文本中的词按某些规则取出,提供和以后查询时使用的工具类,注意在创建索引时会用到分词器,在使用字符串搜索时也会用到分词器,这两个地方要使用同一个分词器,否则可能会搜索不出结果 分词器工作流程: 1, 切分关键词 2, 去除停用词 3, 对于英文单 ...
分类:
Web程序 时间:
2018-12-10 18:13:21
阅读次数:
243
万恶的源头 HelloWorld 要完成lucene 的配置 需要几个jar包 (如果需要可以留言我私发) 创建索引API分析: 1. Directory: 类代表一个Lucene索引的位置,FSDirectory:它表示一个存储在文件系统中的索引的位置 2. Analyzer 类是一个抽象类, 它 ...
分类:
Web程序 时间:
2018-12-07 20:54:45
阅读次数:
212
环境:Elasticsearch 6.2.4 + Kibana 6.2.4 + ik 6.2.4 Elasticsearch默认也能对中文进行分词。 我们先来看看自带的中文分词效果: 结果: 我们发现,是按照每个字进行分词的。这种在实际应用里肯定达不到想要的效果。当然,如果是日志搜索,使用自带的就足 ...
分类:
其他好文 时间:
2018-12-01 00:11:45
阅读次数:
225
查看 webpack 打包后所有组件与组件间的依赖关系,针对多余的包文件过大, 剔除首次影响加载的效率问题进行剔除修改,本次采用的是 ==webpack-bundle-analyzer(可视化视图查看器)== == 介绍1:webpack-bundle-analyzer(可视化)== 将捆绑内容表示 ...
分类:
Web程序 时间:
2018-11-30 15:34:53
阅读次数:
303
一 打开网页:https://github.com/medcl/elasticsearch-analysis-ik/releases 这个是ik相关的包,找到你想下载的版本,下载对应的zip包 二 然后在安装目录的plugins中新建ik文件夹, 然后将文件解压到当前文件夹,对应的ik文件夹如下图所 ...
分类:
其他好文 时间:
2018-11-28 15:39:53
阅读次数:
206
一、Es插件配置及下载 1.IK分词器的下载安装 关于IK分词器的介绍不再多少,一言以蔽之,IK分词是目前使用非常广泛分词效果比较好的中文分词器。做ES开发的,中文分词十有八九使用的都是IK分词器。 下载地址:https://github.com/medcl/elasticsearch-analys ...
分类:
其他好文 时间:
2018-11-25 13:26:39
阅读次数:
294
1.ELK简介ELK是三个开源软件的缩写,分别表示:Elasticsearch,Logstash,Kibana,它们都是开源软件。新增了一个FileBeat,它是一个轻量级的日志收集处理工具(Agent),Filebeat占用资源少,适合于在各个服务器上搜集日志后传输给Logstash,官方也推荐此工具。Elasticsearch是个开源分布式搜索引擎,提供搜集、分析、存储数据三大功能。它的特点有
分类:
其他好文 时间:
2018-11-22 00:24:48
阅读次数:
189
配置业务域,type指定使用自定义的fieldType。 修改solr工程下的schema.xml文件,在文件末尾添加一个自定义的fieldType,如下: <schema>............</schema> <fieldType name="text_ik" class="solr.Tex ...
分类:
其他好文 时间:
2018-11-21 15:36:33
阅读次数:
372