一、搭建solr服务器1、Apache官网下载solr,本次使用4.9.1版本2、解压solr,找到example,将webapps中的war包复制到tomcat的webapps下3、运行tomcat,关闭tomcat,得到解压后的solr文件夹,删除war包4、将example\lib\ext\* ...
分类:
其他好文 时间:
2016-04-07 18:25:50
阅读次数:
146
这个本质上还是Lucene的analyzerchain,Solr的只是方便了使用:通过配置xml文件就可以把tokenizer和filter链接起来。我们有时候需要在自己代码里使用这个chain。本文记录怎么做。先看整体代码(groovy):classMyAnalyzer{
defanalyzer=newAnalyzer(){
@Override
protectedToke..
分类:
其他好文 时间:
2016-04-07 10:57:18
阅读次数:
172
手动添加Jar包到我们的Maven项目中。 1、首先我在项目根目录中创建一个lib文件夹,将jar包拷贝到lib文件夹下 2、然后我们在maven的pom.xml中配置 <groupId>org.wltea.analyzer</groupId> <artifactId>IKAnalyzer</art ...
分类:
编程语言 时间:
2016-04-06 13:09:56
阅读次数:
297
【题目描述】一个数的序列bi,当b1 < b2 < ... < bS的时候,我们称这个序列是上升的。对于给定的一个序列(a1, a2, ..., aN),我们可以得到一些上升的子序列(ai1, ai2, ..., aiK),这里1 <= i1 < i2 < ... < iK <= N。比如,对于序列 ...
分类:
其他好文 时间:
2016-04-02 10:47:08
阅读次数:
161
一、配置IKAnalyzer中文分词器Solr版本5.2.1IKAnalyzer2012_u6.jar报错,用IKAnalyzer2012_FF_hf1.jar替换可解决解决lucene4.0与IKAnalyzer的冲突。解决Exceptioninthread"main"java.lang.VerifyError:classorg.wltea.analyzer.lucene.IKAnalyzeroverridesfinalmethodtokenStrea..
分类:
其他好文 时间:
2016-03-20 18:09:01
阅读次数:
1197
1.ElasticSearch安装的准备工作 Linux:CentOS Elasticsearc:elasticsearch-2.2.0 JDK:jdk-7u79-linux-x64 IK:1.8.0 MAVEN:apache-maven-3.3.3-bin 2.配置网络静态文件 虚拟机设置桥接模式
分类:
其他好文 时间:
2016-03-09 01:27:43
阅读次数:
167
elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内最早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是mmseg的,下面分别介绍ik的用法, 当我们创建一个index(库db_news)时,easticsearch默认提供的分
在使用IK之前同样也需要下载IK的jar包请点击下载,接下来我们对下载的文件进行配置 第一步:先将IKAnalyzer2012FF_u2.jar文件复制到tomcat目录webapps\solr5.5\WEB-INF\lib下 第二步:将IKAnalyzer.cfg.xml和stopword.dic
分类:
Web程序 时间:
2016-03-07 19:17:58
阅读次数:
177
在看深入JVM虚拟机一书(p50,2.4 实战OutOfMemoryError),有一个Java堆溢出的例子,使用到了Eclipse Memory Analyzer插件,由于自己现在使用的是MyEclipse,所以就需要在MyEclipse上添加插件。具体步骤如下: 1.先安装MAT插件 Memor
分类:
系统相关 时间:
2016-02-26 01:47:26
阅读次数:
497
原文:http://3dobe.com/archives/44/ 引言 做搜索技术的不可能不接触分词器。个人认为为什么搜索引擎无法被数据库所替代的原因主要有两点,一个是在数据量比较大的时候,搜索引擎的查询速度快,第二点在于,搜索引擎能做到比数据库更理解用户。第一点好理解,每当数据库的单个表大了,就是
分类:
其他好文 时间:
2016-02-18 11:59:22
阅读次数:
203