这几天因为一个小项目用到Lucene,于是去学习了一下,现在还有很多地方没有了解,先就我遇到的问题做下总结。
一、大文本建索引问题
我这里说的大文本,实际上也就200M左右的txt,或许不应该成为大文本,但是我在建索引时遇到200M左右的的确导致了内存溢出,报错误java.lang.OutOfMemoryError: Java heap space ,到网上查了很久,试了一些方法,比如修改JV...
分类:
其他好文 时间:
2014-09-12 12:02:13
阅读次数:
270
刚接触Lucene,虽然跑通了一个demo,但对很多东西还不了解。下面简单记录下对Analyzer的理解,以后再系统整理。后面来自Lucene官方文档,Lucene版本为4.10.0.欢迎感兴趣的同学一起学习交流,求大牛指导,我现在还有很多不明白的地方。
包org.apache.lucene.analysis
将文本转换为可索引和检索的标记标记(token)。
Lucene,建索引和检...
分类:
其他好文 时间:
2014-09-12 10:15:13
阅读次数:
241
5.1搜索排序publicvoidseacher(StringqueryContion,intnum,Sortsort){
try{
IndexSearchersearcher=newIndexSearcher(indexReader);
QueryParserparser=newQueryParser(Version.LUCENE_35,"contents",analyzer);
Queryquery=parser.parse(queryContion);
System.out.println("..
分类:
其他好文 时间:
2014-09-09 13:47:49
阅读次数:
269
工欲善其事必先利其器,先开始更新下eclipse,顺便装下工具软件。那么简要的写写怎么从头安装Memory AnalyzerMemory Analyzer (Eclipse MAT)是一个跨平台的开源工具,不仅可以用它来分析内存问题,也可以用来监控整个 Java 应用程序的状态和行为。通过读取应用程...
分类:
系统相关 时间:
2014-09-05 19:41:21
阅读次数:
287
本文主要讲解IKAnalyzer(以下简称‘IK’)在Lucene中的具体使用,关于Lucene和IK分词器的背景及其作用在这里就不再熬述。不得不感叹下Lucene版本变更的快速,如今最新已经到了4.9.0,相信任何技术的发展壮大都不...
分类:
其他好文 时间:
2014-09-02 18:16:05
阅读次数:
331
介绍solr3.6.2和solr4.9.0在tomcat7.0.55下的基本配置。包括IK分词器、主从配置。可以满足工作中的最基本需求。...
分类:
其他好文 时间:
2014-08-28 18:11:25
阅读次数:
295
在网上下载了lucene当前最新版本4.0,以及IKAnalyzer中文分词器的完整发布包。 运行之后发现异常:Exception in thread "main" java.lang.VerifyError: class org.wltea.analyzer.lucene.IKAnalyzer overrides fi...
分类:
其他好文 时间:
2014-08-26 11:58:26
阅读次数:
216
package?junitTest;
import?java.io.IOException;
import?java.io.StringReader;
import?org.apache.lucene.analysis.Analyzer;
import?org.apache.lucene.analysis.TokenStream;
import?org.apache.luce...
分类:
其他好文 时间:
2014-08-21 17:25:35
阅读次数:
170
做检索怎么都绕不过中文分词去,学习一下用IKAnalyzer分词器做中文分词。Game Starts参考文档 1) 中文分词之Java实现使用IK Analyzer实现 2) IKAnalyzer 独立使用 配置扩展词典 依赖jar包 1) IKAnalyzer2012FF_u1.jar 最...
分类:
其他好文 时间:
2014-08-21 00:03:03
阅读次数:
240
题目链接:uva 11149 - Power of Matrix
题目大意:给定一个矩阵,求∑ikAi
解题思路:因为k比较大,所以即使用快速幂的话复杂度还是有点高,利用矩阵倍增的方法∑ikAi=(1+Ak/2)?∑ik/2Ai
#include
#include
#include
using namespace std;
const int maxn = 50;
const...
分类:
其他好文 时间:
2014-08-18 00:17:23
阅读次数:
273