码迷,mamicode.com
首页 >  
搜索关键字:lucene 全文检索    ( 2861个结果
15个nosql数据库
1、MongoDB介绍MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。主要解决的是海量数据的访问效率问题,为WEB应用提供可扩展的高性能数据存储解决方案。当数据量达到50GB以上的时候,MongoDB的数据库访问速度是MySQL的10倍以上。MongoDB的并发读写效率不是特别出色...
分类:数据库   时间:2014-06-26 23:15:17    阅读次数:292
几款开源的中文分词系统
中文分词是做好中文内容检索、文本分析的基础,主要应用于搜索引擎与数据挖掘领域。中文是以词为基本语素单位,而词与词之间并不像英语一样有空格来分隔,因而中文分词的难点在于如何准确而又快速地进行分词以下介绍4款开源中文分词系统。1、ICTCLAS – 全球最受欢迎的汉语分词系统 中文词法分析是中文信息处理...
分类:其他好文   时间:2014-06-26 22:35:29    阅读次数:298
几种开源分词工具的比較
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:其他好文   时间:2014-06-26 16:38:46    阅读次数:160
NoSQL 数据建模技术(转)
本文转载自:http://coolshell.cn/articles/7270.html ================================================ 全文译自墙外文章“NoSQL Data Modeling Techniques”,译得不好,还请见谅。这篇文章看...
分类:数据库   时间:2014-06-25 21:05:15    阅读次数:792
lucene_indexWriter说明、索引库优化
IndexWriter Hibernate的SessionFactory 在Hibernate中,一般保持一个数据库就只有一个SessionFactory。因为在SessionFactory中维护二级缓存,而SessionFactory又是线程安全的。所以SessionFactory是共享的。 lucene的IndexWriter 如果同时在一个索引库中同时建立两个In...
分类:其他好文   时间:2014-06-24 23:42:32    阅读次数:364
【Lucene4.8教程之四】分析
1、基础内容 (1)相关概念 分析(Analysis),在Lucene中指的是将域(Field)文本转换成最基本的索引表示单元--项(Term)的过程。在搜索过程中,这些项用于决定什么样的文档能够匹配查词条件。 分析器对分析操作进行了封装,它通过执行若干操作,将文本转化成语汇单元,这个处理过程也称为语汇单元化过程(tokenization),而从文本洲中提取的文本块称为语汇单元(token)...
分类:其他好文   时间:2014-06-24 22:55:00    阅读次数:241
第一个lucene程序,把一个信息写入到索引库中、根据关键词把对象从索引库中提取出来、lucene读写过程分析
新建一个Java Project :LunceneTest 准备lucene的jar包,要加入的jar包至少有: 1) lucene-core-3.1.0.jar     (核心包) 2) lucene-analyzers-3.1.0.jar    (分词器) 3) lucene-highlighter-3.1.0.jar    (高亮器) 4) lucene-memory-3.1.0...
分类:其他好文   时间:2014-06-24 22:30:13    阅读次数:328
lucene索引库的增删改查操作
1. 索引库的操作 保持数据库与索引库的同步 说明:在一个系统中,如果索引功能存在,那么数据库和索引库应该是同时存在的。这个时候需要保证索引库的数据和数据库中的数据保持一致性。可以在对数据库进行增、删、改操作的同时对索引库也进行相应的操作。这样就可以保证数据库与索引库的一致性。 工具类DocumentUtils 在对索引库进行操作时,增、删、改过程要把一个JavaBean封...
分类:其他好文   时间:2014-06-24 22:19:24    阅读次数:280
全文检索概念,Lucene大致结构
1.1 常见的全文检索  1) 在window系统中,可以指定磁盘中的某一个位置来搜索你想要得到的东西。 2) 在myeclipse中,点击Help->Help Contents,可以利用搜索功能找到你要查询的帮助文档。 3) 在百度和google 中,可以搜索互联网中的信息,有:网页、pdf、word音频、视频等内容。 4) 在bbs系统中,有搜索文章的功能。 以上的查询功...
分类:其他好文   时间:2014-06-24 20:02:17    阅读次数:192
【Lucene4.8教程之六】QueryParser与Query子类:如何生成Query对象
对于一个搜索而言,其核心语句为: searcher.search(query, 10);此时,其最重要的参数为一个Qeury对象。构造一个Query对象有2种方法:【均以在contents域搜索java关键词为例】 (1)使用Query的子类,如BooleanQuery, ConstantScoreQuery, DisjunctionMaxQuery, FilteredQuery, M...
分类:其他好文   时间:2014-06-24 17:38:36    阅读次数:281
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!