100行代码实现全文检索,说明lucene的倒排序原理...
分类:
其他好文 时间:
2014-06-08 16:16:58
阅读次数:
183
概念
在谈全文检索之前,首先让我们来了解一下什么是信息检索。信息检索就是从信息集合中找出与用户需求相关的信息。被检索的信息除了文本外,还有图像、音频、视频等多媒体信息,这里我们只讨论文本信息的检索。
全文检索是信息检索技术的一种,主要是把用户的查询请求和全文中的每一个词进行比较,不考虑查询请求与文本语义上的匹配。在信息检索工具中,全文检索是最具通用性和实用性的。...
分类:
其他好文 时间:
2014-06-05 07:42:26
阅读次数:
265
项目地址:http://code.google.com/p/freecms/
全文检索
从FreeCMS 1.7开始支持
只有创建过索引的对象才能被lucene类标签查询到。
信息类数据会在信息更新、审核、删除、还原操作时自动进行全文检索处理。
1. 创建索引
从左侧管理菜单点击创建索引进入。
您可以选择需要创建索引的栏目,然后点...
分类:
编程语言 时间:
2014-06-03 03:55:21
阅读次数:
273
Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下:
0)设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He
once lived i...
分类:
其他好文 时间:
2014-05-31 15:14:01
阅读次数:
302
Solr调研总结开发类型全文检索相关开发Solr版本4.2文件内容本文介绍solr的功能使用及相关注意事项;主要包括以下内容:环境搭建及调试、两个核心配置文件介绍、中文分词器配置、维护索引、查询索引,高亮显示、拼写检查、搜索建议、分组统计、自动聚类、相似匹配、拼音检索等功能的使用方法。在代码文本框中...
分类:
其他好文 时间:
2014-05-26 22:22:05
阅读次数:
886
部分内容转自:http://blog.csdn.net/hguisu/article/details/8024799
一、 开源项目
1.Lucene全文检索系统
http://lucene.apache.org和 http://www.lucene.com.cn/
Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代...
分类:
Web程序 时间:
2014-05-26 04:36:55
阅读次数:
297
1. Sphin x简介
1.1. 什么是全文检索
全文检索是指以文档的全部文本信息作为检索对象的一种信息检索技术 。检索的对象有可能是文章的标题,也有可能是文章的作者,也有可能是文章摘要或内容。
1.2. 介绍
Sphin x是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能 ,使得应用程序更...
分类:
其他好文 时间:
2014-05-23 07:36:05
阅读次数:
227
讲解了Java中数组的使用以及和数组相关的操作。...
分类:
编程语言 时间:
2014-05-22 11:05:01
阅读次数:
391
jplogicv1.0开发陆续更新,意在和广大网友分享交流,通过寻求合作伙伴,交流群376447127.下面是jplogic的关于知识库模块的部分功能,如下进行功能展示:知识库主界面:新增知识类别:新增文档:调整类别结构:附件明细操作:文档信息查看:(将上传的各种文本文件转化成swf格式..
分类:
其他好文 时间:
2014-05-20 18:31:47
阅读次数:
367
用QT也已经三四年了,今天从QT的tools中看到qtclucene,原来这个就是从clucene移植过来的一个全文检索工具,用在QTHelp中。
下面是clucene的说明:
CLucene是Lucene的一个C++移植,Lucene是一个基于java的高性能的全文搜索引擎。CLucene因为使用C++编写,所以理论上要比lucene快。[1]
Lucene不是一个完整的全文索...
分类:
其他好文 时间:
2014-05-20 17:17:03
阅读次数:
300