码迷,mamicode.com
首页 >  
搜索关键字:lucene nrt    ( 2456个结果
lucene学习笔记(一)
package l002;import java.io.File;import java.io.IOException;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.analysis.standard.Stan...
分类:其他好文   时间:2014-06-07 06:51:41    阅读次数:208
计算机科学精彩帖子收集
inux源码LXR 源自“the Linux Cross Referencer”,中间的“X”形象地代表了“Cross”。与 Source Navigator 类似,它也是分析阅读源代码的好工具。不同的是,它将源代码借助浏览器展示出来,文件间的跳转过程成了我熟悉的点击超链接动作。http://lxr...
分类:其他好文   时间:2014-06-06 14:22:54    阅读次数:406
复杂的核心字段类型(Complex core field types)
除了前面已经提到的简单的数据类型,JSON也有null,array和object类型,这些都是被ES支持的。Multi-value fields我们想让我们的tag field的值多于一个而不是一个字符串,这个也是可能的,我们能把一个数组存储到tags:{"tag":["search","nosql...
分类:其他好文   时间:2014-06-06 08:15:06    阅读次数:316
程序员的无奈(三):对不起,我不是重装电脑的
不知道从什么时候起,学计算机的居然和重装电脑的成了冤家。今天回家,被n个亲戚朋友拉着重装电脑,解决各种问题。
分类:其他好文   时间:2014-06-05 16:57:44    阅读次数:192
全文检索技术与Lucene的使用
概念 在谈全文检索之前,首先让我们来了解一下什么是信息检索。信息检索就是从信息集合中找出与用户需求相关的信息。被检索的信息除了文本外,还有图像、音频、视频等多媒体信息,这里我们只讨论文本信息的检索。 全文检索是信息检索技术的一种,主要是把用户的查询请求和全文中的每一个词进行比较,不考虑查询请求与文本语义上的匹配。在信息检索工具中,全文检索是最具通用性和实用性的。...
分类:其他好文   时间:2014-06-05 07:42:26    阅读次数:265
lucene学习笔记(三)
好几天没更新了。更新一下,方便自己和大家学习。这是最基本的代码package index;import java.io.File;import java.io.IOException;import java.util.HashMap;import java.util.Map;import org.a...
分类:其他好文   时间:2014-06-04 16:23:48    阅读次数:348
开源 免费 java CMS - FreeCMS1.9 全文检索
项目地址:http://code.google.com/p/freecms/ 全文检索     从FreeCMS 1.7开始支持 只有创建过索引的对象才能被lucene类标签查询到。 信息类数据会在信息更新、审核、删除、还原操作时自动进行全文检索处理。 1. 创建索引 从左侧管理菜单点击创建索引进入。   您可以选择需要创建索引的栏目,然后点...
分类:编程语言   时间:2014-06-03 03:55:21    阅读次数:273
【搜索引擎基础知识1】搜索引擎基本架构
(一)搜索引擎的开发一般可分为下面三大部分1、数据採集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi2、数据分析处理层:将从互联网上获取到的数据进行提取归类、分词、语义分析得出索引得内容,等待用户查询使用,重要的开源项目有Lucene3、视图层:也用户的交互界面,如一个站点的首页...
分类:其他好文   时间:2014-05-31 20:04:37    阅读次数:263
Lucene TFIDF打分公式
还没读TFIDFSimilarity的代码,读了一下lucene的文档,没有特复杂,感觉还是非常严谨的。对于查询q和文档d,如果查询为纯token查询,套用向量空间模型(VSM),相似度度量使用余弦,另外再加一个coord(q,d)即d中满足q中must和should查询条件个数的度量(预计通常是m...
分类:其他好文   时间:2014-05-31 12:26:13    阅读次数:447
代码片段,Lucene的高亮显示
代码高亮显示是通过在搜索到的Term中把匹配了用户输入的关键字的周围加上一些标记来实现(比如,关键字是"中华" 查到的一个Term是 "中华人民共和国",则把这个Term修改一下 把"中华" 两个字加粗,最终结果是这样的: 中华人民共和国)下边是具体实现的代码片段: Top...
分类:其他好文   时间:2014-05-31 05:07:22    阅读次数:207
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!