概念
在谈全文检索之前,首先让我们来了解一下什么是信息检索。信息检索就是从信息集合中找出与用户需求相关的信息。被检索的信息除了文本外,还有图像、音频、视频等多媒体信息,这里我们只讨论文本信息的检索。
全文检索是信息检索技术的一种,主要是把用户的查询请求和全文中的每一个词进行比较,不考虑查询请求与文本语义上的匹配。在信息检索工具中,全文检索是最具通用性和实用性的。...
分类:
其他好文 时间:
2014-06-05 07:42:26
阅读次数:
265
项目地址:http://code.google.com/p/freecms/
全文检索
从FreeCMS 1.7开始支持
只有创建过索引的对象才能被lucene类标签查询到。
信息类数据会在信息更新、审核、删除、还原操作时自动进行全文检索处理。
1. 创建索引
从左侧管理菜单点击创建索引进入。
您可以选择需要创建索引的栏目,然后点...
分类:
编程语言 时间:
2014-06-03 03:55:21
阅读次数:
273
使用Spring MVC +JDBC 实现输出Json数据和视图两种形式 最后面有源码
从web.xml开始配置:
声明定义两个Servlet分别是输出视图和json
rest
org.springframework.web.servlet.DispatcherServlet
contextConfigLocation
/WEB-INF/rest-...
分类:
数据库 时间:
2014-06-02 23:55:13
阅读次数:
508
说了这么多,那么首先允许我以Google Discovery RESTful服务为例,给大家演示如何用最普通的Java代码调用Google Discovery RESTful服务。...
上篇文章,我提到了,Google APIs暴露了86种不同种类和版本的API。我们可以通过在浏览器里面输入https://www.googleapis.com/discovery/v1/apis这个URL地址,其将会把所有Google API支持的不同种类和版本的API全部列出来。其具体信息如下:...
Google的应用系统提供了很多的应用,比如 Google广告,Google 任务,Google 日历,Google blogger,Google Plus,Google 地图等等非常的多的应用,请见下图,
只是google API的冰山一角。有的时候,我们需要把这些系统的数据集成到我们自己的系统当中(自己开发的Web系统,或者其他的系统当中)。这个时候,我们就不得不了解如何使用Google APIs来帮助我们进行不同系统之间的集成。...
前言:例行公事,有些人可能不太了解elasticsearch,下面搜了一段,大家瞅一眼。Elasticsearch是一款分布式搜索引擎,支持在大数据环境中进行实时数据分析。它基于ApacheLucene文本搜索引擎,内部功能通过ReSTAPI暴露给外部。除了通过HTTP直接访问Elasticsearch,还可以通过支..
分类:
编程语言 时间:
2014-06-01 13:47:42
阅读次数:
328
(一)搜索引擎的开发一般可分为下面三大部分1、数据採集层:一般使用爬虫获取互联网的数据,重要的开源项目有Heritrxi2、数据分析处理层:将从互联网上获取到的数据进行提取归类、分词、语义分析得出索引得内容,等待用户查询使用,重要的开源项目有Lucene3、视图层:也用户的交互界面,如一个站点的首页...
分类:
其他好文 时间:
2014-05-31 20:04:37
阅读次数:
263
还没读TFIDFSimilarity的代码,读了一下lucene的文档,没有特复杂,感觉还是非常严谨的。对于查询q和文档d,如果查询为纯token查询,套用向量空间模型(VSM),相似度度量使用余弦,另外再加一个coord(q,d)即d中满足q中must和should查询条件个数的度量(预计通常是m...
分类:
其他好文 时间:
2014-05-31 12:26:13
阅读次数:
447
代码高亮显示是通过在搜索到的Term中把匹配了用户输入的关键字的周围加上一些标记来实现(比如,关键字是"中华" 查到的一个Term是
"中华人民共和国",则把这个Term修改一下 把"中华" 两个字加粗,最终结果是这样的: 中华人民共和国)下边是具体实现的代码片段: Top...
分类:
其他好文 时间:
2014-05-31 05:07:22
阅读次数:
207