终于有时间总结点Lucene,虽然是大周末的,已经感觉是对自己的奖励,毕竟只是喜欢,现在的工作中用不到的。自己看源码比较快,看英文原著的技术书也很快。都和语言有很大关系。虽然咱的技术不敢说是部门第一的,说到日语和英语,倒是无人能出其右的。额~~,一个做技术的,感觉自己好弱啊。对语言,只是天赋而已。对 ...
分类:
Web程序 时间:
2017-04-08 10:04:37
阅读次数:
288
一、ELK介绍 1.1 elasticsearch 1.1.1 elasticsearch介绍 ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许 ...
分类:
其他好文 时间:
2017-04-07 09:55:32
阅读次数:
283
Lucene的IndexSearcher提供一个explain方法,能够解释Document的Score是怎么得来的,具体每一部分的得分都可以详细地打印出来。这里用一个中文实例来纯手工验算一遍Lucene的评分算法,并且结合Lucene的源码做一个解释。 首先是测试用例,我使用“北京东路”来检索一个 ...
分类:
其他好文 时间:
2017-04-06 19:45:16
阅读次数:
2293
1. 什么是lucene lucene是Apache的一个全文检索工具,使用lucene能快速实现全文检索功能。Lucene是一个工具包,你可以调用它的函数, 但它不能独立运行,不单独对外提供服务。 2. lucene实现全文检索的流程 3. 创建索引 需要进行全文检索的内容的格式是丰富多样的,有视 ...
分类:
Web程序 时间:
2017-04-05 19:25:09
阅读次数:
256
Hi,I have index ~31G where27% of the index size is .fdt files (8.5G)20% - .fdx files (6.2G)37% - .frq files (11.6G)16% - .tim files (5G) This is the t ...
分类:
Web程序 时间:
2017-04-05 16:02:39
阅读次数:
190
使用Lucene 6.0对文本进行中文分词,然后使用MapReduce构建倒排索引,统计文档频率和总的词项频率
分类:
其他好文 时间:
2017-04-04 23:45:48
阅读次数:
301
package com.bc.cas.manager;import com.bc.cas.dao.BookDao;import com.bc.cas.model.entity.Book;import com.google.common.base.Objects;import com.google.c... ...
分类:
Web程序 时间:
2017-04-04 19:34:31
阅读次数:
268
Matches documents with fields that have terms within a certain range. The type of the Lucene query depends on the field type, for string fields, the T ...
分类:
其他好文 时间:
2017-04-01 20:31:43
阅读次数:
499
Lucene是一个开源的全文检索引擎工具包。 现在来介绍如何安装和在CMD下使用Lucene检索。 第一步:安装JDK 1.到官网下载安装JDK,一般是安装路径是C:\Program Files\Java\jdk1.8.0_91 2.安装好后配置环境变量。“我的电脑”-“属性”-“高级系统设置”-“ ...
分类:
Web程序 时间:
2017-03-29 01:02:03
阅读次数:
213
第一个网址用Google打开。 http://www.myexception.cn/linux-unix/1944653.html http://lucene.apache.org/solr/quickstart.html tomcat 端口配置http://www.duntuk.com/how-i ...
分类:
系统相关 时间:
2017-03-27 00:44:21
阅读次数:
234