字段是最低单元或索引过程的起点。它代表其中一个键被用于识别要被索引的值的键值对关系。用于表示一个文件的内容的字段中将具有键为“内容”和值,可以包含文本或文档的数字内容的部分或全部。 Lucene可以索引仅文本或仅数字内容。此类表示索引的存储位置,并通常是文件的列表。这些文件被称为索引文件。索引文件通 ...
分类:
Web程序 时间:
2017-08-07 11:58:32
阅读次数:
197
Lucene 是apache下的一个开源的全文检索引擎工具包(类库)。它的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能。 它只是一个工具包,并不是一个完整的搜索引擎 全文检索 全文检索首先将要查询的目标文档中的词提取出来,组成索引,通过查询索引达到搜索目标文档 ...
分类:
Web程序 时间:
2017-08-06 00:50:30
阅读次数:
316
0.语法介绍: 1.公共部分代码同七中一样 2.查询所有:(分析器会对查询条件进行分词) 语法: *:* 3.使用默认查询的域 查询名字带有computer索引的文档 结果: 4.范围查询 不支持范围查询 5.组合查询(组合查询只用修改语法,+表示必须,-表示必须没有,啥也没有表示可有可无) 查询f ...
分类:
Web程序 时间:
2017-08-05 22:53:42
阅读次数:
266
0.文档名字:(根据名字索引查询文档) 1. 提取获取InsexSearch 与 处理结果的公共代码 2.精准查询:(入门程序的查询索引) 查询名字索引中含有Java的文件 结果: 3.查询所有 结果: 4.根据范围值查询 NumericRangeQuery.newLongRange("fileSi ...
分类:
Web程序 时间:
2017-08-05 22:01:40
阅读次数:
291
增加在入门程序创建索引中,增删改用IndexWriter. 1.获取IndexWriter的代码 2.全删除: 结果: 3.按条件删除 先创建索引: 删除索引 结果: 第三个文档被删除,第五个文档被删除。 ...
分类:
Web程序 时间:
2017-08-05 20:32:23
阅读次数:
236
原理: 修改的原理是先删除,后增加一个,这也是常用的一种修改的方式。 删除的文档的id不会被新增加的文档占用,类似于mysql的自增,当删除一个id=2时,以后id=2就是空着的,不会上来一个把2给占用。再添加是往后面增加。 代码: 删除fileName 为 javaweb的索引,然后新增加一个索引 ...
分类:
Web程序 时间:
2017-08-05 20:28:49
阅读次数:
229
1.分析器的执行过程: 第一个 TokenFilter将大写字母变为小写,第二次分词去掉空格并换行,第三次去掉不要的 and或者标点符号 2.中文分词器介绍: (1)lucene自带的 (2)第三方的 3.查看标准分词器对中文的分词效果: 最终决定使用的是IKAnalyzer()分词器,支持中文扩展 ...
分类:
Web程序 时间:
2017-08-05 19:45:09
阅读次数:
386
1.用户接口(lucene不提供) 2.创建查询 3.执行查询 4.渲染结果: 5.过程分析 根据关键字查询索引库中的内容: 1) 创建IndexSearcher对象 2) 创建QueryParser对象 3) 创建Query对象来封装关键字 4) 用IndexSearcher对象去索引库中查询符合 ...
分类:
Web程序 时间:
2017-08-05 18:56:50
阅读次数:
213
1.程序宏观结构图 2.创建索引过程 3.代码实现 创建索引库: 1) 创建JavaBean对象 2) 创建Docment对象 3) 将JavaBean对象所有的属性值,均放到Document对象中去,属性名可以和JavaBean相同或不同 4) 创建IndexWriter对象 5) 将Docume ...
分类:
Web程序 时间:
2017-08-05 17:52:19
阅读次数:
218
查看apache的东西格式就是上面的,例如 maven是 maven.apache.org tomcat就是 tomcat.apache.org ...
分类:
Web程序 时间:
2017-08-05 15:34:41
阅读次数:
126