注意由于更新差距不同版本可能导致有些工具不能正常使用 <?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/ ...
分类:
Web程序 时间:
2019-11-20 15:31:55
阅读次数:
105
lucene 和 es 的前世今生 lucene 是最先进、功能最强大的搜索库。如果直接基于 lucene 开发,非常复杂,即便写一些简单的功能,也要写大量的 Java 代码,需要深入理解原理。 elasticsearch 基于 lucene,隐藏了 lucene 的复杂性,提供了简单易用的 res ...
分类:
其他好文 时间:
2019-11-20 14:10:06
阅读次数:
106
Apache Solr 远程代码执行漏洞(CVE 2019 12409) 简介 Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web service的API接口。是apache的顶级开源项目,使用java开发 ,基于lucene的全文检索服务器。 影响范围 Solr 8.1.1 Solr ...
分类:
其他好文 时间:
2019-11-20 12:57:43
阅读次数:
105
package com.xl.lucene;import java.io.File;import org.apache.commons.io.FileUtils;import org.apache.lucene.analysis.Analyzer;import org.apache.lucene.a ...
分类:
Web程序 时间:
2019-11-20 12:41:28
阅读次数:
67
流程图 一.创建文档 文档域 注: 每一个Doucment可以有多个field,不同的Document可以有不同的field,同一个Document可以有相同的field(域名和域值都相同) 每一个文档都有唯一的编号 二.分析文档 将文档中的大写转化成小写,清除 is a 标点 停用词等过程生成语汇 ...
分类:
Web程序 时间:
2019-11-19 11:56:24
阅读次数:
68
大数据从入门到入土 语言基础:java(Java se,javaweb) Linux 基础:Linux(shell,高并发架构,lucene,solr) 框架学习:Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume) ...
分类:
其他好文 时间:
2019-11-16 21:47:53
阅读次数:
107
1.1. Lucene工具类 为了后面的开发、测试方便,这里编写一个工具类: 1 import java.io.IOException; 2 3 import java.nio.file.Paths; 4 5 import java.util.List; 6 7 8 9 import org.apa ...
分类:
Web程序 时间:
2019-11-15 14:37:23
阅读次数:
78
【创建索引】put /book/ -d { "settings":{ "number_of_shards":1, //这是分片数量 "number_or_replicas":2 //指定副本数量 }}总共创建了3个物理Lucene索引 【删除索引】delete /book/ 【类型确认机制】PUT ...
分类:
其他好文 时间:
2019-11-15 14:34:30
阅读次数:
91
1.1. 分组统计 既然是查询,就有可能会用到分组统计。下面介绍一下Lucene的分组统计: 1.1.1. 创建索引 要分组统计,创建索引的时候就要添加一个SortedDocValuesField: 1 /** 2 3 * 添加索引 4 5 */ 6 7 @Test 8 9 public void ...
分类:
Web程序 时间:
2019-11-15 14:26:34
阅读次数:
87
1.1. 创建索引 示例: 1 import org.apache.lucene.analysis.Analyzer; 2 3 import org.apache.lucene.analysis.TokenStream; 4 5 import org.apache.lucene.analysis.c ...
分类:
Web程序 时间:
2019-11-15 14:12:06
阅读次数:
107