// 1. 采集数据 BookDao bookDao = new BookDaoImpl(); List<Book> bookList = bookDao.queryBookList(); // 2. 创建Document文档对象 List<Document> documents = new Arr ...
分类:
Web程序 时间:
2017-08-20 16:57:29
阅读次数:
150
看lucene主页(http://lucene.apache.org/)上眼下lucene已经到4.9.0版本号了, 參考学习的书是依照2.1版本号解说的,写的代码样例是用的3.0.2版本号的,版本号 的不同导致有些方法的使用差异,可是大体还是同样的。 源码用到的jar包(3.0.2版本号)下载地址 ...
分类:
Web程序 时间:
2017-08-18 18:35:06
阅读次数:
230
介于上一篇的java实现网络爬虫基础之上,这一篇的思想是将网络收集的数据保存到HDFS和数据库(Mysql)中;然后用MR对HDFS的数据进行索引处理,处理成倒排索引;搜索时先用HDFS建立好的索引来搜索对应的数据ID,根据ID从数据库中提取数据,呈现到网页上。 这是一个完整的集合网络爬虫、数据库、 ...
分类:
Web程序 时间:
2017-08-17 00:50:40
阅读次数:
367
Sphinx + Coreseek 实现中文分词搜索 Sphinx Coreseek 实现中文分词搜索 全文检索 1 全文检索 vs 数据库 2 中文检索 vs 汉化检索 3 自建全文搜索与使用Google等第三方站点提供的站内全文搜索的差别 Sphinx Coreseek介绍 Coreseek安装 ...
分类:
其他好文 时间:
2017-08-14 23:27:39
阅读次数:
467
lucene4.5源码分析系列:lucene概述 http://blog.csdn.net/liweisnake/article/details/10348969 http://www.cnblogs.com/forfuture1978/archive/2010/06/13/1757479.html ...
分类:
Web程序 时间:
2017-08-13 13:33:38
阅读次数:
142
(01)rownum和rowid有何区别? rownum在表结构中是看不见的,只能在select中明确写出rownum方可显示 rownum与不同的表绑定在一起,每张表都有自已的rownum,每张表的rownum可以相同,表亡rownum亡 rownum可用于oracle分页中 rownum是从1开 ...
分类:
Web程序 时间:
2017-08-12 17:15:26
阅读次数:
171
用Lucene实现了一个简单文件检索功能,作为最近学习lucene的学习成果。 定义常量类: 索引创建类: 搜索类: 测试类: 过程中使用TermQuery的时候踩了不小的坑。主要是索引关键字大小写的问题。关键字会被自动存为小写。因此用TermQuery查询的时候要先转成小写。 而使用QueryPa ...
分类:
Web程序 时间:
2017-08-11 20:30:47
阅读次数:
192
1.什么是solr 2.solr与lucene的区别 3.原理图 4.solr下载: 5.solr目录结构: 6.运行环境: ...
分类:
其他好文 时间:
2017-08-10 23:48:12
阅读次数:
209
在电商项目中,最核心的功能之一就是搜索功能,搜索做的好,整个电商平台就是个优秀的平台。一般搜索功能都使用搜索引擎如Lucene、solr、elasticsearch等,虽然这功能比较强大,但是对于一些小公司或者小的电商平台项目有点大材小用了,对于小项目我们可以采用折中的方法,使用ik+MySQL的搜 ...
分类:
数据库 时间:
2017-08-08 12:27:30
阅读次数:
250
使用Query子类查询 MatchAllDocsQuery TermQuery NumericRangeQuery BooleanQuery 使用QueryParser QueryParser MulitFieldQueryParser 先抽取公共代码 第一个MatchAllDoceQuery,是全 ...
分类:
Web程序 时间:
2017-08-07 22:18:39
阅读次数:
282