在上一篇HelloWorld的基础上,建立一个directory的包,添加一个DirectoryTest的测试类,用来根据指定的索引目录创建目录存放指引.
DirectoryTest类中的代码如下,基本上就是在HelloWorld的基础上改改就可以了.
里面一共三个方法,testDirectory(),测试创建索引库;testDirectoryFSAndRAM(),结合...
分类:
Web程序 时间:
2014-12-31 13:05:59
阅读次数:
168
在创建索引库的基础上,加上中文分词器的,更好的支持中文的查询。引入jar包je-analysis-1.5.3.jar,极易分词.还是先看目录。
建立一个分词器的包,analyzer,准备一个AnalyzerTest的类.里面的代码如下,主要写了一个testAnalyzer的方法,测试多种分词器对于中文和英文的分词;为了可以看到效果,所以写了个analyze()的方法,将...
分类:
Web程序 时间:
2014-12-31 13:05:16
阅读次数:
244
这个问题想必大家都被问过无数次。今天来总结一下。 1.myisam: 文件结构:frm,myi,myd frm是文件信息,myi是索引文件,myd是数据文件。(5.6之前只有myisam支持全文检索。Innodb不支持全文检索,5.6以后开始支持。...
分类:
数据库 时间:
2014-12-29 06:45:34
阅读次数:
163
ElasticSearch也是一款非常优秀的开源的全文检索框架,以大名鼎鼎的ApacheLucene为基础,高度封装了更丰富,易用的API,同时与ApacheSolr一样,提供了非常强大的分布式集群功能!有不懂ElasticSearch(下文简称es)是干啥的朋友,可以点此链接在百科上先大致了解下。下面进入正..
分类:
其他好文 时间:
2014-12-27 06:49:34
阅读次数:
318
AC自动机,静态数组,动态分配TLE。 1 /* 1277 */ 2 #include 3 #include 4 #include 5 #include 6 #include 7 using namespace std; 8 9 #define MAXL 60005 1...
分类:
其他好文 时间:
2014-12-26 22:55:42
阅读次数:
158
ElasticSearch也是一款非常优秀的开源的全文检索框架,以大名鼎鼎的Apache Lucene为基础,高度封装了更丰富,易用的API,同时与Apache Solr一样,提供了非常强大的分布式集群功能!有不懂ElasticSearch(下文简称es)是干啥的朋友,可以点此链接在百科上先大致了解...
分类:
其他好文 时间:
2014-12-26 21:30:33
阅读次数:
261
1、简单介绍 JFinal + mysql + jsp druid 连接池 ehcache 缓存 require.js ajaxfileupload 上传 ztree 树形插件 KindEditor 编辑器 Tinymce 编辑器 syntaxhighlighter 代码高亮 Lucene 全文检索 IK Analyzer 分词...
分类:
编程语言 时间:
2014-12-26 09:47:20
阅读次数:
236
前一阵子尝试使用了一下Sphinx,一个能够被各种语言(PHP/Python/Ruby/etc)方便调用的全文检索系统。网上的资料大多是在linux环境下的安装使用,当然,作为生产环境很有必要部署在*nix环境下,作为学习测试,还是windows环境比较方便些。本文旨在提供一种便捷的方式让Sphin...
Sphinx中文分词在discuz中的应用。Sphinx-for-chinese是一款专注于中文搜索的全文检索软件,在sphinx的基础上添加了中文处理模块并优化了中文搜索效果。相比而言,以某某论坛几千万数据环境来看,比Coreseek封装的sphinx中文分词+mmseg3组合要好一点1.准备环境cd/var/tmp/
wget..
分类:
Web程序 时间:
2014-12-23 17:34:27
阅读次数:
248
本文转载自:http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623596.htmlLucene总的来说是:一个高效的,可扩展的,全文检索库。全部用Java实现,无须配置。仅支持纯文本文件的索引(Indexing)和搜索(Search)...
分类:
Web程序 时间:
2014-12-23 10:20:39
阅读次数:
220