package com.dubbo.analyzer.executor;import java.util.concurrent.ArrayBlockingQueue;import java.util.concurrent.RejectedExecutionHandler;import java.ut...
分类:
编程语言 时间:
2015-01-07 12:28:17
阅读次数:
260
Analysis 和Analyzer analysis: 1,对文本分词,分成适合做倒排索引的词语。 2,对词语做标准化(normalizing),比如统一大小写、缩写转换等。这样做的目的是为了提升可搜索的能力。 Analyzer: Analyzer对docum...
分类:
其他好文 时间:
2015-01-06 21:42:51
阅读次数:
262
在创建索引库的基础上,加上中文分词器的,更好的支持中文的查询。引入jar包je-analysis-1.5.3.jar,极易分词.还是先看目录。
建立一个分词器的包,analyzer,准备一个AnalyzerTest的类.里面的代码如下,主要写了一个testAnalyzer的方法,测试多种分词器对于中文和英文的分词;为了可以看到效果,所以写了个analyze()的方法,将...
分类:
Web程序 时间:
2014-12-31 13:05:16
阅读次数:
244
SQL Performance Impact Analyzer Report...
分类:
数据库 时间:
2014-12-28 18:18:46
阅读次数:
316
1、简单介绍 JFinal + mysql + jsp druid 连接池 ehcache 缓存 require.js ajaxfileupload 上传 ztree 树形插件 KindEditor 编辑器 Tinymce 编辑器 syntaxhighlighter 代码高亮 Lucene 全文检索 IK Analyzer 分词...
分类:
编程语言 时间:
2014-12-26 09:47:20
阅读次数:
236
1.Analyzer:分析器 2.matchVersion:所用Lucene的版本 3.ramBufferSizeMB:随机内存 默认为16M. 用于控制buffer索引文档的内存上限,如果buffer的索引文档个数到达该上限就写入硬盘。当然,一般来说越大索引速度越快 4.max...
分类:
其他好文 时间:
2014-12-25 17:55:57
阅读次数:
133
#includeint main(){int i,j;char k[10],t;printf("请输入10个字符多余无效(单个字母或数字):\n");for(i=0;ik[j]){t=k[i];k[i]=k[j];k[j]=t;}}}printf("按照ASCII代码表规则排序:\n");for(i...
分类:
编程语言 时间:
2014-12-22 00:51:13
阅读次数:
240
描述: 在Linux环境下实现高速的全文检索一、当前环境: CentOS (Linux) 6.3 64 bit二、所需软件1、Java的JDK2、Solr最新稳定版Solr-4.53、Tomcat最新稳定版Tomcat-7.0.424、IK Analyzer最新稳定版分词器IKAnalyze...
分类:
其他好文 时间:
2014-12-21 19:23:48
阅读次数:
259
一、lucene建立索引过程:1、解析器用来解析物理文件,从中提取出所需的文本,其作用于物理文件;2、分析器用来分析文本内容(文字),其作用于解析器处理物理文件之后生成的文本;Lucene没有自己开发语言分析程序,JavaCC来生成分析器;分析器(analyzer)主要包含分词器和过滤器。分析器使用...
分类:
Web程序 时间:
2014-12-19 17:16:02
阅读次数:
198
在网上下载了lucene当前最新版本4.0,以及IKAnalyzer中文分词器的完整发布包。运行之后发现异常:Exception in thread "main" java.lang.VerifyError: class org.wltea.analyzer.lucene.IKAnalyzer ov...
分类:
Web程序 时间:
2014-12-18 16:29:35
阅读次数:
1432