IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包。可与lucene配合使用。
项目地址:http://www.oschina.net/p/ikanalyzer/
下载页面:http://git.oschina.net/wltea/IK-Analyzer-2012FF
示例代码:
{CSDN:CODE:602681}
该代码的工程结构:下图...
分类:
其他好文 时间:
2015-02-11 18:44:37
阅读次数:
193
本文详细地介绍了“万能数据库查询分析器”,中文版本《DB 查询分析器》、英文版本《DB Query Analyzer》6.03如何灵活、快捷地操作国产达梦数据库。
万能数据库查询分析器的中英文 6.03版本已经完全兼容任何Microsoft的Windows操作系统系列,包括Windows 10、Windows 8、Windows 7、Vista、Windows XP、Windows 2003、Windows NT、Windows 98 。在Windows操作系统上运行时,不需要更改任何操作系统的设置。...
分类:
数据库 时间:
2015-02-06 08:19:36
阅读次数:
341
Elasticsearch的中文分词很烂,所以我们需要安装ik。首先从github上下载项目,解压:cd /tmpwget https://github.com/medcl/elasticsearch-analysis-ik/archive/master.zipunzip master.zipcd ...
分类:
其他好文 时间:
2015-02-05 20:22:04
阅读次数:
204
原始数据如下:
u1 a,d,b,c
u2 a,a,c
u3 b,d
u4 a,d,c
u5 a,b,c
计算公式使用:sim = U(i)∩U(j) / (U(i)∪U(j))
其中: (U(i)∪U(j)) = U(i) + U(j) - U(i)∩U(j)
原始的Hadoop实现需要5轮MR,优化后只需要两轮就可以完成。
之前的轮数过多,主要在于计算(U(i)∪U(j...
分类:
编程语言 时间:
2015-02-04 16:47:53
阅读次数:
527
配置的过程中出现了一些小问题,一下将详细讲下IK Analyzer的配置过程,配置非常的简单,但是首先主要你的Solr版本是哪个,如果是3.x版本的用IKAnalyzer2012_u6.zip如果是4.x版本的用IK Analyzer 2012FF_hf1.zip,一定要对应上,要不然会配置失败。以下是详细步骤:
1、下载IK Analyzer。
下载地址为:http://code.googl...
分类:
其他好文 时间:
2015-02-03 19:28:06
阅读次数:
223
今天我们实现一个简单的分词器,仅仅做演示使用功能如下:
1、分词按照空格、横杠、点号进行拆分;
2、实现hi与hello的同义词查询功能;
3、实现hi与hello同义词的高亮显示;
MyAnalyzer实现代码:
public class MyAnalyzer extends Analyzer {
private int analyzerType;
public MyAna...
分类:
Web程序 时间:
2015-01-28 11:14:45
阅读次数:
193
今天我们实现一个简单的分词器,仅仅做演示使用功能如下:
1、分词按照空格、横杠、点号进行拆分;
2、实现hi与hello的同义词查询功能;
3、实现hi与hello同义词的高亮显示;
MyAnalyzer实现代码:
public class MyAnalyzer extends Analyzer {
private int analyzerType;
public MyAna...
分类:
Web程序 时间:
2015-01-28 11:14:12
阅读次数:
172
针对solr的分词器比较多,其中最常用的的两个是mmseg4j和ik-analyzer,至于他们的区别可以网上查找比较下,这两个分词器都挺好用。我搭建的solr环境(上一篇)是4.10.3的最新版本,以下将详细说下mmseg4j的配置。
1.首先下载对应的jar包。
版本号一定要对应上否则可能会报错,下载地址为:http://code.google.com/p/mmseg4j/ 但是这个网址好...
分类:
其他好文 时间:
2015-01-25 11:12:29
阅读次数:
172
注:Elasticsearch版本:1.4.2一、安装与配置1.从https://github.com/medcl/elasticsearch-analysis-ik下载elasticsearch-analysis-ik-master.zip2.解压elasticsearch-analysis-ik...
分类:
其他好文 时间:
2015-01-23 19:40:16
阅读次数:
16588
万能数据库查询分析器的中英文 6.03版本已经完全兼容任何Microsoft的Windows操作系统系列,包括Windows 10、Windows 8、Windows 7、Vista、Windows XP、Windows 2003、Windows NT、Windows 98 。在Windows操作系统上运行时,不需要更改任何操作系统的设置。
本文详细地介绍了“万能数据库查询分析器”,中文版本《DB 查询分析器》、英文版本《DB Query Analyzer》6.03 在Windows 8上安装以及使...
分类:
数据库 时间:
2015-01-23 13:26:31
阅读次数:
325