码迷,mamicode.com
首页 >  
搜索关键字:ik analyzer 2012 u5    ( 937个结果
操作lucene索引的工具类
话不多话都在注释上 public class OperatorIndex { public static final String INDEX_PATH = "D:/indexDir"; // 创建分词器 private Analyzer analyzer = null; // 索引保存目录 private File indexFile = null; // 目录对象...
分类:Web程序   时间:2014-12-17 14:39:43    阅读次数:272
HDU 5141 LIS again
Problem Description A numeric sequence of ai is ordered if a1a2…aN. Let the subsequence of the given numeric sequence (a1,a2,…,aN) be any sequence (ai1,ai2,…,aiK), where 1≤i1i2…iK≤N. For ex...
分类:其他好文   时间:2014-12-16 22:40:59    阅读次数:304
词法分析器
1 // lex_analyzer.cpp : 定义控制台应用程序的入口点。 2 //词法分析器 3 /* 4 sys: 5 1-10:关键字 6 10:标识符 7 11:数字 8 //比较区 9 20: 12 23:>= 13 24:= 14 25:== 15 //运算区 16...
分类:其他好文   时间:2014-12-16 20:46:09    阅读次数:192
[nlp相关] ansj-seg初探
最近又要做文本方面的处理,由于需求的定制化较高,还可能要放到集群上使用,所以不能再用公司封得严严密密、又笨又重的分词组件了。于是再次在网上找了一下能下载的分词工具,开源的:mmseg、IK_Analyzer、imdict、paoding、jcseg、free_ictclas、fnlp闭源的:NLPI...
分类:其他好文   时间:2014-12-16 17:00:10    阅读次数:6186
DB Query Analyzer 6.03, the most excellent Universal DB Access tools on any Microsoft Windows OS
From 6.01, DB Query Analyzer provides SQL Execute Schedule function to execute SQL scripts in certain time. Without changing any Windows OS settings or configurations, DB Query Analyzer 6.03 can run on any Microsoft Windows OS directly. DB Query Analyzer ...
分类:数据库   时间:2014-12-16 08:45:24    阅读次数:374
Shallow vs. Retained Heap
Shallow Heap和Retained Heap这两个名词在Java内存分析时经常遇到。本博文是Eclipse Memory Analyzer中关于Shallow Heap和Retained Heap帮助文档的翻译。 Shallow Heap是被一个对象消费的内存。Retained Heap是指X的Retained Set中所有对象的Shallow Size和。...
分类:其他好文   时间:2014-12-15 09:06:52    阅读次数:249
算法导论--------------LCS问题(最长公共子系列)
1、基本概念    一个给定序列的子序列就是该给定序列中去掉零个或者多个元素的序列。形式化来讲就是:给定一个序列X={x1,x2,……,xm},另外一个序列Z={z1、z2、……,zk},如果存在X的一个严格递增小标序列1,i2……,ik>,使得对所有j=1,2,……k,有xij = zj,则Z是X的子序列。例如:Z={B,C,D,B}是X={A,B,C,B,D,A,B}的一个子序列,相...
分类:编程语言   时间:2014-12-15 09:03:05    阅读次数:366
solr4.7中文分词器(ik-analyzer)配置
solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。一、版本信息solr版本:4.7.0需要ik-analyzer版本:IK Analyzer 2012FF_hf1ik-analyzer下载地址:...
分类:其他好文   时间:2014-12-12 16:35:14    阅读次数:273
IK分词源码讲解(七)-TokenStream以及incrementToken属性处理
首先介绍下在lucene中attributeSource的类层次: org.apache.lucene.util.AttributeSource ·        org.apache.lucene.analysis.TokenStream (implementsjava.io.Closeable) ·        org.apache.lucene.analysis.NumericTok...
分类:其他好文   时间:2014-12-11 19:14:11    阅读次数:388
IK分词源码讲解(一)-初始篇
IK分词全名为IK Analyzer,是由java编写的中文分词工具包,目前在lucene以及solr中用的比较多,本系列的文章主要对ik的核心源码进行解析讲解,与大家分享,如果有错误的地方还望指教。 先来个整体概况: 其实从上面的图可以看出,真实的ik的代码其实并不多,这样给我们开始接触心里压力就小的多。 先打开IKAnalzyerDemo.java文件,先大体看看IK的工作流...
分类:其他好文   时间:2014-12-09 19:46:10    阅读次数:287
937条   上一页 1 ... 83 84 85 86 87 ... 94 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!