码迷,mamicode.com
首页 >  
搜索关键字:ik    ( 427个结果
solr中文分词
IK是solr常用的中文分词,其配置比较难搞,试了好多次才搞定:将jar放入tomcat下WEB-INF/libconfig.xml,ext.dic,stopword.dic放入WEB-INF/classes下另外,solr4+需要使用IK_2012_ff,不要使用IK_2012_u6IK实际的效果...
分类:其他好文   时间:2014-07-15 09:52:49    阅读次数:231
[ElasticSearch] 如何使用中文分詞ik與繁簡轉換stconvert插件
一. 環境安裝ElasticSearch(以下簡稱ES)安裝已經算相對簡單了, 但要使用需要配置的插件, 對剛入門的新手還是有點麻煩, 所幸medcl大神提供一個配置好的ES-rtf版本, 新手們在參數配置上浪費無謂的時間。Github上的elasticsearch-rtf , 裡面都有詳盡的使用說...
分类:其他好文   时间:2014-07-09 17:13:37    阅读次数:561
[Unity菜鸟] Final IK
由于本人英文较烂,边翻译用户手册边学习。用户手册IK ComponentsFinal IK 包含许多强大高速的IK组件AimAimIK solver是一个对CCD算法(cyclic coordinate decent循环坐标下降算法)的修正,通过旋转骨骼的层次结构,确定瞄准目标后子骨骼的Transf...
分类:其他好文   时间:2014-07-02 19:34:05    阅读次数:398
最长公共子序列问题LCS
最长公共子序列问题LCS   问题描述: 一个给定序列的子序列是在该序列中删去若干元素后得到的序列。确切地说,若给定序列X= { x1, x2,…, xm},则另一序列Z= {z1, z2,…, zk}是X的子序列是指存在一个严格递增的下标序列 {i1, i2,…, ik},使得对于所有j=1,2,…,k有 Xij=Zj。例如,序列Z={B,C,D,B}是序列X={A,B,C,B,D,...
分类:其他好文   时间:2014-05-25 06:26:52    阅读次数:229
当前几个主要的Lucene中文分词器的比较
1.基本介绍:paoding:Lucene中文分词“庖丁解牛” PaodingAnalysisimdict :imdict智能词典所采用的智能中文分词程序mmseg4j: 用 Chih-Hao Tsai 的 MMSeg 算法 实现的中文分词器ik :采用了特有的“正向迭代最细粒度切分算法“,多子处理...
分类:其他好文   时间:2014-05-24 11:47:16    阅读次数:358
Java实现使用IK Analyzer实现中文分词
需要在项目中引入:IKAnalyzer.cfg.xmlIKAnalyzer2012.jarlucene-core-3.6.0.jarstopword.dic什么都不用改示例代码如下(使用IK Analyzer):[java] view plaincopypackage com.haha.test; ...
分类:编程语言   时间:2014-05-22 05:58:40    阅读次数:392
Java实现使用IK Analyzer实现中文分词
需要在项目中引入:IKAnalyzer.cfg.xmlIKAnalyzer2012.jarlucene-core-3.6.0.jarstopword.dic什么都不用改示例代码如下(使用IKAnalyzer):[java]viewplaincopypackagecom.haha.test;importjava.io.IOException;importjava.io.StringReader;importorg.apache.lucene.analysis.Ana..
分类:编程语言   时间:2014-05-20 20:28:42    阅读次数:390
427条   上一页 1 ... 41 42 43
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!