码迷,mamicode.com
首页 >  
搜索关键字:ik analyzer    ( 910个结果
DB Query Analyzer 6.03, the most excellent Universal DB Access tools on any Microsoft Windows OS
From 6.01, DB Query Analyzer provides SQL Execute Schedule function to execute SQL scripts in certain time. Without changing any Windows OS settings or configurations, DB Query Analyzer 6.03 can run on any Microsoft Windows OS directly. DB Query Analyzer ...
分类:数据库   时间:2014-12-16 08:45:24    阅读次数:374
Shallow vs. Retained Heap
Shallow Heap和Retained Heap这两个名词在Java内存分析时经常遇到。本博文是Eclipse Memory Analyzer中关于Shallow Heap和Retained Heap帮助文档的翻译。 Shallow Heap是被一个对象消费的内存。Retained Heap是指X的Retained Set中所有对象的Shallow Size和。...
分类:其他好文   时间:2014-12-15 09:06:52    阅读次数:249
算法导论--------------LCS问题(最长公共子系列)
1、基本概念    一个给定序列的子序列就是该给定序列中去掉零个或者多个元素的序列。形式化来讲就是:给定一个序列X={x1,x2,……,xm},另外一个序列Z={z1、z2、……,zk},如果存在X的一个严格递增小标序列1,i2……,ik>,使得对所有j=1,2,……k,有xij = zj,则Z是X的子序列。例如:Z={B,C,D,B}是X={A,B,C,B,D,A,B}的一个子序列,相...
分类:编程语言   时间:2014-12-15 09:03:05    阅读次数:366
solr4.7中文分词器(ik-analyzer)配置
solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。一、版本信息solr版本:4.7.0需要ik-analyzer版本:IK Analyzer 2012FF_hf1ik-analyzer下载地址:...
分类:其他好文   时间:2014-12-12 16:35:14    阅读次数:273
IK分词源码讲解(七)-TokenStream以及incrementToken属性处理
首先介绍下在lucene中attributeSource的类层次: org.apache.lucene.util.AttributeSource ·        org.apache.lucene.analysis.TokenStream (implementsjava.io.Closeable) ·        org.apache.lucene.analysis.NumericTok...
分类:其他好文   时间:2014-12-11 19:14:11    阅读次数:388
IK分词源码讲解(一)-初始篇
IK分词全名为IK Analyzer,是由java编写的中文分词工具包,目前在lucene以及solr中用的比较多,本系列的文章主要对ik的核心源码进行解析讲解,与大家分享,如果有错误的地方还望指教。 先来个整体概况: 其实从上面的图可以看出,真实的ik的代码其实并不多,这样给我们开始接触心里压力就小的多。 先打开IKAnalzyerDemo.java文件,先大体看看IK的工作流...
分类:其他好文   时间:2014-12-09 19:46:10    阅读次数:287
3.Lucene3.x API分析,Director 索引操作目录,Document,分词器
?? 1  Lucene卡发包结构分析 包名 功能 org.apache.lucene.analysis Analysis提供自带的各种Analyzer org.apache.lucene.collation 包含collationKey...
分类:Windows程序   时间:2014-12-08 00:55:24    阅读次数:390
介绍.NET 开发必备工具 .NET Portability Analyzer
随着.NET的原来越开放,不仅仅是开源这么简单了,也意味着.NET程序员要关注越来越多的平台,涵盖.NET Mic Framework, Xamarin,Mono,.NET等等,从windows到linux,mac,从嵌入式到移动设备、PC 、小型机服务器等等复杂的环境,如何让我们的代码在所有的平台...
分类:Web程序   时间:2014-12-07 19:01:35    阅读次数:211
[Elasticsearch] 全文搜索 (四) - 控制分析及相关度
控制分析(Controlling Analysis) 查询只能摘到真实存在于倒排索引(Inverted Index)中的词条(Term),因此确保相同的分析过程会被适用于文档的索引阶段和搜索阶段的查询字符串是很重要的,这样才能够让查询中的词条能够和倒排索引中的词条匹配。 尽管我们说的是文档(Document),解析器(Analyzer)是因字段而异的(Determined per Fi...
分类:其他好文   时间:2014-12-06 11:27:30    阅读次数:319
Lucence.net索引技术 二
一、 Lucene索引创建和优化 [版本2.9.0以上]Lucene索引的创建首先需要取得几个必须的对象:1、分词器//可以采用其他的中文分词器StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);//分词器...
分类:Web程序   时间:2014-12-03 18:38:58    阅读次数:245
910条   上一页 1 ... 81 82 83 84 85 ... 91 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!