码迷,mamicode.com
首页 > 其他好文 > 详细

Lucene中TokenStream,Tokenizer,TokenFilter,TokenStreamComponents与Analyzer

时间:2014-06-26 13:19:13      阅读:177      评论:0      收藏:0      [点我收藏+]

标签:lucene   分词   

TokenStream extends AttributeSource implements Closeable:
incrementToken,end,reset,close
Tokenizer直接继承至TokenStream,其输入input是一个reader
TokenFilter也直接继承TokenStream,但input是一个TokenStream。
TokenStreamComponents其实是将tokenizer和tokenfilter包装起来的(也可以只是tokenizer,两个成员叫source和sink),可以setReader,getTokenStream方法返回sink。
Analyzer就是一个TokenStreamComponents的容器,因此需要确定ReuseStrategy,重写createComponents(fieldName,reader)方法,使用时调用tokenStream(fieldName,reader)方法获取TokenStream就可以了。

Lucene中TokenStream,Tokenizer,TokenFilter,TokenStreamComponents与Analyzer,布布扣,bubuko.com

Lucene中TokenStream,Tokenizer,TokenFilter,TokenStreamComponents与Analyzer

标签:lucene   分词   

原文地址:http://blog.csdn.net/jollyjumper/article/details/34563275

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!