码迷,mamicode.com
首页 > Web开发 > 详细

lucene进行索引的建议

时间:2015-10-20 10:24:44      阅读:223      评论:0      收藏:0      [点我收藏+]

标签:

Store和Index都是枚举类型,Store指定是否把当前属性的值的原始内容存在索引库中,如果存储Store.YES在搜索出相应数据的时候这个属性就有原始的值;如果不存储Store.NO,得到的数据的这个属性的值为null。Index是指是否建立索引(词汇表),建立了索引才能被搜索到,不可以不索引也不存储(没意义)。

Index.ANALYZED进行分词建立索引(数据分词后存储在索引中);

Index.NOT_ANALYZED不分词且索引(整个数据整体存储在索引中);

Index.ANALYZED_NO_NORMS:分词建立索引但是field的值中不存储norms.只取一个一个byte.

Field.Store.YES:存储字段值(未分词前的字段值)
Field.Store.NO:不存储,存储与索引没有关系;

如果要对某Field进行查找,那么一定要把Field.Index设置为TOKENIZED或UN_TOKENIZED。TOKENIZED会对Field的内容进行分词;而UN_TOKENIZED不会,只有全词匹配,该Field才会被选中。

建议:

  1. 尽量减少不必要的存储(文章内容)。
  2. 不需要检索的内容不要建立索引。
  3. 非文本格式需要提前转换
  4. 需要整体存放的内容不要分词。

NumericUtils:如果属性的类型不是字符串,则要先进转换,如果使用数字类型,使用numericUtis.

如果使用日期类型就是要用DateTools。

 

lucene进行索引的建议

标签:

原文地址:http://www.cnblogs.com/mggwct/p/4893908.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!