码迷,mamicode.com
首页 > 其他好文 > 详细

04.全文检索的原理-创建索引

时间:2017-02-18 11:05:46      阅读:216      评论:0      收藏:0      [点我收藏+]

标签:创建   不同   字母   分析   数据   关系   全文检索   分词   原理   

你要想查这个东西,得先把库建好。先创建索引再查询索引,这两部分。建立索引,先把文档内容里面的词找出来然后建立索引。我们这里就是一个分析的过程,分析怎么分析?词与词之间有空格,根据空格来把它分词就可以了。在关系型数据库中查询的时候大小写单词是没有关系的。在Java里面,大小写字母是不同字符串,都转换成大写或者都转换成小写都可以啊。但是你要统一一个大小写,统一完了之后你大写开头的单词(例如Lucene)和小写开头的单词(例如lucene)就是同一个单词。去除常用词,is或者a这些,没有什么实际意义,一般不会用它们来建立索引。

04.全文检索的原理-创建索引

标签:创建   不同   字母   分析   数据   关系   全文检索   分词   原理   

原文地址:http://www.cnblogs.com/ZHONGZHENHUA/p/6412601.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!