码迷,mamicode.com
首页 > 其他好文 > 详细

ES学习(九)

时间:2019-12-30 19:45:10      阅读:94      评论:0      收藏:0      [点我收藏+]

标签:html标签   white   sim   同义词   htm   bsp   索引   standard   学习   

一、倒排索引

  A、建立前会进行normalization,也就是说对各个单词进行相应的处理(时态、大小写、同义词等),以提升后面搜索时候搜到相关文档的概率

二、分词器

  A、character filter:分词之前进行预处理,过滤html标签,&转换成and等等

  B、tokenizer:分词

  C、token filter: normalization的一些操作

三、内置分词器(默认:standard)

  A、standard analyzer

  B、simple analyzer

  C、whitespace analyzer

  D、language analyzer

三、query string会用跟建立倒排索引一样的分词器去分词 

ES学习(九)

标签:html标签   white   sim   同义词   htm   bsp   索引   standard   学习   

原文地址:https://www.cnblogs.com/DjanFey/p/12121010.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!