码迷,mamicode.com
首页 > 移动开发 > 详细

第三百六十四节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理

时间:2017-08-30 23:41:12      阅读:395      评论:0      收藏:0      [点我收藏+]

标签:一个   string   format   clu   bsp   ast   for   建立   ted   

第三百六十四节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理

 

1、映射(mapping)介绍

映射:创建索引的时候,可以预先定义字段的类型以及相关属性
elasticsearch会根据json源数据的基础类型猜测你想要的字段映射,将输入的数据转换成可搜索的索引项,mapping就是我们自己定义的字段数据类型,同时告诉elasticsearch如何索引数据以及是否可以被搜索


作用:会让索引建立的更加细致和完善


类型:静态映射和动态映射

 

 

2、内置映射类型(也就是数据类型)

string类型:text,keyword两种
  text类型:会进行分词,抽取词干,建立倒排索引
  keyword类型:就是一个普通字符串,只能完全匹配才能搜索到

数字类型:long,integer,short,byte,double,float

日期类型:date

bool(布尔)类型:boolean

binary(二进制)类型:binary

复杂类型:object,nested

geo(地区)类型:geo-point,geo-shape

专业类型:ip,competion

 

 

3、属性介绍
store属性
index属性
null_value属性
analyzer属性
include_in_all属性
format属性

技术分享

 

 

 

 

 

第三百六十四节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理

标签:一个   string   format   clu   bsp   ast   for   建立   ted   

原文地址:http://www.cnblogs.com/adc8868/p/7455613.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!