码迷,mamicode.com
首页 > 其他好文 > 详细

ElasticSearch初探(一)

时间:2015-06-18 19:48:49      阅读:163      评论:0      收藏:0      [点我收藏+]

标签:

ElasticSearch的官网
https://www.elastic.co/

一、安装
ElasticSearch是基于Lence的,而Lence是用Java编写的开源库,需要依赖Java的运行环境。现在使用的ELasticSearch版本是1.6,它需要jdk1.7或以上的版本。
本文使用的是linux系统,安装配置好Java环境,把download下来,解压后直接执行启动就可以了。


1.安装启动elasticsearch:
cd到elasticsearch-1.6.0.tar.gz 放置的目录,
解压 tar -xvf elasticsearch-1.6.0.tar.gz 
启动 ./elasticsearch-1.6.0/bin/elasticsearch,查看启动信息,会提到http的默认端口是9200,transport的默认端口是9300,这个非常重要。


接下来可以在Terminal输入一下命令,查看一些基本信息
查看集群
curl ‘localhost:9200/_cat/health?v‘
查看节点
curl ‘localhost:9200/_cat/nodes?v‘
查看索引
curl ‘localhost:9200/_cat/indices?v‘
以上这些信息均可在安装head插件后,在http://localhost:9200/_plugin/head/中查看

2. 安装head插件
cd到elasticsearch-1.6.0/bin目录,运行./plugin -install mobz/elasticsearch-head,
安装并启动elasticsearch后,在浏览器打开http://localhost:9200/_plugin/head/,即可看到es的集群、节点、索引、数据等等的信息。


二、基本操作
主要操作:增、删、改、查、批量操作、

1.建立索引:
 curl -XPUT ‘localhost:9200/megacorp/employee/8?pretty‘ -d ‘{
    "first_name" :  "Douglas",
    "last_name" :   "Fir",
    "age" :         35,
    "about":        "I like to build cabinets",
    "interests":  [ "forestry" ]
}‘
结果
{
  "_index" : "megacorp",
  "_type" : "employee",
  "_id" : "8",
  "_version" : 1,
  "created" : true
}
建立了索引_index为megacorp,类型_type为employee,_id为8的文档。带有一个pretty的参数,意思就是返回的结果格式化成json格式来显示。另外,请留意一下返回来的结果,有一个”_version”的字段,表示该条数据的版本号,现在这条数据是初次创建,所以其值为1。
而上述的三个节:_index, _type, _id是文档的元数据,也是必须的三个元数据节点。

注意:id仅仅是一个字符串,它与_index和_type组合时,就可以在ELasticsearch中唯一标识一个文档。当创建一个文档,你可以自定义_id,也可以让Elasticsearch帮你自动生成。但在一个type中,id必须是唯一的。重复运行上面的命令,返回的结果版本号会改变,如果内容有修改,则会覆盖掉原来的值。

2.删除
删除文档
curl -XDELETE ‘localhost:9200/megacorp/employee/3?pretty‘
删除类型
curl -XDELETE ‘localhost:9200/megacorp/employee
删除索引
curl -XDELETE ‘localhost:9200/megacorp

细心观察上面的指令,可以发现,指令的格式如下,它采用了REST的风格,使得使用者非常简单的可以学习这个命令。
curl -X :///

另外,删除文档还有一种方法,类似与sql的delete-where,命令如下
curl -XDELETE ‘localhost:9200/megacorp/employee/_query?pretty‘ -d ‘{
“query”: { “match”: { “first_name” : “Douglas” } }
}‘
这样就会删除employee类型中,所有first_name含Douglas关键字的文档。

3.查看索引中的文档:
curl -XGET ‘localhost:9200/megacorp/employee/8?pretty‘
結果:
{
  "_index" : "megacorp",
  "_type" : "employee",
  "_id" : "8",
  "_version" : 3,
  "found" : true,
  "_source":{
    "first_name" :  "Douglas",
    "last_name" :   "Fir",
    "age" :         35,
    "about":        "I like to build cabinets",
    "interests":  [ "forestry" ]
   }
}

4. 修改文档
1)可以重复运行上面建立索引的命令,即可覆盖原来的文档,起到修改的效果。
2)也可以使用下面的命令:
curl -XPUT ‘localhost:9200/megacorp/employee/8?pretty‘ -d ‘{
“doc”: {
    "first_name" :  "Douglas",
    "last_name" :   "Fir",
    "age" :         35,
    "about":        "I like to build cabinets update this document",
    "interests":  [ "forestry" ]
}
}‘
使用这样的方法更新数据,ElasticSearch不是在原来的文档进行覆盖,而是删除原来的文档,建立一个新的文档。

5. 批量操作
上面提到的都是一个命令执行单一的操作,没一次的操作都要发送一个请求,这样是非常消耗资源的,而ElasticSearch考虑到这一点,提供批量操作的接口,允许一次请求包含多个操作,并执行完所有操作后返回结果。
如:
curl -XPOST ‘localhost:9200/customer/external/_bulk?pretty‘ -d ‘ {"index":{"_id":"1"}} {"name": "John Doe" } {"index":{"_id":"2"}} {"name": "Jane Doe" } ‘
建立了索引的两个文档。
再如:
curl -XPOST ‘localhost:9200/customer/external/_bulk?pretty‘ -d ‘ {"update":{"_id":"1"}} {"doc": { "name": "John Doe becomes Jane Doe" } } {"delete":{"_id":"2"}} ‘
使用_bulk API实现批量操作,当请求包含多个操作,那些操作将会按顺序地执行,期间如果出现错误,则跳到下一个继续执行,直到所有操作执行完毕,所有操作的结果就会返回,从中我们就可以查看到各个操作的执行情况了。
以下就是上面第二条指令执行的结果:
{
  "took" : 6,
  "errors" : false,
  "items" : [ {
    "update" : {
      "_index" : "customer",
      "_type" : "external",
      "_id" : "1",
      "_version" : 4,
      "status" : 200
    }
  }, {
    "delete" : {
      "_index" : "customer",
      "_type" : "external",
      "_id" : "2",
      "_version" : 3,
      "status" : 200,
      "found" : true
    }
  } ]
}

还可以通过一个json文件导入数据,把上面命令-d后的信息放到一个.json的文件中,即可执行里面的相关操作。
curl -XPOST ‘localhost:9200/bank/account/_bulk?pretty‘ --data-binary @accounts.json

三、搜索
有两种基本的方式进行搜索,主要的区别就是发送参数的形式,一种是以REST 请求URI的形式传参,另一种则是以REST请求体的方式传参。使用请求体的方式传参,参数的表达式可以更丰富,而且可读性更好,一般推荐使用这种方式。

REST quest URI:
curl ‘localhost:9200/bank/_search?q=*&pretty‘
这命令的做的事情是,搜索出bank索引中所有的文档。

REST request body:
curl -XPOST ‘localhost:9200/bank/_search?pretty‘ -d ‘ { "query": { "match_all": {} } }‘

值得大家注意的一点是,当搜索结果返回后,elasticsearch就会结束这个请求,将不会在服务端缓存任何结果或保持请求的链接。
另外ElasticSearch还提供一种json风格的领域专用语言,供使用者实现查询,在ES中可成为Query DSL,功能非常强大,现在在这就先不详细说明了。



本文参考文章有:
https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html
http://learnes.net/getting_started/README.html

ElasticSearch初探(一)

标签:

原文地址:http://blog.csdn.net/l_gtim/article/details/46550765

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!