Elasticsearch管理中索引的管理非常重要。基于磁盘空间和性能的考量,索引的生命周期管理显得尤为重要。Curator允许对索引创建、删除等操作,下面是我们借助 elasticsearch-curator 插件来定期删除index.本文主要介绍elasticsearch-curator 插件的 ...
分类:
其他好文 时间:
2020-06-15 16:06:21
阅读次数:
138
代码: import re import datetime from pyspark.sql import SparkSession from pyspark import SparkContext from elasticsearch import Elasticsearch spark=Spar ...
分类:
编程语言 时间:
2020-06-14 17:09:05
阅读次数:
125
ELK是日志分析平台,不是一款软件,而是一整套解决方案,是三个软件产品的首字母缩写,ELK分别代表:Elasticsearch:负责日志检索和储存 (ELK的核心)Logstash:负责日志的收集和分析、处理Kibana:负责日志的可视化beats是elastic公司开源的一款采集系统监控数据的代理 ...
分类:
其他好文 时间:
2020-06-13 21:39:00
阅读次数:
111
集群节点 ELasticsearch的集群是由多个节点组成的,通过cluster.name设置集群名称,并且用于区分其它的集群,每个节点 通过node.name指定节点的名称。 在Elasticsearch中,节点的类型主要有4种: master节点 配置文件中node.master属性为true( ...
分类:
其他好文 时间:
2020-06-13 19:47:58
阅读次数:
64
软件包使用说明 说明: 1.这里采用离线安装所有的软件(elasticsearch、fluentd、kibana、jdk),且使用rpm包方式进行安装。 本文所使用软件包 下载链接 提取码:uq8o 软件版本: Software Version MD5 jdk 1.8.0_211 561abbcd9 ...
分类:
其他好文 时间:
2020-06-13 17:37:21
阅读次数:
68
# Elasticsearch Configuration # # NOTE: Elasticsearch comes with reasonable defaults for most settings. # Before you set out to tweak and tune the con ...
分类:
其他好文 时间:
2020-06-13 16:02:42
阅读次数:
62
全文搜索介绍 全文搜索两个最重要的方面是: 相关性(Relevance) 它是评价查询与其结果间的相关程度,并根据这种相关程度对结果排名的一种能力,这 种计算方式可以是 TF/IDF 方法、地理位置邻近、模糊相似,或其他的某些算法。 分词(Analysis) 它是将文本块转换为有区别的、规范化的 t ...
分类:
其他好文 时间:
2020-06-13 13:21:20
阅读次数:
86
elasticsearch 单节点搭建与爬坑记录 prepare 虚拟机或者云服务器(这里用的是阿里云ECS) linux centos7 安装完毕的jdk 相应的安装包(在https://www.cnblogs.com/G-Aurora/p/13099459.html中有快速下载的镜像站) ps. ...
分类:
其他好文 时间:
2020-06-13 00:41:54
阅读次数:
55
解决只能通过localhost访问Elasticsearch的问题 在默认情况下Elasticsearch是无法通过外网访问的 需要绑定地址,原因如下: 具体方法为: vim /opt/es/elasticsearch-5.1.2/config/elasticsearch.yml 注意前面是我自己的 ...
分类:
其他好文 时间:
2020-06-13 00:22:29
阅读次数:
221
1 /** 2 * 批量更新文档 3 * 4 * @param index ES索引 5 * @param documents 待提交的批量文档 6 * @param uuidKey 文档中ID字段对应的key值 7 */ 8 public BulkResponse updateDocumentsA ...
分类:
其他好文 时间:
2020-06-12 11:13:28
阅读次数:
119