1)启动zookeeper 演示用的话,直接启动kafka自带的zookeeper即可: cd kafkaDirectory/kafka_2.12-2.5.0 bin/zookeeper-server-start.sh config/zookeeper.properties 生产上建议连接到zook ...
分类:
其他好文 时间:
2020-06-21 15:31:46
阅读次数:
127
Beats介绍 Beats 是轻量型数据采集器,Beats 是一个免费且开放的平台,集合了多种单一用途数据采集器。它们从成百上千或成千上万台机器和系统向 Logstash 或 Elasticsearch 发送数据。 官网:https://www.elastic.co/cn/beats/ 文档:htt ...
分类:
其他好文 时间:
2020-06-21 13:39:09
阅读次数:
71
kafka 非常难,难在 broker 有角色之分,controller 起控制作用,难在副本有角色之分,leader 提供读写服务,所以 broker 会有状态的切换,副本也有状态的切换。 从一个具体的场景切入,4 节点集群(b1, b2, b3, b4),存在 1 个分区 tp0 分布在 (b1 ...
分类:
其他好文 时间:
2020-06-21 00:49:58
阅读次数:
77
消息中间件你知道多少?通过调研了解总结如下一、市场上的消息中间件产品有哪些。RabbitMQ Elang语言 高效 吞吐量RockMQ 阿里产品ActiveMQ 传统 实现JMS规范 Kafka 大数据 日志采集 二、消息中间件的优点。削峰 用于高并发场景,进行削峰异步 提供用户操作响应时间,优化用 ...
分类:
其他好文 时间:
2020-06-20 22:37:52
阅读次数:
84
脚本通过ssh检查大数据环境中各节点的相关实例是否运行正常,包括:zk、hadoop-ha、hdfs、yarn、hbase、hive-metastore、hiveserver2、kafka。 注意修改成自己的集群节点名称及kafka版本 #!/bin/bash # 定义机器名前缀 HN_PREFIX ...
分类:
系统相关 时间:
2020-06-20 16:44:49
阅读次数:
68
概念剖析 kafka的两种位移 关于位移(Offset),其实在kafka的世界里有两种位移: 分区位移:生产者向分区写入消息,每条消息在分区中的位置信息由一个叫offset的数据来表征。假设一个生产者向一个空分区写入了 10 条消息,那么这 10 条消息的位移依次是 0、1、…、9; 消费位移:消 ...
分类:
其他好文 时间:
2020-06-20 13:33:55
阅读次数:
60
根据IBM的统计报告显示,过去两年内,当今世界上90%的数据产生源于新设备、传感器以及技术的出现,数据增长率也会为此加速。而从技术上将,这意味着大数据领域,处理这些数据将变得更加复杂和具有挑战性。例如移动应用广告、欺诈检测、出租车预订、患者监控等场景处理时,需要对实时数据进行实时处理,以便做出快速可行的决策。目前业界有开源不少实时计算引擎,以Apache基金会的两款开源实时计算引擎最受欢迎,它们分
分类:
其他好文 时间:
2020-06-20 09:12:52
阅读次数:
230
本章要说的HW和LEO和ISR有关联,ISR之前总结过,这里不再说。 HW High Watermark(高水位),用于标识特定的offset,消费者只能拉取到HW之前的消息 LEO Log End Offset,某个分区要写入下一条消息的offset LSO Log Start Offset ,某 ...
分类:
其他好文 时间:
2020-06-19 22:52:13
阅读次数:
98
概念剖析 kafka的两种位移 关于位移(Offset),其实在kafka的世界里有两种位移: 分区位移:生产者向分区写入消息,每条消息在分区中的位置信息由一个叫offset的数据来表征。假设一个生产者向一个空分区写入了 10 条消息,那么这 10 条消息的位移依次是 0、1、…、9; 消费位移:消 ...
分类:
其他好文 时间:
2020-06-19 19:22:25
阅读次数:
64
1. 下载软件包 cd /usr/local/elk/ # 先导航到要存放的目录下 wget https://artifacts.elastic.co/downloads/logstash/logstash-7.7.1.tar.gz # 下载 tar -xzf logstash-7.7.1.tar. ...
分类:
其他好文 时间:
2020-06-19 16:27:53
阅读次数:
243