第四天kafka知识 Producer基础的案例 1 Producer的小案例 电商系统,会员,凡是能登录的人都是会员。 你消费了多少钱,那么就给给你累计多少积分。 比如,你消费了1000块钱,那么同时给你找个会员号1000积分 1.1 在kafka里面,我们发送消息的时候,可以给消息指定key,也 ...
分类:
其他好文 时间:
2020-06-23 01:14:29
阅读次数:
76
elk系统logstash日志处理端使用lvs做的负载均衡,端口监控发现logstash节点因为最大文件数到达限制挂了一台,lvs不知道后端的logstash挂了。看告警虚拟IP恢复是因为转发到正常的节点了,端口监控后续就一直告警波动恢复告警--!,因为lvs没有移除故障节点,处理不及时,丢的数据就多了。这边用利用ssh免密做的监控,后端RealServer不能禁止lvs禁止访问22端口,lvs定
分类:
其他好文 时间:
2020-06-22 19:11:06
阅读次数:
82
一、Kafka持久化概述 Kakfa 依赖文件系统来存储和缓存消息。对于硬盘的传统观念是硬盘总是很慢,基于文件系统的架构能否提供优异的性能?实际上硬盘的快慢完全取决于使用方式。同时 Kafka 基于 JVM 内存有以下缺点: 对象的内存开销非常高,通常是要存储的数据的两倍甚至更高 随着堆内数据的增加 ...
分类:
其他好文 时间:
2020-06-22 18:56:23
阅读次数:
70
恢复内容开始 kafka源码解读 一. 概述 1.前言 在大数据的场景里面如何应对数据激增,数据复杂度增加以及数据变化速率变快,这都是体现了大 数据架构师,Java架构师的功力。而Kafka能很好的解决这些问题。 Kafka的源码是众多开源的技术里面代码质量比较高的一个,所以本身研究它的源码就比较有 ...
分类:
其他好文 时间:
2020-06-22 12:49:59
阅读次数:
79
Kafka架构在硬件选择方面,以重要性顺序考虑以下4点: 1) 磁盘(最重要)。影响最大的事生产者,读写速度。需参考多个分区、多个目录,如一个分区每天生产1TB数据,10天就是10GB,再乘以分区数量。 2)网络。生产者、消费者写入、读取速度 3)内存。影响消费者,因为生产者如果写不了内存可以写磁盘 ...
分类:
其他好文 时间:
2020-06-22 01:34:55
阅读次数:
49
数据来源层 数据库 日志 视频,ppt 数据传输层 Sqoop数据传递 Flume日志收集 kafka消息队列 数据存储层 HDFS文件存储 HBase非关系型数据库 kafka(存储少量数据) 资源管理层 YARN资源管理 数据计算层 MapReduce离线计算 Hive数据查询 Mahout数据 ...
分类:
其他好文 时间:
2020-06-22 00:56:04
阅读次数:
83
对于消息组件,如果按照最初的设计来讲,性能最高得就是RabbitMQ,因为RabbitMQ设计比较完整,而Kafka不同,Kafka最初的设计最大的坑:没有安全认证,所以最初的一些系统设计的时候为了考虑到安全性,所以采用了性能较差的ssl认证方式来进行出来,也就是说使用证书的方式来处理认证操作。 如 ...
分类:
其他好文 时间:
2020-06-21 23:22:34
阅读次数:
81
$ cat -n config/server.properties broker.id=0 // broker ID, 集群模式下该ID必须唯一,且永恒不变 listeners=PLAINTEXT://your_host_name:9092 // 配置你的应用所在IP地址,我理解为访问白名单配置 z ...
分类:
其他好文 时间:
2020-06-21 19:35:58
阅读次数:
133
kafka基本命令查看博客《kafka2.5.0基本命令》 本博文所使用kafka版本2.5.0,操作系统centos8. 1)创建主题 创建my-topic主题,该主题有 1 个副本,8个分区: $ bin/kafka-topics.sh --create --bootstrap-server l ...
分类:
其他好文 时间:
2020-06-21 17:51:35
阅读次数:
59