1.flume连接mysql驱动包准备 进入链接下载源码https://github.com/keedio/flume-ng-sql-source现在最新是1.5.3解压, 进入到目录中编译 直接编译可能报错,跳过test mvn package -DskipTests 2.flume与kafka, ...
分类:
数据库 时间:
2020-07-15 23:28:07
阅读次数:
166
1、flume日志收集架构如下 2、解压安装包,修改文件夹名称,配置环境变量 tar -zxvf apache-flume-1.6.0-bin.tar.gz export FLUME_HOME=/soft/flume export PATH=$PATH:$FLUME_HOME/bin 修改conf下 ...
分类:
Web程序 时间:
2020-07-10 18:37:36
阅读次数:
66
技巧 1、查看flume的metrics,确定每个flume节点数据是否被接收以及发送: {"SOURCE.src-1":{"OpenConnectionCount":"0", //目前与客户端或sink保持连接的总数量(目前只有avro source展现该度量)"Type":"SOURCE","A ...
分类:
Web程序 时间:
2020-07-08 15:23:06
阅读次数:
101
Linux部分 ①列举你使用的常用指令? ②怎么查看服务是否开启?后面的参数都是什么意思? ③怎么查看服务器内存使用情况? ④日志查看指令? ⑤跨机房怎么传输文件? Hadoop部分 ①怎么搭建一个Hadoop集群? ②Hadoop的Shuffer机制? ③切片概念?文件256M时,几个切片? ④M ...
分类:
其他好文 时间:
2020-07-08 13:03:03
阅读次数:
59
一.简单实现 需求:根据 flume 监控 exec 文件的追加数据,写入 kafka 的 test-demo 分区,然后启用 kafka-consumer 消费 test-demo 分区数据。 需求分析 1)flume的配置文件 在hadoop102上创建flume的配置文件 # define a ...
分类:
Web程序 时间:
2020-07-07 23:22:58
阅读次数:
79
Agent的配置文件最好根据Flume的拓扑架构,依次写好每个节点的配置文件; 一.Agent 开头都是先要定义agent,sorce,channel,sink名 # Name the components on this agent( 描述这个Agent,给各个组件取名字) a1.sources ...
分类:
Web程序 时间:
2020-07-06 01:18:20
阅读次数:
133
该程序使用工具为IDEA,Eclipse配置同理 该程序是一个Maven程序,通过Maven导包 步骤: 导入相关jar包 创建spring上下文配置 测试 导包 ? 通过该图了解到spring的核心容器是通过Beans、Core、Context以及SpEl 这四个组件构成的 他们对应的依赖如下 < ...
分类:
编程语言 时间:
2020-07-05 19:14:04
阅读次数:
65
一.Flume定义 ? Flume是Cloudera公司提供的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。 ? Flume最主要的作用就是,实时读取服务器的本地磁盘的数据,将数据写入到HDFS。 二.Flume基础架构 ? Flume基本组成架构如下 ...
分类:
Web程序 时间:
2020-07-03 23:51:14
阅读次数:
112
如果现在要想将flume中的sink设置为kafka,因为在实际的开发中,可能会有若干个子系统或者若干个客户端进行flume日志采集,那么能够承受这种采集任务量的只有kafka来完成,可是需要注意一个问题,现在的kafka是采用了Kerberos认证,所以要想在flume之中去使用kafka操作,就 ...
分类:
Web程序 时间:
2020-07-03 01:11:20
阅读次数:
154
Kafka在实际的开发之中的确可以处理千万级别的数据,但是现在有一个问题,这些数据从哪里来呢?Kafka产生的初衷是进行数据的收集以及合理的消费,但是这些实际之中的数据我们应该如何获取,我们该用什么样的方式来获取,而且最关键的是,如果现在是一个已经成型的系统(SSH、SSM、Spring),那么这个 ...
分类:
Web程序 时间:
2020-07-01 12:37:05
阅读次数:
61