业务场景:需求:通过flume进行数据采集,将本地(windows服务器)不断产生的csv文件采集到hdfs上。问题:本地文件在生成的过程中,会出现文件名重复的现象。也就是说,在前一秒生成文件名为aaa.csv,该文件经过flume进行处理之后会进行文件名的更改,默认情况下文件名会更改为aaa.cs... ...
分类:
Web程序 时间:
2020-01-23 09:14:02
阅读次数:
290
记录一下日志采集框架flume的相关内容,flume是由Cloudera开发,后面贡献给了Apache,是一个分布式的、稳定的,用于日志采集、汇聚和传输的系统,现在用的一般是1.x版本,老版本的因为用得少暂时不考虑。 基本概念 包括agent和event。 Agent 以下是数据流模型图,sourc ...
分类:
Web程序 时间:
2020-01-22 23:36:22
阅读次数:
130
目录 一、背景 二、Flume的简介 三、Flume NG的介绍 3.1 Flume特点 3.2 Flume的一些核心概念 3.3 Flume NG的体系结构 3.4 Source 3.5 Channel 3.6 Sink 四、Flume的部署类型 4.1 单一流程 4.2 多代理流程(多个agen ...
分类:
Web程序 时间:
2020-01-22 10:51:06
阅读次数:
131
[toc] 学习文档参考:http://flume.apache.org/releases/content/1.9.0/FlumeUserGuide.html 1.Flume是什么? Flume简单概括就是一个收集日志的工具,它可以通过调用接口,RPC,还有网页的一些操作进行日志的收集。它是一个分布 ...
分类:
Web程序 时间:
2020-01-22 10:48:01
阅读次数:
158
在使用flume采集日志写入到hdfs时,用到了lzo压缩算法,这个算法将让保存的文件缩小为原文件的三分之一。由于此压缩算法不是hadoop默认的,需要另外安装,下面记录下,全文主要参考文末博文完成。 编译安装lzo和lzop 注意,有多少个节点,就安装多个少!注意,有多少个节点,就安装多个少!注意 ...
分类:
其他好文 时间:
2020-01-20 14:30:04
阅读次数:
88
工作方式 Flume-og采用了多Master的方式。为了保证配置数据的一致性,Flume引入了ZooKeeper,用于保存配置数据,ZooKeeper本身可保证配置数据的一致性和高可用,另外,在配置数据发生变化时,ZooKeeper可以通知Flume Master节点。Flume Master间使 ...
分类:
Web程序 时间:
2020-01-20 14:26:47
阅读次数:
98
Flume高可用集群 工欲善其事,必先利其器。感谢以下博主:https://www.cnblogs.com/qingyunzong/p/8994494.htmlhttps://blog.csdn.net/peng_0129/article/details/80793440https://blog.c ...
分类:
Web程序 时间:
2020-01-19 15:25:17
阅读次数:
128
单Master集群 多Master集群 硬件配置 测试环境单master,生产环境多master。避免单点故障。工作节点的服务器配置要求相对较高,用于运行实际业务。 单Master集群 集群架构图 多Master集群 集群架构图 多Master集群 集群架构图 集群机器规划图 硬件配置 生产环境最低 ...
分类:
Web程序 时间:
2020-01-18 16:16:57
阅读次数:
506
Flume: Flume是一种分布式的、可靠的、可用的服务,可以有效地收集、聚合和移动大量的日志数据。 它有一个基于流数据的简单而灵活的体系结构。 它具有健壮性和容错能力,具有可调的可靠性机制和许多故障转移和恢复机制。 它使用一个简单的可扩展数据模型,允许在线分析应用程序。 source:源 对ch ...
分类:
Web程序 时间:
2020-01-17 11:36:35
阅读次数:
104
接下去的几个实验中有好几个比较重点的,所以我单独开了一篇。 还是熟悉的套路,新建一个项目来完成这些实验吧!掌握这23个实验那ioc了解的也差不多啦!好记性不如烂笔头,别光看哦,要记得敲一敲! 1.导包 2.配置 3.测试 实验15.通过注释分别创建Dao、Service、Controller dao ...
分类:
编程语言 时间:
2020-01-15 12:14:13
阅读次数:
90