先给出答案: 需要结合具体使用的source、channel和sink来分析,具体结果可看本文最后一节。 Flume事务 ====================== 一提到事务,我们首先就想到的是MySQL中的事务, 事务就是将一批操作做成原子性的 ,即这一批要么都成功,要么都失败。 同样的道理, ...
分类:
Web程序 时间:
2020-01-24 00:14:47
阅读次数:
972
本文对flume进行安装部署 flume是什么?传送门: 0、要安装部署在日志所在的服务器,或者把日志发送到日志所在的节点上 安装前准备 1) Flume官网地址 2)文档查看地址 3)下载地址 1、将apache flume 1.7.0 bin.tar.gz上传到linux的/opt/softwa ...
分类:
Web程序 时间:
2020-01-23 12:38:37
阅读次数:
110
flume 1.1 Flume定义 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的 海量日志采集、聚合和传输的系统 。Flume基于流式架构,灵活简单。 大数据框架大致分为3类: 数据的采集和传输:flume 数据的存储:HDFS 数据的计算:MapReduce 1.2 应用场景 ...
分类:
Web程序 时间:
2020-01-23 12:37:38
阅读次数:
103
业务场景:需求:通过flume进行数据采集,将本地(windows服务器)不断产生的csv文件采集到hdfs上。问题:本地文件在生成的过程中,会出现文件名重复的现象。也就是说,在前一秒生成文件名为aaa.csv,该文件经过flume进行处理之后会进行文件名的更改,默认情况下文件名会更改为aaa.cs... ...
分类:
Web程序 时间:
2020-01-23 09:14:02
阅读次数:
290
记录一下日志采集框架flume的相关内容,flume是由Cloudera开发,后面贡献给了Apache,是一个分布式的、稳定的,用于日志采集、汇聚和传输的系统,现在用的一般是1.x版本,老版本的因为用得少暂时不考虑。 基本概念 包括agent和event。 Agent 以下是数据流模型图,sourc ...
分类:
Web程序 时间:
2020-01-22 23:36:22
阅读次数:
130
目录 一、背景 二、Flume的简介 三、Flume NG的介绍 3.1 Flume特点 3.2 Flume的一些核心概念 3.3 Flume NG的体系结构 3.4 Source 3.5 Channel 3.6 Sink 四、Flume的部署类型 4.1 单一流程 4.2 多代理流程(多个agen ...
分类:
Web程序 时间:
2020-01-22 10:51:06
阅读次数:
131
[toc] 学习文档参考:http://flume.apache.org/releases/content/1.9.0/FlumeUserGuide.html 1.Flume是什么? Flume简单概括就是一个收集日志的工具,它可以通过调用接口,RPC,还有网页的一些操作进行日志的收集。它是一个分布 ...
分类:
Web程序 时间:
2020-01-22 10:48:01
阅读次数:
158
在使用flume采集日志写入到hdfs时,用到了lzo压缩算法,这个算法将让保存的文件缩小为原文件的三分之一。由于此压缩算法不是hadoop默认的,需要另外安装,下面记录下,全文主要参考文末博文完成。 编译安装lzo和lzop 注意,有多少个节点,就安装多个少!注意,有多少个节点,就安装多个少!注意 ...
分类:
其他好文 时间:
2020-01-20 14:30:04
阅读次数:
88
工作方式 Flume-og采用了多Master的方式。为了保证配置数据的一致性,Flume引入了ZooKeeper,用于保存配置数据,ZooKeeper本身可保证配置数据的一致性和高可用,另外,在配置数据发生变化时,ZooKeeper可以通知Flume Master节点。Flume Master间使 ...
分类:
Web程序 时间:
2020-01-20 14:26:47
阅读次数:
98
Flume高可用集群 工欲善其事,必先利其器。感谢以下博主:https://www.cnblogs.com/qingyunzong/p/8994494.htmlhttps://blog.csdn.net/peng_0129/article/details/80793440https://blog.c ...
分类:
Web程序 时间:
2020-01-19 15:25:17
阅读次数:
128