1、定义 Apache Flume是为有效收集聚合和移动大量来自不同源到中心数据存储而设计的可分布,可靠的,可用的系统。 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 2、架构图 3、常见概念理解 ①client:客户端,运行agent的地方,每台机器只运行一个agent ...
分类:
Web程序 时间:
2020-02-14 11:00:40
阅读次数:
89
电脑修好了,但之前落下的几天博客确实没啥补的劲头,今天先写一份报告吧。 实验内容和要求 安装 Flume 安装成功。 使用 Avro 数据源测试 Flume 配置文件 启动flume agent a1 创建指定的日志文件 客户端传输 传输完成 使用 netcat 数据源测试 Flume 创建exam ...
分类:
其他好文 时间:
2020-02-13 22:48:41
阅读次数:
83
1、将文件解压到/usr/local [root@localhost src]# tar -zxvf apache-flume-1.6.0-bin.tar.gz -C /usr/local/ 2、创建flume-env.sh文件,并设置jdk路径 [root@localhost local]# cp ...
分类:
Web程序 时间:
2020-02-13 15:09:49
阅读次数:
105
1、Flume简单介绍 Apache Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 2、Flume体系结构 ...
分类:
Web程序 时间:
2020-02-13 12:37:38
阅读次数:
78
使用 netcat 数据源测试 Flume 请对 Flume 的相关配置文件进行设置,从而可以实现如下功能:在一个 Linux 终端(这 里称为“Flume 终端”)中,启动 Flume,在另一个终端(这里称为“Telnet 终端”)中, 输入命令“telnet localhost 44444”,然 ...
分类:
Web程序 时间:
2020-02-12 23:59:56
阅读次数:
248
原理图: 概述 zabbix proxy可以代替zabbix server收集性能和可用性数据然后把数据汇报给zabbix server,并且在一定程度上分担了zabbix server的压力.此外,当所有agents和proxies报告给一个Zabbix server并且所有数据都集中收集时,使用 ...
分类:
其他好文 时间:
2020-02-10 09:40:02
阅读次数:
78
Flume 官网下载 Flume1.7.0 安装文件,下载地址如下: http://www.apache.org/dyn/closer.lua/flume/1.7.0/apache-flume-1.7.0-bin.tar.gz 下载后,把 Flume1.7.0 安装到 Linux 系统的“/usr/ ...
分类:
其他好文 时间:
2020-02-06 20:19:45
阅读次数:
95
今天主要进行了spark实验六的学习,Spark Streaming 编程初级实践 Flume 是非常流行的日志采集系统,可以作为 Spark Streaming 的高级数据源。请把 Flume Source 设置为 netcat 类型,从终端上不断给 Flume Source 发送各种消息,Flu ...
分类:
其他好文 时间:
2020-02-06 14:42:22
阅读次数:
107
今天主要完成了北京市政百姓信件分析实战。 Spark方面只是安装了Flume,以及尝试使用套接字流作为DSteam的数据源。 启动NetCat作为套接字的监听模式,这样在端口9999就能和spark互联。 值得一提,nc -l 9999 虽然也是适用的,-k是为了可以保持多个连接,所以应该还是必要的 ...
分类:
其他好文 时间:
2020-02-05 23:29:47
阅读次数:
86
今天完成了实验六 安装了Flume,Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 2. 使用 Avro 数据 ...
分类:
其他好文 时间:
2020-02-05 23:06:48
阅读次数:
83