Flume协作框架

时间：2016-11-25 12:19:18 阅读：290 评论：0 收藏：0 [点我收藏+]

1.概述　　

　　-》flume的三大功能
　　　　collecting, aggregating, and moving
　　　　　　收集聚合移动

2.框图

　　技术分享

3.架构特点
　　-》on streaming data flows
　　　　基于流式的数据
　　　　数据流：job-》不断获取数据
　　　　任务流：job1->job2->job3&job4

　　-》for online analytic application.

　　-》Flume仅仅运行在linux环境下
　　　　如果我的日志服务器是Windows？

　　-》非常简单
　　　　写一个配置文件，运行这个配置文件
　　　　source、channel、sink

　　-》实时架构
　　　　flume+kafka spark/storm impala

　　-》agent三大部分
　　　　-》source：采集数据，并发送给channel

　　　　-》channel：管道，用于连接source和sink的
　　　　-》sink：发送数据，用于采集channel中的数据

4.Event

　　技术分享

5.Source/Channel/Sink

　　技术分享

二：配置

1.下载解压

　　下载的是Flume版本1.5.0

　　技术分享

2.启用flume-env.sh

　　技术分享

3.修改flume-env.sh

　　技术分享

4.增加HADOOP_HOME

　　因为在env.sh中没有配置，选择的方式是将hdfs的配置放到conf目录下。

　　技术分享

5.放入jar包

　　技术分享

6.验证

　　技术分享

7.用法

　　技术分享

原文地址：http://www.cnblogs.com/juncaoit/p/6100744.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行