在学计算机新知识时,第一件事情就是要写一个 “Hello World”,同样,在 flume 中,它的 “Hello World” 就是 run it。
1、flume 基本概要
(1) flume 是做什么的?
flume 是 apach 的开源项目,它主要用来收集数据,即将来源于不同节点的数据汇聚到一个中心节点。
(2) 数据在 flume 内部传输过程中是否会丢失数据?
flume...
分类:
Web程序 时间:
2015-04-20 22:39:54
阅读次数:
233
flume写hdfs的操作在HDFSEventSink.process方法中,路径创建由BucketPath完成分析其源码(参考:http://caiguangguang.blog.51cto.com/1652935/1619539)可以使用%{}变量替换的形式实现,只需要获取event中时间字段(nginx日志的localtime)传入hdfs.path即可具体实现如下:1...
分类:
Web程序 时间:
2015-04-19 19:37:36
阅读次数:
156
flume打包遇到的一些问题1.ipc兼容性问题,线上使用2.3.0的hdfs,但是打包时默认为1.2.1的08Apr201519:38:25,122WARN[SinkRunner-PollingRunner-DefaultSinkProcessor](org.apache.flume.sink.hdfs.HDFSEventSink.process:455)-HDFSIOerror
org.apache.hadoop.ipc.RemoteExcept..
分类:
Web程序 时间:
2015-04-19 19:36:26
阅读次数:
256
Kafka日志包是提供的是日志管理系统。主要的类是LogManager——该类负责处理所有的日志,并根据topic/partition分发日志。它还负责flush策略以及日志保存策略。Kafka日志本身是由多个日志段组成(log segment)。一个日志是一个FileMessageSet,它包含了...
分类:
其他好文 时间:
2015-04-19 10:06:28
阅读次数:
2628
最近写完storm实时统计pv.uv.ip的项目后,前端服务器用flume进行收集,逐步把所有的服务器都增加上。增加的差不多时。Kafka报了如下类似错误:4709[main]WARNkafka.producer.async.DefaultEventHandler-Producerequestwithcorrelationid214faileddueto[datasift,0]:kafka.commo..
分类:
其他好文 时间:
2015-04-16 17:53:54
阅读次数:
174
最近写完storm实时统计pv.uv.ip的项目后,前端服务器用flume进行收集,逐步把所有的服务器都增加上。增加的差不多时。Kafka报了如下类似错误:4709[main]WARNkafka.producer.async.DefaultEventHandler-Producerequestwithcorrelationid214faileddueto[datasift,0]:kafka.commo..
分类:
其他好文 时间:
2015-04-16 17:51:53
阅读次数:
161
centos命令进入root用户su root1、 复制2、解压tar.gztar zxvf xxx.tar.gz3、文件操作-创建文件夹mkdir mkdir /usr/mkdir 文件名-移动文件mv [options] 源文件或目录 目标文件或目录—删除一个文件rm —删除一个文件夹 rm /...
分类:
Web程序 时间:
2015-04-15 21:22:43
阅读次数:
190
1.在官方网站上下载log4j.jar2.将log4j.jar 复制到WEB-INFO/lib文件夹下。3.建立log4j.properties文件,存放在src根目录下。填入如下文件信息:log4j.rootLogger=info, ServerDailyRollingFile, stdout l...
分类:
编程语言 时间:
2015-04-15 09:26:25
阅读次数:
138
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。当前Flume有两个版本Flume 0.9X版本的统称Flume...
分类:
Web程序 时间:
2015-04-14 19:35:33
阅读次数:
154