码迷,mamicode.com
首页 >  
搜索关键字:flume 启动分析 flume源码    ( 1167个结果
使用hadoop平台进行小型网站日志分析
0.上传日志文件到linux中,通过flume将文件收集到hdfs中。 执行命令/home/cloud/flume/bin/flume-ng agent -n a4 -c conf -f /home/cloud/flume/conf/a4.conf -Dflume.root.logger=DEBUG,console 1.建立hive表 create external table bb...
分类:Web程序   时间:2015-03-28 08:51:36    阅读次数:156
flume-ng 自定义拦截器,对header中的字段进行正则匹配分离出更多header
代码如下: package com.wy.flume.interceptor; import java.util.List; import java.util.Map; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.apache.commons.lang.StringUtils...
分类:Web程序   时间:2015-03-18 07:53:03    阅读次数:2294
Erlang tool -- lager overload protection
log 这个事, 说大不大说小又不小. 大点的, 可以用scribe flume 这样的系统去做, 小点的, 也就打印一个调试信息而已. 在Erlang 中, log 这事情确实比较伤, error_logger 是个单点, io:format 容易导致节点崩溃. 在开源社区, lager 算是使用...
分类:其他好文   时间:2015-03-18 01:01:46    阅读次数:350
中小企业的大数据技术路线选择(二)-Cassandra+Presto方案
我前面曾经写过:中小企业的大数据技术路线选择 和 低调、奢华、有内涵的敏捷式大数据方案:Flume+Cassandra+Presto+SpagoBI 。前面用两个月的时间验证了Presto JDBC驱动、Prestogres和SHIB三种方案。Prestogres,可以使用PostgreSQL 客户端和JDBC驱动,支持SpagoBI等BI工具。但这种方式架构复杂,可能有性能瓶颈,无法发挥该方案的优势。SHIB现在代码量较小,在Team中有报表开发经验的成员即可上手。如果时间和人力允许,开发一个轻量级的Bi...
分类:其他好文   时间:2015-03-16 14:33:24    阅读次数:264
flume
1.flume是分布式的日志收集系统,把收集来的数据传送到目的地去。2.flume里面有个核心概念,叫做agent。agent是一个java进程,运行在日志收集节点。3.agent里面包含3个核心组件:source、channel、sink。3.1 source组件是专用于收集日志的,可以处理各种类...
分类:Web程序   时间:2015-03-14 18:17:59    阅读次数:186
flume_kafka_hdfs_hive数据的处理
使用flume收集数据,将数据传递给kafka和hdfs,kafka上的数据可以使用storm构建实时计算,而hdfs上的数据,经过MR处理之后可以导入hive中进行处理。 环境:hadoop1.2.1,hive 0.13.1,maven 3.2.5,flume 1.4,kafka 0.7.2,ec...
分类:Web程序   时间:2015-03-14 18:17:55    阅读次数:4961
【Flume】flume中transactionCapacity和batchSize概念的具体分析和解惑
不知道各位用过flume的读者对这两个概念是否熟悉了解 一开始本人的确有点迷惑,觉得这是不是重复了啊? 没感觉到transactionCapacity的作用啊? batchSize又是干啥的啊? …… …… 带着这些问题,我们深入源码来看一下: batchSize batchSize这个概念首先它出现在哪里呢? kafkaSink的process方法 HDFS Sink...
分类:Web程序   时间:2015-03-12 17:17:17    阅读次数:11871
HDFSEventSink目录设置功能实现源码分析
这里以按自定义头部的配置为例(根据某些业务不同写入不同的主目录)配置:source:interceptors=i1 interceptors.i1.type=regex_extractor interceptors.i1.regex=/apps/logs/(.*?)/ interceptors.i1.serializers=s1 interceptors.i1.serializers.s1.name=logtypenamesink:hdfs..
分类:其他好文   时间:2015-03-12 08:34:37    阅读次数:1480
flume自动reload配置的源码分析
在1.5.0的flume版本中开始提供这个功能,判断配置文件的更新时间戳来reload服务原理:1)在启动中使用EventBus.register注册Application对象,同时Application有一个Subscribe的方法handleConfigurationEvent(参数是MaterializedConfiguration对象)2)定义了一个计划任务线程..
分类:Web程序   时间:2015-03-12 01:06:34    阅读次数:245
flume服务管理实现分析
flume可以监控并管理组件的运行状态,在组件关闭的时候可以自动拉起来,原理是通过启动一个计划任务线程池(monitorService,线程的最大数量为30),运行监控线程(MonitorRunnable线程),每隔3s判断组件(包括Channel,SinkRunner)的状态是否符合要求(可用的状态由两种START和..
分类:Web程序   时间:2015-03-12 01:04:09    阅读次数:2319
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!