码迷,mamicode.com
首页 >  
搜索关键字:flume hdfssink    ( 1092个结果
Hadoop日志分析系统启动脚本
Hadoop日志分析系统启动脚本 #!/bin/bash #Flume日志数据的根目录 root_path=/flume #Mapreduce处理后的数据目录 process_path=/process #hive分区时间 partition=`date "+%Y-%m-%d"` #获取前一小时的时间:/YYYY-MM-DD/HH file_path=`date -d "1 hour ...
分类:其他好文   时间:2014-10-16 19:41:13    阅读次数:202
flume发送与接受日志
apache-flume-1.5.0.1-bin.tar.gz日志接收端1.修改配置文件cp flume-conf.properties.template flume-conf.propertiesvim flume-conf.propertiescollector1.sources = AvroI...
分类:Web程序   时间:2014-10-15 23:13:11    阅读次数:271
flume学习安装
最近项目组有需求点击流日志需要自己收集,学习了一下flume并且安装成功了。相关信息记录一下。...
分类:Web程序   时间:2014-10-15 20:14:11    阅读次数:227
maven笔记——Failed to execute goal org.apache.rat:apache-rat-plugin:0.7:check (verify.rat) on project flume-ng-c
解决办法: 在每个新建的类的第一行加入以下内容即可/* * Licensed to the Apache Software Foundation (ASF) under one * or more contributor license agreements. See the NOTICE fi.....
分类:Web程序   时间:2014-10-15 13:06:10    阅读次数:519
Spark Streaming 结合FlumeNG使用实例
SparkStreaming是一个对实时数据流进行高通量、容错处理的流式处理系统,可以对多种数据源(如Kdfka、Flume、Twitter、Zero和TCP 套接字)进行类似map、reduce、join、window等复杂操作,并将结果保存到外部文件系统、数据库或应用到实时仪表盘。Spark S...
分类:Web程序   时间:2014-10-13 22:30:37    阅读次数:500
Flume 关于Event的笔记
在Flume中使用Event对象来作为传递数据的格式,在flume-ng-core子项目中的org.apache.flume.serialization包下,有一个名为LineDeserializer的类,这个类负责把数据按行来读取,每一行封装成一个Event(实现方式:按字节读取,当遇到"\n.....
分类:Web程序   时间:2014-10-11 12:26:35    阅读次数:416
低调、奢华、有内涵的敏捷式大数据方案:Flume+Cassandra+Presto+SpagoBI
“Ad-hoc analysis over Cassandra data with Facebook Presto”一文,对Cassandra+Presto 结合实现大数据即席分析进行了介绍。Presto是为满足交互式即席查询需求而优化的分布式SQL查询引擎。它支持标准ANSI SQL,包括复杂查询,聚合,连接和窗口函数。 Cassandra以前缺少交互式即席查询功能,甚至在CQL中不支持聚合函数。因为这个原因,Cassandra在作为数据库使用时经常被混淆。分析Cassandra中的数据有下边两个框架: ...
分类:Web程序   时间:2014-10-10 20:13:04    阅读次数:666
Flume一个数据源对应多个channel,多个sink
一、概述 1、现在有三台机器,分别是:Hadoop1,Hadoop2,Hadoop3,以Hadoop1为日志汇总 2、Hadoop1汇总的同时往多个目标进行输出 3、Flume一个数据源对应多个channel,多个sink,是在consolidation-accepter.conf文件里配置的 二、部署Flume来采集日志和汇总日志 1、在Hadoop1上运行fl...
分类:Web程序   时间:2014-10-10 17:10:34    阅读次数:568
linux定时调度器每秒执行一次
linux操作系统最小粒度的定时调度器只能调到分钟的级别,工作中有时需在到秒的调度,所以需要自己编写脚本来实现 #!/bin/bash while [ true ]; do /bin/sleep 1 ##在这里可以编写自己复杂的业务代码netstat -n | grep 8020 >> /root/data/flume.log echo 10.58...###`date` >> /root/...
分类:系统相关   时间:2014-10-10 13:26:14    阅读次数:196
修改Flume-NG的hdfs sink解析时间戳源码部分大幅提高写入性能
Flume-NG中的hdfs sink的路径名(对应参数"hdfs.path",不允许为空)以及文件前缀(对应参数"hdfs.filePrefix")支持正则解析时间戳自动按时间创建目录及文件前缀。 在实际使用中发现Flume内置的基于正则的解析方式非常耗时,有非常大的提升空间。如果你不需要配...
分类:其他好文   时间:2014-10-10 09:52:34    阅读次数:2135
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!