搜索关键字：flume kafka topic覆盖，搜索到5097个结果！码迷,mamicode.com！

How to set an Apache Kafka multi node – multi broker cluster【z】

Set a multi node Apache ZooKeeper clusterOn every node of the cluster add the following lines to the filekafka/config/zookeeper.propertiesserver.1=zNo...

分类：Web程序时间：2014-10-11 13:20:15 阅读次数：253

Flume 关于Event的笔记

在Flume中使用Event对象来作为传递数据的格式，在flume-ng-core子项目中的org.apache.flume.serialization包下，有一个名为LineDeserializer的类，这个类负责把数据按行来读取，每一行封装成一个Event（实现方式：按字节读取，当遇到"\n.....

分类：Web程序时间：2014-10-11 12:26:35 阅读次数：416

低调、奢华、有内涵的敏捷式大数据方案：Flume+Cassandra+Presto+SpagoBI

“Ad-hoc analysis over Cassandra data with Facebook Presto”一文，对Cassandra+Presto 结合实现大数据即席分析进行了介绍。Presto是为满足交互式即席查询需求而优化的分布式SQL查询引擎。它支持标准ANSI SQL，包括复杂查询，聚合，连接和窗口函数。 Cassandra以前缺少交互式即席查询功能，甚至在CQL中不支持聚合函数。因为这个原因，Cassandra在作为数据库使用时经常被混淆。分析Cassandra中的数据有下边两个框架： ...

分类：Web程序时间：2014-10-10 20:13:04 阅读次数：666

Flume一个数据源对应多个channel，多个sink

一、概述 1、现在有三台机器，分别是：Hadoop1，Hadoop2，Hadoop3，以Hadoop1为日志汇总 2、Hadoop1汇总的同时往多个目标进行输出 3、Flume一个数据源对应多个channel，多个sink，是在consolidation-accepter.conf文件里配置的二、部署Flume来采集日志和汇总日志 1、在Hadoop1上运行fl...

分类：Web程序时间：2014-10-10 17:10:34 阅读次数：568

linux定时调度器每秒执行一次

linux操作系统最小粒度的定时调度器只能调到分钟的级别，工作中有时需在到秒的调度，所以需要自己编写脚本来实现 #!/bin/bash while [ true ]; do /bin/sleep 1 ##在这里可以编写自己复杂的业务代码netstat -n | grep 8020 >> /root/data/flume.log echo 10.58...###`date` >> /root/...

分类：系统相关时间：2014-10-10 13:26:14 阅读次数：196

修改Flume-NG的hdfs sink解析时间戳源码部分大幅提高写入性能

Flume-NG中的hdfs sink的路径名(对应参数"hdfs.path"，不允许为空)以及文件前缀(对应参数"hdfs.filePrefix")支持正则解析时间戳自动按时间创建目录及文件前缀。在实际使用中发现Flume内置的基于正则的解析方式非常耗时，有非常大的提升空间。如果你不需要配...

分类：其他好文时间：2014-10-10 09:52:34 阅读次数：2135

记Flume-NG一些注意事项(不定时更新，欢迎提供信息)

这里只考虑flume本身的一些东西，对于JVM、HDFS、HBase等得暂不涉及。。。。一、关于Source： 1、spool-source：适合静态文件，即文件本身不是动态变化的； 2、avro source可以适当提高线程数量来提高此source性能； 3、ThriftSource在使用时...

分类：其他好文时间：2014-10-09 19:29:07 阅读次数：292

kibana显示elasticsearch集群中flume到入的日志

elasticsearch kibana3安装...

分类：其他好文时间：2014-10-09 17:29:58 阅读次数：221

flume 日志导入elasticsearch

Flume配置。 flume生成的数据结构 "_index" : "logstash-2013.01.07", "_type" : "tms_jboss_syslog", "_id" : "a_M9X_0YSpmE7A_bEzIFiw", "_score" : 1.0, "_source" : {"@source":"file://localhost.localdomain/tmp...

分类：其他好文时间：2014-10-09 17:03:48 阅读次数：290

kafka producer实例及原理分析

1.前言首先，描述下应用场景：假设，公司有一款游戏，需要做行为统计分析，数据的源头来自日志，由于用户行为非常多，导致日志量非常大。将日志数据插入数据库然后再进行分析，已经满足不了。最好的办法是存日志，然后通过对日志的分析，计算出有用的数据。我们采用kafka这种分..

分类：其他好文时间：2014-10-08 02:00:35 阅读次数：562

共5097条上一页 1 ... 493 494 495 496 497 ... 510 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)