码迷,mamicode.com
首页 > 其他好文 > 详细

日志收集分析系统架构

时间:2015-02-23 17:55:28      阅读:265      评论:0      收藏:0      [点我收藏+]

标签:

日志收集分析系统架构

 

一.部署架构

    日志收集系统一般包括如图所示三层。Web服务器层,日志收集层,日志存储层。Web服务器层是日志的来源,一般部署web应用供用户访问,产生日志,该节点上一般需要部署日志收集程序的agent。日志收集层手机web服务器产生的日志传输给日志存储层,存储层一般使用分布式文件系统HDFS,日志可以存储在hdfs上或者hbase上。

技术分享

scribe作为日志收集系统架构,scribe分为scribe agentscribe server

技术分享

kafka作为日志收集系统架构,kafka分为:producerkafka serverconsumer

技术分享

flume作为日志收集系统的架构

技术分享

三种日志收集服务对比

 

Scribe

Kafka

Flume

开源公司

Facebook

Linkedin

Cloudera

开源时间

0810

1012

097

实现语言

C/C++

SCALA

JAVA

框架

Push/push

Push/pull

Push/push

容错性

Collectorstore之间有容错机制,而agentcollector之间的容错机制需要用户自己来实现

Agent可通过自动识别机制获取可用的collectorStore自己保存已经获取数据的偏移量,一旦collector出现故障可根据偏移量继续获取数据,

Agentcollectorcollectorstore之间均有容错机制,并且提供了三种级别的可容错性保证。

负载均衡

Zookeeper

Zookeeper

可扩展性

Agent

Thrift

用户根据kafka提供的low-levelhigh-level api自己实现

提供了各种丰富的agent

Collector

实际上是一个thrift server

直接支持hdfs

直接支持hdfs

Store

直接支持hdfs

直接支持hdfs

直接支持hdfs

总体评价

设计简单,易于使用,但容错和负载均衡方面不够好。且资料较少

采用push/pull架构,可以重复获取数据,但是产品较新,稳定性需要验证

Very good

 

2. 日志分析常使用的计算框架

离线计算:mapreducehivepig

近实时计算:sparkimpala

实时计算:storm

 

 

日志收集分析系统架构

标签:

原文地址:http://blog.csdn.net/mapengbo521521/article/details/43916639

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!