标签:时间 传输 类型 logs 目录项 com idt source 修改
在HDFS中,文件只作为目录项存在,在文件关闭前,其长度一直显示为0。如果在一段时间内将数据写到文件中,但却没有将其关闭,那么一旦客户端出现网络中断,什么都得不到,只有一个空白的文件。
Flume的agent由三个部件构成:source、channel、sink.
其结构图如下:
三者之间的关系如下:
channel包含内存channel和文件channel2种。
flume传输的基本单位叫event.它由0个或多个头与体组成。头是一些键值对,可用于路由判定或是承载其他结构化信息。体是字节数组,包含实际负载。event结构如下图:
拦截器是位于source和sink之间。可以用拦截器检查和修改flume的event,可在source创建event后或是sink发送event前链接0个或多个拦截器。
通道选择器负责将数据从一source转向一个或多个channel上。flume自带两个通道选择器,可以包含大多数据使用场景。
示例:
2处的机器生成2种类型数据(即三角形与矩形),对应代理使用了多路通道选择器将这两种数据划分到了不同的通道中。矩形与1处机器产生的数据合并后分到了数据中心1,三角形分到数据中心2中的ES中。
注意:数据转换可能发生在任何source之后以及任何sink之前。
标签:时间 传输 类型 logs 目录项 com idt source 修改
原文地址:http://www.cnblogs.com/netbloomy/p/6607821.html