码迷,mamicode.com
首页 > Web开发 > 详细

关于从kafka采集数据到flume,然后落盘到hdfs上生成的一堆小文件的总结

时间:2017-11-15 22:06:39      阅读:397      评论:0      收藏:0      [点我收藏+]

标签:top   ado   img   指定   logs   ima   flume   hdfs   http   

采集数据到kafka,然后再通过flume将数据保存到hdfs上面。在这个过程当中出现了一堆的问题。

(1)一直是提醒说必须指定topic,然后发现我kafka用的是0.9.0.1,然而我的flume用的是1.6.然后将flume的版本调为1.7之后问题解决了。

技术分享

(2)flume能够正常启动。然而这个时候采集的文件是一堆小文件。

技术分享

然后查看配置文件,修改配置文件。

技术分享

依然是生成了一堆小文件。最终的解决方法是:

 

将Hadoop配置文件里面的相关文件加入到flume的conf目录下。使这个配置文件能够生效。识别这个当中的相关的配置文件。

技术分享

 

关于从kafka采集数据到flume,然后落盘到hdfs上生成的一堆小文件的总结

标签:top   ado   img   指定   logs   ima   flume   hdfs   http   

原文地址:http://www.cnblogs.com/gxgd/p/7840896.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!