标签:使用 ar for 数据 2014 sp art 问题 on
最近在使用storm做了一下数据处理性能测试。
Topology结构:spout输出80万数据(csv格式);bolt1解析csv,拆分各信息段;bolt2按bolt1中某个字段汇总,累加记数后入库(入库触发频率:60s)。
并行度配置:spout task(1)executor(3);bolt1 excutor/task(16); bolt2 excutor/task(8);
workers(8);storm slot(8)
硬件配置:8CPU ,16G memory
处理性能大概1W5/s。
测试过程中发现些问题,耽误了一些时间。
storm ui 0.9.2版本在显示Topology Summary时有bug,worker与excutor数量值写反了。可以通过storm list在命令行中进行验证。
strom在进行任务分发时有时会出现连接超时,异常原因不明:
2014-09-22 13:18:34 b.s.m.n.Client [INFO] Reconnect started for Netty-Client-ip-61/ip:6703... [11] 2014-09-22 13:18:35 b.s.m.n.Client [INFO] Reconnect started for Netty-Client-ip-62/ip:6703... [12] 2014-09-22 13:18:35 b.s.m.n.Client [INFO] Reconnect started for Netty-Client-ip-61/ip:6703... [12]结论:
storm中worker为处理进程,excutor为worker下线程,执行task任务,task为具体实例对象(spout/bolt)。发现性能不足时可通过调整并行度、slot个数、worker个数来提升性能。
标签:使用 ar for 数据 2014 sp art 问题 on
原文地址:http://my.oschina.net/u/262605/blog/317332