码迷,mamicode.com
首页 > 其他好文 > 详细

SparkStreaming性能调优大全!

时间:2016-11-12 02:41:38      阅读:347      评论:0      收藏:0      [点我收藏+]

标签:spark streaming kafka 调优

SparkStreaming性能调优大全!


一、日志已满:

 spark.executor.logs.rolling.maxSize 


下面三个日志rolling参数记得设置: 

spark.executor.logs.rolling.strategy size 

spark.executor.logs.rolling.maxSize 134217728 #default byte 

spark.executor.logs.rolling.maxRetainedFiles 


二、Spark Streamingz对Kafka的Offset进行管理

zookeeper.session.timeout.ms

一般跳大3~5倍。

http://geeks.aretotally.in/spark-streaming-kafka-direct-api-store-offsets-in-zk/

http://www.tuicool.com/articles/vaUzquJ


技术分享

三、 spark.task.maxFailures 


技术分享默认4,调整10左右


四、spark.streaming.kafka.maxRetries

默认1,调成3或者5


五、Spark Streaming连接Kafka用Direct方式。



SparkStreaming性能调优大全!

标签:spark streaming kafka 调优

原文地址:http://36006798.blog.51cto.com/988282/1871929

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!