首页 > 其他好文 > 详细

Spark调优（二）数据本地化

时间：2020-02-28 13:56:43 阅读：49 评论：0 收藏：0 [点我收藏+]

标签：执行 oca 场景 info str roc mysql数据库 tag style

　　Application任务执行流程: 在Spark Application提交后，Driver会根据action算子划分成一个个的job，然后对每一个job划分成一个个的stage，stage内部实际上是由一系列并行计算的task组成的，然后以TaskSet的形式提交给你TaskScheduler，TaskScheduler在进行分配之前都会计算出每一个task最优计算位置。Spark的task的分配算法优先将task发布到数据所在的节点上，从而达到数据最优计算位置。

一、数据本地化级别：

　　　　 PROCESS_LOCAL 进程本地化

技术图片

　　　　NODE_LOCA 节点本地化

技术图片

　　　NO_PREF 没有最佳位置这个说法比如用到SparkSQl读取mysql数据库里的数据

　　　　RACK_LOCAL 机架本地化

技术图片

　　　　ANY 随机安排跨机架

二、实际场景：

技术图片

三、总结：

技术图片

Spark调优（二）数据本地化

标签：执行 oca 场景 info str roc mysql数据库 tag style

原文地址：https://www.cnblogs.com/wyh-study/p/12376768.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！