码迷,mamicode.com
首页 > 其他好文 > 详细

spark内核揭秘-03-spark核心组件

时间:2015-01-18 10:36:02      阅读:219      评论:0      收藏:0      [点我收藏+]

标签:spark   多线程   集群   内存   并发   

spark核心组件如下所示:




技术分享

在SparkContext初始化的时候,会初始化一系列内容:

查看内存使用情况:

技术分享


创建和启动scheduler:

技术分享


集群核心组件中的Block tracker是用于block和partition对应关系的管理。

集群核心组件中的shuffle tracker是用于记录shuffle操作的过程细节。

从集群中也可以看出,Executor在执行任务的时候是采用多线程的方式执行的并能够在HDFS或者HBase等系统上读取数据。

而在实际的Driver Program运行的时候每个partition都会由一个task负责运行的

技术分享



也就是说有多partition就会有多少task在运行,而这些task都是并发的运行在Executor中的。



技术分享

spark内核揭秘-03-spark核心组件

标签:spark   多线程   集群   内存   并发   

原文地址:http://blog.csdn.net/stark_summer/article/details/42833655

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!