码迷,mamicode.com
首页 > 其他好文 > 详细

Spark RDD 宽窄依赖

时间:2019-10-23 18:02:41      阅读:133      评论:0      收藏:0      [点我收藏+]

标签:SPARK RDD   http   shuffle   shuf   dag   sch   查找   stage   根据   

RDD 宽窄依赖

  • RDD之间有一系列的依赖关系, 可分为窄依赖和宽依赖

    • 窄依赖
      • 从 RDD 的 parition 角度来看
      • 父 RRD 的 parition 和 子 RDD 的 parition 之间的关系是一对一的 (或 者是多对一的)。
      • 不会有 shuffle 产生
    • 宽依赖
      • 父 RRD 的 parition 和 子 RDD 的 parition 之间的关系是一对多的
      • 会产生shuffle
  • 理解图

    技术图片

  • 对stage(阶段)划分的影响

    • DAGSchedular 根据依赖类型切割RDD划分stage, 如果是宽依赖, 就进行切割, 并且递归查找其所有父类RDD

    • 示意图:

      技术图片

Spark RDD 宽窄依赖

标签:SPARK RDD   http   shuffle   shuf   dag   sch   查找   stage   根据   

原文地址:https://www.cnblogs.com/ronnieyuan/p/11727747.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!