码迷,mamicode.com
首页 > 其他好文 > 详细

RDD算子、RDD依赖关系

时间:2018-11-30 00:39:53      阅读:231      评论:0      收藏:0      [点我收藏+]

标签:val   mat   概念   value   分布式   一个   mil   rdd   ons   

RDD:弹性分布式数据集, 是分布式内存的一个抽象概念

RDD:1.一个分区的集合,

    2.是计算每个分区的函数 ,

      3.RDD之间有依赖关系

      4.一个对于key-value的RDD的Partitioner

           5.一个存储存取每个Partition的优先位置的列表

RDD算子:

Transformations:不会立即执行,只是记录这些操作

Actions:计算只有在action被提交的时候才被触发。

RDD依赖关系:

窄依赖指的是每一个父RDDPartition最多被子RDD的一个Partition使用

 

宽依赖指的是多个子RDDPartition会依赖同一个父RDDPartition

 

RDD算子、RDD依赖关系

标签:val   mat   概念   value   分布式   一个   mil   rdd   ons   

原文地址:https://www.cnblogs.com/dummyly/p/10041617.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!