标签:避免 本地 dep optional expand file span com hash
RDD由很多partition构成,有多少partition就对应有多少task来执行
对RDD做计算,相当于对RDD的每个split或partition做计算
RDD之间有依赖关系,可溯源
如果RDD里面存的数据是key-value形式,则可以传递一个自定义的Partitioner进行重新分区,比如可以按key的hash值分区
标签:避免 本地 dep optional expand file span com hash
原文地址:https://www.cnblogs.com/xiangyuguan/p/11221488.html