标签:官网 spark 总结 计算 数据 park 延迟 nbsp 一个
官网上最清晰
sc 启动spark时候就已经初始化好了
sc.textFile后 会产生一个rdd
spark 的算子分为两类
一类 Transformation 转换
一类 Action 动作
Transformation 延迟执行 记录元数据信息 当计算任务触发Action时候才会真正的开始计算
标签:官网 spark 总结 计算 数据 park 延迟 nbsp 一个
原文地址:http://www.cnblogs.com/toov5/p/7530695.html