王家林每日大数据语录Spark篇0011（2015.11.2于深圳）

时间：2015-12-16 12:49:12 阅读：126 评论：0 收藏：0 [点我收藏+]

RDD的saveAsTextFile方法会首先生成一个MapPartitionsRDD，该RDD通过雕工PairRDDFunctions的saveAsHadoopDataset方法向HDFS等输出RDD数据的内容，并在在最后调用SparkContext的runJob来真正的向Spark集群提交计算任务。

本文出自 “王家林大数据语录” 博客，请务必保留此出处http://wangjialin2dt.blog.51cto.com/10467465/1723399

标签：王家林王家林spark 王家林语录

原文地址：http://wangjialin2dt.blog.51cto.com/10467465/1723399

踩

(0)

评论一句话评论（0）