码迷,mamicode.com
首页 > 其他好文 > 详细

王家林每日大数据语录Spark篇0011(2015.11.2于深圳)

时间:2015-12-16 12:49:12      阅读:126      评论:0      收藏:0      [点我收藏+]

标签:王家林   王家林spark   王家林语录   

RDD的saveAsTextFile方法会首先生成一个MapPartitionsRDD,该RDD通过雕工PairRDDFunctions的saveAsHadoopDataset方法向HDFS等输出RDD数据的内容,并在在最后调用SparkContext的runJob来真正的向Spark集群提交计算任务。


本文出自 “王家林大数据语录” 博客,请务必保留此出处http://wangjialin2dt.blog.51cto.com/10467465/1723399

王家林每日大数据语录Spark篇0011(2015.11.2于深圳)

标签:王家林   王家林spark   王家林语录   

原文地址:http://wangjialin2dt.blog.51cto.com/10467465/1723399

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!