码迷,mamicode.com
首页 > Web开发 > 详细

Apache Spark RDD之 RDD的创建

时间:2016-07-31 20:45:10      阅读:254      评论:0      收藏:0      [点我收藏+]

标签:

    

RDD的创建

   两种方式来创建RDD:

    1)由一个已经存在的Scala集合创建

    2)由外部存储系统的数据集创建,包括本地文件系统,还有所有Hadoop支持的数据集,比如HDFS、Cassandra、HBase、Amazon S3等。

    RDD只能基于在稳定物理存储中的数据集和其他已有的RDD上执行确定性操作来创建。这些确定性操作称为转换,如map、filter、groupBy、join。

Apache Spark RDD之 RDD的创建

标签:

原文地址:http://www.cnblogs.com/zlslch/p/5723747.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!