标签:功能 计算 容错 屏蔽 存放位置 span 用户 就是 业务
1、RDD是整个Spark的计算基石。是分布式数据的抽象,为用户屏蔽了底层复杂的计算和映射环境
2、Spark Core干了什么东西,其实就是在操作RDD
RDD的创建--》RDD的转换--》RDD的缓存--》RDD的行动--》RDD的输出。
3、RDD怎么创建?
创建RDD有三种方式:
1、可以从一个Scala集合里面创建
2、从外部存储来创建,比如sc.textFile("path")
3、从另外一个RDD转换过来。
标签:功能 计算 容错 屏蔽 存放位置 span 用户 就是 业务
原文地址:https://www.cnblogs.com/alexzhang92/p/10776398.html