码迷,mamicode.com
首页 > 其他好文 > 详细

Spark RDD 操作实战之文件读取

时间:2018-12-04 13:14:51      阅读:219      评论:0      收藏:0      [点我收藏+]

标签:pre   textfile   压缩文件   实战   txt   dfs   rdd   本地   SPARK RDD   

/1、本地文件读取
val local_file_1 = sc.textFile("/home/hadoop/sp.txt")
val local_file_2 = sc.textFile("file://home/hadoop/sp.txt")

//2、当前目录下的文件
val file1 = sc.textFile("sp.txt")

//3、HDFS文件
val hdfs_file1 = sc.textFile("hdfs://192.168.66.81:9000/data/input/sp.txt")

//4、多文件读取
val file2 = sc.textFile("sp.txt,a.txt,b.txt")

//5、全目录读取
val hdfs_file2 = sc.textFile("hdfs://192.168.66.81:9000/data/input/")

//6、通配符匹配
val file2 = sc.textFile("file://home/hadoop/*.txt")

//7、读取压缩文件
val file3 = sc.textFile("file://home/hadoop/sp.gz")

  

Spark RDD 操作实战之文件读取

标签:pre   textfile   压缩文件   实战   txt   dfs   rdd   本地   SPARK RDD   

原文地址:https://www.cnblogs.com/RHadoop-Hive/p/10063352.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!