码迷,mamicode.com
首页 > 编程语言 > 详细

Spark处理json数组fastjson

时间:2017-12-23 19:05:06      阅读:471      评论:0      收藏:0      [点我收藏+]

标签:obj   pac   oar   gets   version   2.4   dep   cti   post   

json数据格式:

[{"studentName":"lily","studentAge":12},{"studentName":"lucy","studentAge":15}]

pom:

<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-core_2.11</artifactId>
<version>2.2.1</version>
</dependency>
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.44</version>
</dependency>

val conf = new SparkConf().setMaster("local").setAppName("json test")
val sc = new SparkContext(conf)
val textFile = sc.textFile("f:/data/*.txt")
textFile.map(JSON.parseArray) //解析为json数组
.flatMap(_.toArray)  //json数组转为java数组,通过flatmap拉平
.map(_.asInstanceOf[JSONObject])  //把每个对象转成jsonobject
.map(x => (x.getString("studentName"), (x.getInteger("studentAge"), 1)))  //通过jsonobject的方法处理数据

 

Spark处理json数组fastjson

标签:obj   pac   oar   gets   version   2.4   dep   cti   post   

原文地址:http://www.cnblogs.com/pipiwukong/p/8093720.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!