码迷,mamicode.com
首页 > Web开发 > 详细

把HDFS里的json数据转换成csv格式

时间:2016-06-19 19:50:56      阅读:496      评论:0      收藏:0      [点我收藏+]

标签:

 

1. 全景图

 技术分享

 .

2. 用ListHDFS获取所有文件名

技术分享

 

3. 用FetchHDFS 取出json 数据

技术分享

 

4. 用ExecuteScript 转换

技术分享

import org.apache.commons.io.IOUtils
import java.nio.charset.*
import java.text.SimpleDateFormat
import groovy.json.*

def flowFile = session.get()

flowFile = session.write(flowFile, {inputStream, outputStream ->

def js = IOUtils.toString(inputStream, StandardCharsets.UTF_8)
def data = new JsonSlurper().parseText( js )
def columns = data.data*.keySet().flatten().unique()

// Wrap strings in double quotes, and remove nulls
def encode = { e -> e == null ? ‘‘ : e instanceof String ? /"$e"/ : "$e" }

// Print all the column names
def columnName = columns.collect { c -> encode( c ) }.join( ‘,‘ )

// Then create all the rows
def columnData = data.data.collect { row ->
// A row at a time
columns.collect { colName -> encode( row[ colName ] ) }.join( ‘,‘ )
}.join( ‘\n‘ )

StringBuilder cd = new StringBuilder()
cd.append(columnName + "\n")
cd.append(columnData)

outputStream.write(cd.toString().getBytes(StandardCharsets.UTF_8))
}as StreamCallback)

session.transfer(flowFile, REL_SUCCESS)

 

5. 用PutHDFS 插入

技术分享

把HDFS里的json数据转换成csv格式

标签:

原文地址:http://www.cnblogs.com/fengwenit/p/5598606.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!