码迷,mamicode.com
首页 > 其他好文 > 详细

hive表数据导出到csv乱码原因及解决方案

时间:2017-08-29 17:58:59      阅读:392      评论:0      收藏:0      [点我收藏+]

标签:乱码   表数据   而且   ref   组成   http   log   get   知识   

转载自http://blog.csdn.net/lgdlxc/article/details/42126225

Hive表中的数据使用hive - e"select * from table">aa.csv导出到csv文件的时候在window中用Excel打开查看的时候是乱码,而且格式也不对。

原因有下面两个:

1.乱码的原因是用excel打开csv时格式默认为gbk,但是从hive中导出来的是utf8的

2.格式不对的原因是csv文件的列分隔符是逗号或者\t,而hive中默认使用\001

 

解决办法:

使用hive中的concat_ws函数将所有列连接起来组成一列。

concat_ws(‘分隔符‘,列1,列2,……),语句如下

hive -e " select concat_ws(‘,‘,cat1,cat2,dd_name) as onecl from dd_prod">testaa.csv

然后再使用iconv -f UTF-8 -c  -t GBK testaa.csv > testbb.csv转换编码。得到的testbb.csv没有乱码格式也对。

hive表数据导出到csv乱码原因及解决方案

标签:乱码   表数据   而且   ref   组成   http   log   get   知识   

原文地址:http://www.cnblogs.com/coskaka/p/7449354.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!