码迷,mamicode.com
首页 > 其他好文 > 详细

Hadoop中文编码乱码相关问题

时间:2017-05-16 23:18:42      阅读:177      评论:0      收藏:0      [点我收藏+]

标签:需求   gbk   输出   格式   exce   结果   程序   记事本   apr   

mapreduce程序处理GBK编码数据并输出GBK编码数据, hadoop涉及输出文本的默认输出编码统一用没有BOM的UTF-8的形式,但是对于中文的输出window系统默认的是GBK,有些格式文件例如CSV格式的文件用excel打开输出编码为没有BOM的UTF-8文件时,输出的结果为乱码,只能由UE或者记事本打开才能正常显示。因此将hadoop默认输出编码更改为GBK成为非常常见的需求,具体请参考以下这篇帖子http://www.aboutyun.com/thread-7358-1-1.html

Hadoop中文编码乱码相关问题

标签:需求   gbk   输出   格式   exce   结果   程序   记事本   apr   

原文地址:http://www.cnblogs.com/lisi2016/p/6863936.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!