码迷,mamicode.com
首页 > 系统相关 > 详细

linux下转格式函数iconv段错误

时间:2014-08-09 00:18:36      阅读:328      评论:0      收藏:0      [点我收藏+]

标签:unicode   utf-8   iconv   segment error   段错误   

今天将windows代码移植到Linux下,其中用到了Unicode转char的函数,被坑了一会,相关函数及编码格式,Linux与windows不同,有几点需要注意:

1、wchar_t 在Linux下占用4个字节,在windows下占2个字节;

2、Linux默认的文本编码方式是UTF-8;Linux终端汉字显示的设置方式:vi /etc/sysconfig/i18n;

设置LANG=“en_US.UTF-8”或者LANG=“zh_CN.UTF-8”;

3、iconv函数的调用方式:

iconv(iconv_t en, char** inbuf, size_t inlen, char** outbuf, size_t outlen);

段错误引发的关键之处就在这里了。

对于输入buffer与输出buffer,我之前用的是数组:strin[N][strlen];而我每次只处理二维数组中的一个数组,于是inbuf = (char**)(&strin[i]);

outbuf也是以类似的方式定义的,这样执行下去就一直报段错误,或者说segment error;

修改成这样就行了:

char* intemp = strin[i];
inbuf = &intemp;
outbuf也以类似的方式定义及解决问题。


4、Linux还有一个系统小工具iconv,

可以通过指令

iconv --list

来看Linux支持哪些文本格式,Unicode格式的名字可以填:UNICODE、UCS-2

还可以通过指令:

iconv -f UCS-2 -t UTF-8 test.txt -o output.txt

来测试格式转码是否能成功。

指令的含义:

iconv -f from_encoding -t to_encoding inputfile -o outputfile


5、另外还有个问题,在windows下通过tinyxml写XML文本,需要指定GBK格式,而在Linux下通过tinyxml写XML文件需要指定UTF-8编码;否则生成的XML文件为乱码。

linux下转格式函数iconv段错误,布布扣,bubuko.com

linux下转格式函数iconv段错误

标签:unicode   utf-8   iconv   segment error   段错误   

原文地址:http://blog.csdn.net/u011757360/article/details/38445429

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!