标签:unicode utf-8 iconv segment error 段错误
今天将windows代码移植到Linux下,其中用到了Unicode转char的函数,被坑了一会,相关函数及编码格式,Linux与windows不同,有几点需要注意:
1、wchar_t 在Linux下占用4个字节,在windows下占2个字节;
2、Linux默认的文本编码方式是UTF-8;Linux终端汉字显示的设置方式:vi /etc/sysconfig/i18n;
设置LANG=“en_US.UTF-8”或者LANG=“zh_CN.UTF-8”;
3、iconv函数的调用方式:
iconv(iconv_t en, char** inbuf, size_t inlen, char** outbuf, size_t outlen);
段错误引发的关键之处就在这里了。
对于输入buffer与输出buffer,我之前用的是数组:strin[N][strlen];而我每次只处理二维数组中的一个数组,于是inbuf = (char**)(&strin[i]);
outbuf也是以类似的方式定义的,这样执行下去就一直报段错误,或者说segment error;
修改成这样就行了:
char* intemp = strin[i]; inbuf = &intemp;outbuf也以类似的方式定义及解决问题。
4、Linux还有一个系统小工具iconv,
可以通过指令
iconv --list
还可以通过指令:
iconv -f UCS-2 -t UTF-8 test.txt -o output.txt
指令的含义:
iconv -f from_encoding -t to_encoding inputfile -o outputfile
linux下转格式函数iconv段错误,布布扣,bubuko.com
标签:unicode utf-8 iconv segment error 段错误
原文地址:http://blog.csdn.net/u011757360/article/details/38445429