码迷,mamicode.com
首页 > 其他好文 > 详细

UTF-8到GBK转换

时间:2014-06-13 21:23:33      阅读:318      评论:0      收藏:0      [点我收藏+]

标签:unicode   utf-8   

实际就是由宽字节转换为多字节的过程

-------------

首先MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len) 转换UTF-8 到表中UNICODE

然后

WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL); UNICODE转换为标准多字节

这个时候已经是ANSI格式了,其实不是GBK格式,但是一般这个时候编译器和操作系统字符集就能去解决下边的事了,就是说可以直接当普通的char *来用了

---------------

void UTF8ToGBK( char *&szOut )
{
  unsigned short *wszGBK;
  char *szGBK;
  //长度
  int len = MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, NULL, 0);
  wszGBK = new unsigned short[len+1];
  memset(wszGBK, 0, len * 2 + 2);
  MultiByteToWideChar(CP_UTF8, 0, (LPCSTR)szOut, -1, (LPWSTR)wszGBK, len);


  //长度
  len = WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, NULL, 0, NULL, NULL);
  szGBK = new char[len+1];
  memset(szGBK, 0, len + 1);
  WideCharToMultiByte(CP_ACP, 0, (LPWSTR)wszGBK, -1, szGBK, len, NULL, NULL);


  //szOut = szGBK; //这样得到的szOut不正确,因为此句意义是将szGBK的首地址赋给szOut,当delete []szGBK执行后szGBK的内


  //存空间将被释放,此时将得不到szOut的内容


  memset(szOut,‘0‘,strlen(szGBK)+1); //改将szGBK的内容赋给szOut ,这样即使szGBK被释放也能得到正确的值
  memcpy(szOut,szGBK,strlen(szGBK)+1);//最后这个+1不要忘了




  delete []szGBK;
  delete []wszGBK;
}

UTF-8到GBK转换,布布扣,bubuko.com

UTF-8到GBK转换

标签:unicode   utf-8   

原文地址:http://blog.csdn.net/cyebo/article/details/30227197

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!