码迷,mamicode.com
首页 > Windows程序 > 详细

Windows中的宽字符串处理问题

时间:2015-08-30 12:56:55      阅读:181      评论:0      收藏:0      [点我收藏+]

标签:宽字符串   unicode   ansi   

在用VC做开发的时候,对于一些字符串,会经常调用一般_t、_T、T(),其实这些东西都和Unicode有关系。比如说,AfxMessageBox(_T("Error! Fail to connect the database!"));这里用到了一个_T(),不使用_T()有时候编译会报错。

Windows操作系统使用Unicode作为默认的文本编码格式。Unicode定义了对大于8位的字符编码的支持。Windows使用UTF-16格式,称为宽字符编码,UTF-16编码以16位无符号整数为单位,每个字符占用两个字节。许多Windows函数都定义了两个入口点Unicode版本入口函数以W字符结尾,表示的是针对宽字符的;ANSI字符入口点函数则以A结尾。比如说,对于CreateMutex()存在CreateMutexW()和CreateMutexA()。编译的时候根据是否定义了Unicode进行适当的函数调用。Windows内部使用的是宽字符,ANSI入口点实际上只是在宽字符版本函数调用之外加上包装,进行适当的字符串转换。

16位字符类型为wchar_t,可以代替char类型。WCHAR是定义宽字符的等价形式,在源代码中字符串都被解释成8位的ANSI字符,所以需要将其指定为宽字符,可以使用L说明符或者宏TEXT()来指定。

wchar_t str1[]=L”some text”;WCHAR st2[]=TEXT(“moretext”);

在定义了Unicode的情况下,TEXT()宏很有用,它会将字符串转换为宽字符格式;在未定义Unicode的情况下,它让字符串保留8位ANSI文本格式。TCHAR类型与之类似,定义了Unicode时,解析为wchar_t,否则解析成char。

有些函数也会根据是否定义了Unicode而采用不同的解析方式的宏。比如说,主函数_tmain()在定义UNICODE的情况下,解析为wmain(),否则解析为main();_tprintf()在定义了Unicode的情况下解析为wprintf(),否则解析成printf()。

其实在使用_tmain的时候,利用Goto Definition可以看到,在stdafx.h里面有这么一行,#include <tchar.h>,所以使用_tmain()的时候必须使用#include<tchar.h>,在头文件<tchar.h>里找到_tmain的宏定义,

#define _tmain         main

经过预编译以后,_tmain就变成main了。main()是标准C++的函数入口。标准C++的程序入口点函数,默认字符编码格式ANSI函数原型为:

int main();

int main(int argc, char* argv[]);

_tmain()是windows提供的对Unicode字符集和ANSI字符集进行自动转换用的程序入口点函数,其原型为int _tmain(int argc, TCHAR *argv[])。

当程序当前的字符集为Unicode时,int _tmain(int argc, TCHAR *argv[])会被翻译成

int wmain(int argc, wchar_t *argv[]);当程序当前的字符集为ANSI时,int_tmain(int argc, TCHAR *argv[])会被翻译成int main(int argc, char *argv[])。

版权声明:本文为博主原创文章,未经博主允许不得转载。

Windows中的宽字符串处理问题

标签:宽字符串   unicode   ansi   

原文地址:http://blog.csdn.net/u011000290/article/details/48103417

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!