首页 > 其他好文 > 详细

Qt 中文字符串问题

时间：2018-04-16 13:42:01 阅读：228 评论：0 收藏：0 [点我收藏+]

标签：编译 ott wchar_t nbsp ase color idt 环境存在

一.

Qt5假定的执行字符集是UTF8，不再允许用户擅自改动。这样一来，Qt4中setCodecXXX的各种副作用不再存在，而且中文问题更为简单。

QString s1 = "汉语";
QString s2("漢語");
QString s3 = tr("中文")
QString s4 = QStringLiteral("中文");//只要字符串不需要翻译，请关注这个
QString s5 = QString::fromWCharArray(L"中文");
QString s6 = u8"中文";//C++11
QString s7 = tr(u8"中文")
...

所有这些在Qt5默认都会正常工作，唯一要求就是：确保你的C++的执行字符集(the execution character set)是UTF-8

被误用最多的:此种方法解析结果是错误的

在Qt4中，QObject::tr()是被滥用(误用)的函数之一：

QString s3 = tr("中文")
...

原因：

在Qt4，不少用户被铺天盖地的setCodecForTr()所影响，进而靠它来解决中文问题。

它的用途是用来进行翻译(I18N和L10N)的，如果你没有这方面的需求，真的没必要用它。(在Qt4中，我只注意到有2个大陆网友和1个日本网友有需求并真正进行过这方面的尝试，那么其他应该算误用吧？)

让人困惑的wchar_t

刚开始接触Qt和QString时，曾多次想过，为什么不用wchar_t，为什么，...

QString s5 = QString::fromWCharArray(L"中文");

这个东西在Windows下真的很有用：首先它是Windows系统API所用字符串，其次它和QString内部表示相同。但是由于MSVC处于种种考虑，鼓励大家使用TEXT/_T，反倒使大家对它比较陌生。

但是从C++标准来说，wchar_t毕竟不是char16_t，所以跨平台性不好。在linux下，这行代码需要utf32到utf16的转换。

QStringLiteral

这是一个宏，一个蛮复杂的宏：

QString s4 = QStringLiteral("中文");

之前？

在介绍这个宏之前，我们先看看下面写法有什么劣势:

QString s1 = "汉语";
QString s2("漢語");
QString s3 = tr("中文")
QString s6 = u8"中文";//C++11
...

首先，2个汉字的字符串以UTF-8编码的形式被编译器放到了常量区。(至少占7个字节吧？)

然后，程序运行时，构造QString实例，需要在堆上申请空间，存放utf16格式的相应字符串。

有没有存在浪费？

方案

QString 内部是UTF16，如果C++编译器在编译期直接提供了UTF16的字符串，那么我们在QString内部直接保存也就够了。这样

省掉存在两份不同的拷贝(即相应的转换，malloc的成本)
对汉字来说，UTF16本身就是UTF8省空间

现实

目前，我们还没有可靠的方式在C++使用UTF16的执行字符集(the execution character set)。

尽管 L"..."(wchar_t*) 在Windows下是UTF16，但是不具备跨平台性。
C++11可以保证这一点，u"..."(char16_t)，但主流编译器尚未提供完美支持。

这两点，导致了QStringLiteral的复杂性

实现

源码见 qtbase/src/corelib/tools/qstring.h

（代码中使用宏、模板、lambda表达式，还是相当复杂的，此处只摘片段）

如果编译器支持char16_t，则直接使用

#define QT_UNICODE_LITERAL_II(str) u"" str
typedef char16_t qunicodechar;
...

否则。如果在Windows平台下，或者在其他的wchar_t宽度为2的环境下，使用wchar_t

#if defined(Q_CC_MSVC)
#    define QT_UNICODE_LITERAL_II(str) L##str
#else
#    define QT_UNICODE_LITERAL_II(str) L"" str
#endif
typedef wchar_t qunicodechar;
...

否则。编译器不支持，Qt作为一个库，肯定也没有办法

# define QStringLiteral(str) QString::fromUtf8(str, sizeof(str) - 1)

Qt 中文字符串问题

标签：编译 ott wchar_t nbsp ase color idt 环境存在

原文地址：https://www.cnblogs.com/mercedes-Benz/p/8855406.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！