标签:动态 image this enc get size 统一 引号 alt
https://www.jianshu.com/p/e1fd1d936278
https://www.cnblogs.com/lowmanisbusy/p/9136347.html
unicode编码: unicode编码为世界上所有字符都分配了一个唯一编号, 为十六进制, 如中文简体汉字 “渣” 的 Unicode编号就是 6E23,
unicode仅仅定义了每个字符的编号,并没有定义如何将这个编号进行存储的方式,所以后来出现了utf-8, gbk等编码格式, 它们都是 unicode 的一种实现方式, 仍然使用了unicode 中的唯一编号,个人对其的简单理解就是在unicode编码的基础之上又定义了对字符的存储方式.
https://www.jianshu.com/p/9920595791b7
python2默认字符编码为:ASCII, ASCII码 包含了128个字符, 其中包括所有的英文字符, 阿拉伯数字, 标点符号, 控制符号等
在python2 中使用sys.getdefaultencoding() 得到的是 ascii
在python2中字符串分为 unicode 和 str 类型
str : ‘this is a str‘
unicode: u‘this is a unicode code‘
事实上, python2 中被引号括起来的字符串就是 str, 而str 本身 就是一串字节码(byte).
如果被括起来字符是字母,那么就是ascii 编码的字符。
如果被括起来字符是汉字,那么也能得到一串字节, 但是字节码是什么编码格式的就不确定了。所以最好加上u‘‘, 指定为unicode 编码。
Str To Unicode 使用decode(), 解码 Unicode To Str 使用encode(), 编码
如果要将str 转换成unicode, 那么需要使用decode(), 将ascii 字符转换成unicode 字符。
3. Python3 中
python3默认字符编码为:utf-8
在python3 中使用如下代码得到的是 utf-8
sys.getdefaultencoding()
在python3中字符串分为 str 和 bytes 两种类型, 没有unicode 类型的字符串了。
byte 表示:前者包含原始的8位值
str 表示: unicode 字符 (用双引号括起来就是str 类型的)
https://www.jianshu.com/p/9920595791b7
Str To Bytes 使用 encode(), 编码 Bytes To Str 使用 decode(), 解码
因为 python3 中没有 unicode 类型的字符串, 所有在 python3 中使用下面这种方式定义字符串是没有意义的
my_str = u"渣男不但丑"
标签:动态 image this enc get size 统一 引号 alt
原文地址:https://www.cnblogs.com/flymood/p/12283528.html