标签:python
Python 3最重要的新特性大概要算是对文本和二进制数据作了更为清晰的区分。
文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示。Python 3不会以任意隐式的方式混用str和bytes,正是这使得两者的区分特别清晰。你不能拼接字符串和字节包,也无法在字节包里搜索字符串(反之亦然),也不能将字符串传入参数为字节包的函数(反之亦然)。这是件好事。
不管怎样,字符串和字节包之间的界线是必然的,下面的图解非常重要,务请牢记于心:
字符串可以编码成字节包,而字节包可以解码成字符串。
>>> "你好".encode("utf-8") #encode将字符串变成字节 b'\xe4\xbd\xa0\xe5\xa5\xbd' >>> b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('utf-8') #decode将字节变成字符串 '你好'
>>> "你好".encode("GBK") b'\xc4\xe3\xba\xc3' >>> b'\xc4\xe3\xba\xc3'.decode("gbk") '你好' >>>
上一讲:Python菜鸟晋级01----Python3.x和Python2.x的区别
下一讲:Python菜鸟晋级03----repr() 与str() 函数的区别Python菜鸟晋级02----Python3的bytes与str
标签:python
原文地址:http://blog.csdn.net/a359680405/article/details/42471329