码迷,mamicode.com
首页 > Web开发 > 详细

encode和decode

时间:2016-01-23 13:16:24      阅读:197      评论:0      收藏:0      [点我收藏+]

标签:

编码格式主要有:Unicode、utf-8、gbk、utf-16等
unicode是utf-8、gbk等的父编码,所有子编码都可以转换成Unicode编码。然后转换成其他子编码。但是子编码之间是不可以进行转换的。(比如utf-8可以先转换成Unicode,然后再从Unicode转换成gbk;但是不能直接从utf-8转换成gbk)
技术分享
一、编码、解码
python中用encode和decode来进行编码和解码:
encode:将Unicode的编码转换成其他格式的编码
如str1.encode(‘gbk‘),表示将unicode编码的字符串转换成gbk 编码。 
 
decode:将其他格式的编码转换成Unicode的编码格式
str2.decode(‘gbk ‘),表示将gbk 编码的字符串转换成unicode编码。 
 
二、判断字符串的的编码格式
通过repr函数来查看变量给python看的形式,不同的编码格式,存储中文的结果不同,比如下面的例子。
 
“测试test”,使用不同的编码格式的结果如下:
unicode:‘\u6d4b\u8bd5test‘
unicode一般是\u开头,后边跟4位的数字或字母,1个\u对应一个汉字
utf-8:‘\xe6\xb5\x8b\xe8\xaf\x95test‘
utf-8一般是\x开头,后面跟两位字母或数字,3个\x代表一个汉字
gbk:‘\xb2\xe2\xca\xd4test‘
gbk也是\x开头,后面跟两位字母或数字,2个\x代表一个汉字
 
三、其他注意点
1.python3默认编码改成了unicode,基本上不存在编码问题
技术分享

encode和decode

标签:

原文地址:http://www.cnblogs.com/meitian/p/5153099.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!