标签:py
交互式的默认编码是系统默认编码
脚本的默认编码是ANSCII (有其他非ANSCII字符如:中文会报错)
指定脚本的默认编码 # -*- coding: encoding -*-
Unicode 可以转 utf-8 和gbk
s_utf = s_uicode.encode(‘utf-8‘)
utf-8 和gbk 转Unicode
s_unicode = s_utf_8.encode(‘utf-8‘)
中文
Unicode 一个
Gbk 两个
Utf-8 三个
>>> gbk = ‘asdf五‘ //当前默认的是gbk >>> gbk ‘asdf\xce\xe5‘ >>> print gbk asdf五 >>> len(gbk) 6 >>> unicode = gbk.decode(‘gbk‘) >>> unicode u‘asdf\u4e94‘ >>> print unicode asdf五 >>> len(unicode) 5 >>> utf_8 = unicode.encode(‘utf-8‘) >>> utf_8 ‘asdf\xe4\xba\x94‘ >>> print utf_8 asdf五 >>> len(utf_8) 7
本文出自 “Try” 博客,请务必保留此出处http://beening.blog.51cto.com/9079117/1814614
标签:py
原文地址:http://beening.blog.51cto.com/9079117/1814614