标签:body asc set 中间 encoding com form 基础 load
一、系统默认编码
python 2.7版本系统默认编码是ascii
python 3.1版本系统默认编码是unicode
可以通过内建模块sys获取系统默认编码
import sys
print sys.getdefaultencoding()
有两种方法可以讲系统默认编码变成utf-8
1、在代码第一行加上 # -*- coding:utf-8 -*-
2、通过sys模块
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
二、用decode和encode编码
几种常见编码
编码转换
Python内部的字符串一般都是 Unicode编码。代码中字符串的默认编码与代码文件本身的编码是一致的。所以要做一些编码转换通常是要以Unicode作为中间编码进行转换的,即先将其他编码的字符串解码(decode)成 Unicode,再从 Unicode编码(encode)成另一种编码。
decode 的作用是将其他编码的字符串转换成 Unicode 编码,eg name.decode(“GB2312”),表示将GB2312编码的字符串name转换成Unicode编码
encode 的作用是将Unicode编码转换成其他编码的字符串,eg name.encode(”GB2312“),表示将GB2312编码的字符串name转换成GB2312编码
所以在转换之前必须先知道name的编码格式。
标签:body asc set 中间 encoding com form 基础 load
原文地址:http://www.cnblogs.com/mmbbflyer/p/6274408.html