标签:默认 增加 containe 升级 使用 nal utf-8 节省空间 过程
.编码类型:
为了解决存储和网络传输的问题,出现了Unicode Transformation Format,学术名UTF,即:对unicode中的进行转换,以便于在存储和网络传输时可以节省空间!
2.Python3 执行过程
解释器找到代码文件,把代码字符串按文件头定义的编码加载到内存,转成unicode
把代码字符串按照语法规则进行解释,
所有的变量字符都会以unicode编码声明
3.解码和编码
UTF
-
8
-
-
> decode 解码
-
-
>
Unicode
Unicode
-
-
> encode 编码
-
-
> GBK
/
UTF
-
8
.. #网页爬取的时候,转码s.decode(‘gbk‘, ‘ignore‘).encode(‘utf-8′)
decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode(‘gb2312‘),表示将gb2312编码的字符串str1转换成unicode编码。
encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode(‘gb2312‘),表示将unicode编码的字符串str2转换成gb2312编码。
Python只要出现各种编码问题,无非是哪里的编码设置出错了
4常见编码错误的原因有:
标签:默认 增加 containe 升级 使用 nal utf-8 节省空间 过程
原文地址:http://www.cnblogs.com/jdy113/p/7906757.html