码迷,mamicode.com
首页 > 编程语言 > 详细

Python中 sys.setdefaultencoding("utf8") 的作用详解

时间:2019-11-09 21:38:36      阅读:126      评论:0      收藏:0      [点我收藏+]

标签:col   bsp   汉字   efault   decode   解码   方式   解释   utf8编码   

在处理中文数据,经常加入下面的代码:

import sys
reload(sys)
sys.setdefaultencoding("utf8")

设置python默认字节流编/解码器按照utf8解码方式,把字节流编/解码为unicode;

 

 

具体来说,所起到的作用,可以用下面两个错误来解释:

  1. 在将字节流使用str()方法转换为str对象时,会调用默认的encode函数,如果没有上述系统的默认编码设置,则自动使用‘ascii‘ codecs进行编码,对于非ascii编码的数据,比如utf8字节流会产生错误解码提示:

UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-5: ordinal not in range(128)

        2.在utf8编码文件中写入汉字字符, 比如 s = ‘中文‘时, 如果没有上述设置,运行程序会在初始s对象的值,报告错误编码提示:

UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xe4 in position 0: ordinal not in range(128)

Python中 sys.setdefaultencoding("utf8") 的作用详解

标签:col   bsp   汉字   efault   decode   解码   方式   解释   utf8编码   

原文地址:https://www.cnblogs.com/operaculus/p/11827889.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!