【原创】python中文编码问题深入分析（三）：python2.7文件读写中文编码问题

时间：2017-02-26 20:32:37 阅读：212 评论：0 收藏：0 [点我收藏+]

　　上一篇文章介绍和分析了python2.7中使用print遇到的中文编码问题的原因和解决方案，本篇主要介绍一下python2.7中执行文件读写可能遇到的编码问题。

　　1.文件读取

　　　假如我们读取一个文件，文件保存时，使用的编码格式，决定了我们从文件读取的内容的编码格式，例如，新建一个文本文件test.txt, 编辑内容，保存的时候注意，编码格式设定为gb2312,那么使用python读取文件内容，方式如下：

f = open(‘test.txt‘,‘r‘)
s = f.read() #读取文件内容,如果是不识别的encoding格式（识别的encoding类型跟使用的系统有关），这里将读取失败
‘‘‘假设文件保存时以gb2312编码保存‘‘‘
u = s.decode(‘gb2312‘) #以文件保存格式对内容进行解码，获得unicode字符串
‘‘‘下面我们就可以对内容进行各种编码的转换了‘‘‘
str = u.encode(‘utf-8‘)#转换为utf-8编码的字符串str
strGbk = u.encode(‘gbk‘)#转换为gbk编码的字符串str1

　　注意：1）调用read()函数文件test.txt时，如果test.txt文件中不包含BOM信息(BOM信息一般是3个字节，用于标识文件的编码格式)，则系统会使用现在支持的文件编码格式（utf-8，gbk等，优先使用utf-8，最后使用系统默认的编码方式），尝试着读取和解析text.txt，如果能打开并解析成功（假设以gbk编码方式能正确打开test.txt），那么s的编码类型gbk 。

　　　　　2）如果open时使用的encoding和文件本身的encoding不一致的话，那么这里将将会产生错误

　　　　　3）s的类型为str

　　此外，python提供了codecs包，可供进行文件的读取，包中的open()函数可以指定文件编码的类型：

import codecs
f = codecs.open(‘text.text‘,‘r+‘,encoding=‘utf-8‘)#必须事先知道文件的编码格式，这里文件编码是使用的utf-8
content = f.read()#如果open时使用的encoding和文件本身的encoding不一致的话，那么这里将将会产生错误
f.write(‘你想要写入的信息‘)
f.close()

　　注意：1）必须事先知道文件的编码格式，这里文件编码是使用的utf-8 2）如果open时使用的encoding和文件本身的encoding不一致的话，那么这里将将会产生错误

　　　　　3） content的类型为unicode。

　　2.文件写入　

　　调用python文件写入函数时，如果待写入变量unStr是unicode类型，则系统首先使用系统的默认编码方式，将unStr变量进行unicode编码成str的类型，然后再写入文件。

unStr=u"测试"
f = open(‘test.txt‘,‘w‘)
f.write(unStr)   #如果系统的默认编码是asii，则会出现UnicodeEncodeError问题

　　如果系统的默认编码方式是ascii，则就会出现上文中提到的UnicodeEncodeError问题。解决方法有两个：

　　 1) 首先获取文件的默认编码格式，执行write函数前，将unStr编码成文件的默认编码格式，例如：在我的机器上，创建一个新文件时，其文件编码格式为utf-8，则修改f.write(unStr) 为f.write(unStr.encoding(‘utf-8‘))。（建议选这一种）

　　 2) 修改系统的默认编码方式为utf-8；

　　至此，python2.7中有关中文编码的相关问题分析及解决已接近尾声，由于笔者水平有限，难免出现错误和不当的地方，希望大家多多指正。

【原创】python中文编码问题深入分析（三）：python2.7文件读写中文编码问题

标签：文件编码创建 tle code 文件读写不一致方案 gif str

原文地址：http://www.cnblogs.com/litaozijin/p/6445502.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行