码迷,mamicode.com
首页 > 编程语言 > 详细

python基础===codecs打开文件,解决文件编码格式的问题

时间:2018-01-19 14:20:15      阅读:191      评论:0      收藏:0      [点我收藏+]

标签:class   ima   mpi   imp   ids   col   exception   port   org   

codecs

https://docs.python.org/3/library/codecs.html

 

我们经常用open打开文件的时候会出现各式各样的错误,编码格式的问题,等等~真的很烦

现在尽量使用codecs的方式打开文件

txt文档是这样的,使用open()的方式,打开直接报错。

技术分享图片

那么使用codecs的方式,如下:

import codecs

f = codecs.open("123.txt","r","utf-8")
words = f.read()

 

基本使用到现在没有出现错误!


 

为了获取id我们还需要使用正则匹配

import re
import codecs

f = codecs.open(r"78.txt","r","utf-8")
words = f.read()
p = re.compile( ID="(.*?)" IsException, re.S)
ids = re.findall(p , words)       #ids这里是以list的形式储存
s = \n.join(ids)                #每一项都换行打印
print(s)

>>>

最终得到id

技术分享图片

 

python基础===codecs打开文件,解决文件编码格式的问题

标签:class   ima   mpi   imp   ids   col   exception   port   org   

原文地址:https://www.cnblogs.com/botoo/p/8316077.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!