1、根据文件头。
#是否为带BOM头的UTF8文件 def IsUtf8BomFile(pathfile): if b‘\xef\xbb\xbf‘ == open(pathfile, mode=‘rb‘).read(3)): return True return False
2、用cchardet库。
>>> import cchardet >>> cchardet.detect(open(pathfile, ‘rb‘).read()) {‘encoding‘: ‘UTF-8‘, ‘confidence‘: 0.9900000095367432}
相关阅读:
1、u‘\ufeff‘ in Python string (里面有几种文本的头信息)
本文出自 “walker的流水账” 博客,请务必保留此出处http://walkerqt.blog.51cto.com/1310630/1757899
原文地址:http://walkerqt.blog.51cto.com/1310630/1757899