码迷,mamicode.com
首页 > 编程语言 > 详细

python的"\ufeff"与中文编码问题

时间:2018-12-27 18:31:04      阅读:247      评论:0      收藏:0      [点我收藏+]

标签:文件中   nes   编码方式   load   odi   efault   err   字节序   字节   

python2要对中文做处理的话,文件头加上:

#coding=utf-8    python源代码文件的编码格式
import sys 
reload(sys) 
sys.setdefaultencoding(utf-8)     sys.defaultencoding设置解码方式,默认为ANSCII,有时候会报错

使用

f1 = open(file_chinese, encoding = UTF-8,errors="ignore")

读取的文件中有时候会出现"\ufeff"非法字符,这个时候需要改变编码方式‘UTF-8‘为‘UTF-8-sig‘:

f1 = open(file_chinese, encoding = UTF-8-sig,errors="ignore")

"UTF-8"的字节顺序在所有系统中都是一様的,没有字节序的问题,它不需要BOM(“ByteOrder Mark”)。

"UTF-8-sig"即UTF-8 with BOM需要提供BOM。

python的"\ufeff"与中文编码问题

标签:文件中   nes   编码方式   load   odi   efault   err   字节序   字节   

原文地址:https://www.cnblogs.com/codeDog123/p/10185322.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!