码迷,mamicode.com
首页 > 其他好文 > 详细

UnicodeDecodeError: 'gbk' codec can't decode byte 0xe9 in position 7581: illegal multibyte sequence

时间:2020-02-14 01:03:46      阅读:67      评论:0      收藏:0      [点我收藏+]

标签:size   gbk   illegal   bsp   utf-8   col   err   pre   常见   

pyhon读取文件时报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xe9 in position 7581: illegal multibyte sequence

代码如下:

#获取电影列表
def getMovieList(item):
    items={}
    f=open(item,"r")
    # 此句报错
    movie_content=f.readlines()
    f.close()
    for movie in movie_content:
        movieLine=movie.split("|")
        items[int(movieLine[0])]=movieLine[1:]
    return items

这是Unicode编码不一致导致的,将f=open(item,"r")改为f=open(item,"r",encoding = ‘ISO-8859-1‘)。

问题解决!!

在遇到这个问题时,不一定要改为‘ISO-8859-1‘,unicode编码很多,一种不行可以多尝试几种。

Unicode编码有以下几种常见类型:

  gbk
  gb2312
  gb18030
  utf-8
  utf-16
  utf-32
  ISO-8859-1

 

UnicodeDecodeError: 'gbk' codec can't decode byte 0xe9 in position 7581: illegal multibyte sequence

标签:size   gbk   illegal   bsp   utf-8   col   err   pre   常见   

原文地址:https://www.cnblogs.com/qilin20/p/12305979.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!