Python3.x:BeautifulSoup()解决中文乱码问题
问题:
BeautifulSoup获取网页内容,中文显示乱码;
解决方案:
import requests from bs4 import BeautifulSoup html = requests.get(url, headers=Hostreferer) soup = BeautifulSoup(html.content, "html.parser", fromEncoding="gb18030")
如果中文页面编码是gb2312,gbk,在BeautifulSoup构造器中传入fromEncoding="gb18030"参数即可解决乱码问题,
即使分析的页面是utf8的页面使用gb18030也不会出现乱码问题;