码迷,mamicode.com
首页 > 编程语言 > 详细

用Python requests beautifulSoup 获取并显示中文信息

时间:2019-08-03 13:11:30      阅读:101      评论:0      收藏:0      [点我收藏+]

标签:lxml   coding   find   beautiful   com   sts   div   enc   from   

使用requests来打开URL地址,获取编码为utf-8

得到的标签或信息在显示时用gb18030来显示。

book_page = requests.get("https://book.douban.com/subject/26906797/", )
print(book_page.status_code)
status_code = book_page.status_code

#if status_code == 200:
#    print("The content is " + book_page.content)
    

bs_page = BeautifulSoup(book_page.content, features=‘lxml‘, from_encoding=‘utf8‘)
 
print(u"Article_info is {}")
article_info = bs_page.find_all(id=‘info‘)
for article in article_info:
    article.encode(‘gb18030‘)
    print(article.text)

  

用Python requests beautifulSoup 获取并显示中文信息

标签:lxml   coding   find   beautiful   com   sts   div   enc   from   

原文地址:https://www.cnblogs.com/hanxiangmin/p/11294420.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!