码迷,mamicode.com
首页 > 其他好文 > 详细

《百年孤独》百度百科的爬取

时间:2020-05-03 20:58:08      阅读:82      评论:0      收藏:0      [点我收藏+]

标签:https   sts   print   get   ext   运用   ike   aik   源代码   

一、参考网址:https://baike.baidu.com/item/%E7%99%BE%E5%B9%B4%E5%AD%A4%E7%8B%AC/688708?fr=aladdin

二、源代码:

import requests
def A():
try:
r=requests.get(url)
r.raise_for_status()
r.encoding=‘utf-8‘
return r.text
except:
return ""
url=‘https://baike.baidu.com/item/%E7%99%BE%E5%B9%B4%E5%AD%A4%E7%8B%AC/688708?fr=aladdin‘
print(A())

三、成果:

技术图片

 

 

 

 

四、只爬取了文字没有爬取图片,可能我的成果难度系数比较低,望进一步学习爬虫熟练运用。

《百年孤独》百度百科的爬取

标签:https   sts   print   get   ext   运用   ike   aik   源代码   

原文地址:https://www.cnblogs.com/cqyqqx98576/p/12822992.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!