码迷,mamicode.com
首页 > 其他好文 > 详细

爬取千图网上的高清图片

时间:2018-07-22 18:06:37      阅读:493      评论:0      收藏:0      [点我收藏+]

标签:ror   erro   ret   cep   www   dal   port   异常   urlopen   

贴下源码

配置环境:python3.5  win10

import urllib.request
import re
#遍历其中端午节的海报网址页数 for i in range(1,10): pageurl="http://www.58pic.com/tupian/duanwujie-800-0-"+str(i)+".html" data=urllib.request.urlopen(pageurl).read().decode("utf-8","ignore") #正则表达并不固定只要能找到相同的规律即可!!! pat=‘http://pic.qiantucdn.com/58pic/28/(.*?).jpg!‘ imglist=re.compile(pat).findall(data) for j in range(0,len(imglist)):
#进行异常值处理,防止爬虫轻易奔溃 try: thisimg=imglist[j] thisimgurl="http://pic.qiantucdn.com/58pic/28/"+thisimg+".jpg!" file="D:/爬虫/"+str(i)+str(j)+".jpg"
#这里我存在我D盘爬虫文件夹下的 urllib.request.urlretrieve(thisimgurl,filename=file) print("第"+str(i)+"页第"+str(j)+"个图片爬取成功") except urllib.error.URLError as e: if hasattr(e,"code"): print (e.code) if hasattr(e,"reason"): print (e.reason) except Exception as e: print (e)

  

爬取千图网上的高清图片

标签:ror   erro   ret   cep   www   dal   port   异常   urlopen   

原文地址:https://www.cnblogs.com/chao-sir/p/9350886.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!