标签:pos www urllib 服务 下载 函数 lock retrieve jpg
#coding:utf-8
import urllib
from lxml import etree
import requests
def Schedule(blocknum,blocksize,totalsize):
‘‘‘‘‘
blocknum:已经下载的数据块
blocksize:数据块的大小
totalsize:远程文件的大小
‘‘‘
per = 100.0 * blocknum * blocksize / totalsize
if per > 100 :
per = 100
print ‘当前下载进度:%d‘%per
user_agent = ‘Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)‘
headers={‘User-Agent‘:user_agent}
r = requests.get(‘http://www.ivsky.com/tupian/ziranfengguang/‘,headers=headers)
#使用lxml解析网页
html = etree.HTML(r.text)
img_urls = html.xpath(‘.//img/@src‘)#先找到所有的img
i=0
for img_url in img_urls:
urllib.urlretrieve(img_url,‘img‘+str(i)+‘.jpg‘,Schedule)
i+=1
Schedule函数包含3个参数: blocknum:已经下载的数据块, blocksize:数据块的大小, totalsize:远程文件的大小
标签:pos www urllib 服务 下载 函数 lock retrieve jpg
原文地址:https://www.cnblogs.com/guguobao/p/9521157.html