总体功能:下载百度贴吧网页的图片
这个例子延续了上一个抓取贴吧楼主发布内容的例子,上一个例子是把图片剔除掉了,这边重新做了一个下载图片的demo,比较简单。
代码:
# -*- encoding:utf-8 -*- # 下载贴吧的图片 import re import urllib import urllib2 #下载百度贴吧图片类 class DownloadImg: def getImage(self,Url): request = urllib2.Request(Url) response = urllib2.urlopen(request) pattern = re.compile(r'<img class="BDE_Image" src="(.*?)" pic_ext=',re.S) images = re.findall(pattern,response.read().decode("utf-8")) name = 1 for img in images: print img #urlretrieve(url, filename=None, reporthook=None, data=None) #把远程的文件下载到本地 urllib.urlretrieve(img,'%s.jpg' %name) name += 1 URL = raw_input(r'请输入帖子网址:') dlImg = DownloadImg() dlImg.getImage(URL)
版权声明:本文为博主原创文章,未经博主允许不得转载。
原文地址:http://blog.csdn.net/andrewseu/article/details/47205527