在逛贴吧的时候看见贴吧里面漂亮的图片,或有漂亮妹纸的图片,是不是想保存下来?
但是有的网页的图片比较多,一个个保存下来比较麻烦。
最近在学Python,所以用Python来抓取网页内容还是比较方便的:
所以就尝试了一下
------code-------
#coding=utf-8 import re import urllib //导入模块 def gethtml(url): //自定义函数,传参获取网页内容 page=urllib.urlopen(url) html=page.read() return html def getimg(html): //自定义函数,获取需要的内容 reg=r‘src="(.+?\.jpg)" pic_ext‘ //正则表达式,抓取图片链接,见html.jpg imgre=re.compile(reg) //把正则表达式编译成一个正则表达式对象,以提高抓取效率 imglist=re.findall(imgre,html) //获取html中所有匹配到的正则表达式对象 x=1 for imgurl in imglist: //循环遍历整个链接列表 urllib.urlretrieve(imgurl,‘f:\\myimg\\myimage\\ %s.jpg‘ % x) //保存图片至目标文件夹 x=x+1 html=gethtml(" //要获取的网页链接 print getimg(html) ----------------------------------- 图示: 如果有疑问 请下载图示图片查看 我用的是猎豹浏览器
本文出自 “kuing home pages” 博客,请务必保留此出处http://kuing.blog.51cto.com/9635522/1709672
原文地址:http://kuing.blog.51cto.com/9635522/1709672