码迷,mamicode.com
首页 > 编程语言 > 详细

Python爬虫实现抓取网页图片

时间:2015-11-04 19:46:06      阅读:313      评论:0      收藏:0      [点我收藏+]

标签:python爬虫   python抓取贴吧图片   


在逛贴吧的时候看见贴吧里面漂亮的图片,或有漂亮妹纸的图片,是不是想保存下来?

但是有的网页的图片比较多,一个个保存下来比较麻烦。

最近在学Python,所以用Python来抓取网页内容还是比较方便的:

所以就尝试了一下


------code-------

#coding=utf-8

import re   
import urllib   //导入模块
   
def gethtml(url):   //自定义函数,传参获取网页内容
   page=urllib.urlopen(url)
   html=page.read()
   return html

def getimg(html):   //自定义函数,获取需要的内容

   reg=r‘src="(.+?\.jpg)" pic_ext‘ //正则表达式,抓取图片链接,见html.jpg
   imgre=re.compile(reg)           //把正则表达式编译成一个正则表达式对象,以提高抓取效率 
   imglist=re.findall(imgre,html)  //获取html中所有匹配到的正则表达式对象
   x=1
   for imgurl in imglist:          //循环遍历整个链接列表
      urllib.urlretrieve(imgurl,‘f:\\myimg\\myimage\\ %s.jpg‘ % x) //保存图片至目标文件夹
      x=x+1
      
html=gethtml("  //要获取的网页链接 
print getimg(html)

-----------------------------------

图示:

如果有疑问
请下载图示图片查看
我用的是猎豹浏览器


本文出自 “kuing home pages” 博客,请务必保留此出处http://kuing.blog.51cto.com/9635522/1709672

Python爬虫实现抓取网页图片

标签:python爬虫   python抓取贴吧图片   

原文地址:http://kuing.blog.51cto.com/9635522/1709672

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!