码迷,mamicode.com
首页 > 编程语言 > 详细

python抓取网页图片

时间:2016-08-19 18:53:17      阅读:289      评论:0      收藏:0      [点我收藏+]

标签:

本人比较喜欢海贼王漫画,所以特意选择了网站http://www.mmonly.cc/ktmh/hzw/list_34_2.html来抓取海贼王的图片。

因为是刚刚学习python,代码写的不好,不要喷。

功能主要抓取此网页的图片如下:

技术分享

 贴代码:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import urllib2
import re
url1 = "http://www.mmonly.cc/ktmh/hzw/list_34_2.html"
request = urllib2.Request(url1)
req = urllib2.urlopen(request)
buf = req.read()
url_list = re.findall(rsrc=\"http://t1.+?\.png, buf)#正则表达式
#for img_url in url_list:
#    print img_url[5:]

index = 1
for img_url in url_list:
    f = open(str(index)+.png,wb)
    img_req = urllib2.urlopen(img_url[5:])
    img_buf = img_req.read()
    f.write(img_buf)
    f.close()
    index +=1

执行代码后的效果:

技术分享

 

python抓取网页图片

标签:

原文地址:http://www.cnblogs.com/nx520zj/p/5788528.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!