标签:
本人比较喜欢海贼王漫画,所以特意选择了网站http://www.mmonly.cc/ktmh/hzw/list_34_2.html来抓取海贼王的图片。
因为是刚刚学习python,代码写的不好,不要喷。
功能主要抓取此网页的图片如下:
贴代码:
#!/usr/bin/env python # -*- coding: utf-8 -*- import urllib2 import re url1 = "http://www.mmonly.cc/ktmh/hzw/list_34_2.html" request = urllib2.Request(url1) req = urllib2.urlopen(request) buf = req.read() url_list = re.findall(r‘src=\"http://t1.+?\.png‘, buf)#正则表达式 #for img_url in url_list: # print img_url[5:] index = 1 for img_url in url_list: f = open(str(index)+‘.png‘,‘wb‘) img_req = urllib2.urlopen(img_url[5:]) img_buf = img_req.read() f.write(img_buf) f.close() index +=1
执行代码后的效果:
标签:
原文地址:http://www.cnblogs.com/nx520zj/p/5788528.html