码迷,mamicode.com
首页 > 编程语言 > 详细

python写个图片爬虫

时间:2016-03-26 08:48:12      阅读:206      评论:0      收藏:0      [点我收藏+]

标签:爬虫   pthon   requests   

[root@MGServer pythonscript]# vim getimg.py 

#!/usr/bin/python

#encoding:utf8

import requests,sys,re

#定义一个方法,获取网站图片,并下载

def getimg(url):

    #请求url内容

    page=requests.get(url)

    #获取内容

    pagetext=page.content

    #定义正则表达式。

    reg=r‘src=.*?\.jpg‘

    #对获取的内容进行匹配

    imglist=re.findall(reg,pagetext)

    #为保存的图片文件命名

    imgname=1

    #循环获取带有src的url地址列表

    for x in imglist:

        #删除url中的前面src=字段

        x=x.lstrip(‘src="‘)

        try:

            #下载图片

            img=requests.get(x)

            #打开文件,由于imgname是用int递增,所以要使用str把imgname变成str。

            of=open(‘/root/‘+str(imgname)+".jpg",‘wb‘)

            #保存文件

            of.write(img.content)

            #关闭文件打开操作

            of.close()

            #文件名递增

            imgname+=1

        except IOError,e:

            print "url is error:"+str(e)

            #sys.exit(1)

            #发生错误忽略

            pass

#执行定义的函数

getimg(sys.argv[1])

执行方法:

python getimg.py  http://www.163.com


python写个图片爬虫

标签:爬虫   pthon   requests   

原文地址:http://swenzhao.blog.51cto.com/3451741/1755074

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!