码迷,mamicode.com
首页 > 编程语言 > 详细

我的第一个的python抓取 单页面爬虫

时间:2018-02-03 13:01:39      阅读:181      评论:0      收藏:0      [点我收藏+]

标签:write   保存   sts   pytho   dal   本地   open   def   get   

爬取豆瓣推荐书籍页的图书的图片保存到本地

# -*- coding UTF-8 -*- 

import re
import requests
import os

def getsite(url):
    website=requests.get(url)

url="https://book.douban.com/tag/%E7%BC%96%E7%A8%8B"
website=requests.get(url)

links=re.findall("(https:\/\/img3.doubanio.com\/mpic\/(\w+\.jpg))",website.text)

dir="test/"
if not os.path.exists(dir):
    os.makedirs(dir)
count=0
for link,name in links:
    with open(dir+name,‘wb‘) as img:
        file=requests.get(link)
        img.write(file.content)
        img.close()
        count+=1
        print("已抓取%s张图片"%(count))

我的第一个的python抓取 单页面爬虫

标签:write   保存   sts   pytho   dal   本地   open   def   get   

原文地址:http://blog.51cto.com/8292516/2068383

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!