码迷,mamicode.com
首页 > 编程语言 > 详细

python爬取百度图片代码

时间:2018-04-01 19:58:31      阅读:207      评论:0      收藏:0      [点我收藏+]

标签:python爬虫;

import json import itertools import urllib import requests import os import re import sys word=input("请输入关键字:") path="./ok" if not os.path.exists(path):     os.mkdir(path) word=urllib.parse.quote(word) url = r"http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&fp=result&queryWord={word}&cl=2&lm=-1&ie=utf-8&oe=utf-8&st=-1&ic=0&word={word}&face=0&istype=2nc=1&pn={pn}&rn=60" urls=(url.format(word=word,pn=x)for x in itertools.count(start=0,step=60)) index=0 str_table = {     '_z2C$q': ':',     '_z&e3B': '.',     'AzdH3F': '/' } char_table = {     'w': 'a',     'k': 'b',     'v': 'c',     '1': 'd',     'j': 'e',     'u': 'f',     '2': 'g',     'i': 'h',     't': 'i',     '3': 'j',     'h': 'k',     's': 'l',     '4': 'm',     'g': 'n',     '5': 'o',     'r': 'p',     'q': 'q',     '6': 'r',     'f': 's',     'p': 't',     '7': 'u',     'e': 'v',     'o': 'w',     '8': '1',     'd': '2',     'n': '3',     '9': '4',     'c': '5',     'm': '6',     '0': '7',     'b': '8',     'l': '9',     'a': '0' } i=1 char_table = {ord(key): ord(value) for key, value in char_table.items()} for url in urls:     html=requests.get(url,timeout=10).text     a=re.compile(r'"objURL":"(.*?)"')     downURL=re.findall(a,html)          for t in downURL:         for key, value in str_table.items():                 t = t.replace(key, value)         t=t.translate(char_table)         try:                          html_1=requests.get(t)             if str(html_1.status_code)[0]=="4":                                 print('失败1')                 continue            except Exception as e:             print('失败2')             continue         with open(path+"/"+str(i)+".jpg",'wb') as f:             f.write(html_1.content)         i=i+1


python爬取百度图片代码

标签:python爬虫;

原文地址:http://blog.51cto.com/11623741/2093582

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!