码迷,mamicode.com
首页 > 其他好文 > 详细

图片爬取和思路分析

时间:2018-05-21 16:25:07      阅读:144      评论:0      收藏:0      [点我收藏+]

标签:搜索   range   open   dal   sel   oba   准备   for   style   

//我先准备一个记事本准备页面网址

技术分享图片

s=页数

q=搜索值

//爬取相对的网页数据

技术分享图片

//找到图片的网址在源代码中ctrl+f 找到TB1xjf5dFhM8kjiszfwxxcib的代码复制用正则精准爬取

//遍历结果

import urllib.request
import re
suo="夹克男"
key=urllib.request.quote(suo)
for i in range(0,1):
url="http://s.taobao.com/list?spm=a21bo.2017.201867-links-0.5.5af911d9M4bXRK&q="+str(key)+"&cat=16&style=grid&seller_type=taobao&bcoffset=12&s="+str(i*60)
jie=urllib.request.urlopen(url).read().decode("utf-8","ignore")
string=‘"pic_url":"//(.*?)"‘
go=re.compile(string).findall(str(jie))
for j in range(len(go)):
temg=go[i]
temg1="http://"+temg
dom="D:/image/"+str(i)+str(j)+".jpg"
urllib.request.urlretrieve(temg1,filename=dom)

图片爬取和思路分析

标签:搜索   range   open   dal   sel   oba   准备   for   style   

原文地址:https://www.cnblogs.com/chunqing/p/9067183.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!