用Beautifulsoup 来爬取贴吧图片

时间：2017-05-02 16:48:18 阅读：160 评论：0 收藏：0 [点我收藏+]

标签：code find pen 网页文件 class dir logs mil

import urllib.request
import bs4
import  re
import os

url="https://tieba.baidu.com/p/1988291937?fr=ala0&pstaala=1&tpl=5&isgod=0"
html=urllib.request.urlopen(url)
bsobj=bs4.BeautifulSoup(html)    #将整个网页的标签提取出来

namelist=bsobj.findAll(‘img‘,{‘class‘:‘BDE_Image‘})#找到img标签 并放到集合中

foder=‘c://hand‘   建立一个文件夹
os.mkdir(foder)
os.chdir(foder)

for name in namelist:
    addr=name.attrs[‘src‘] #迭代每一条标签src属性
    filename=addr.split(‘/‘)[-1]
    urllib.request.urlretrieve(addr,filename,None)


另一种迭代并保存网页图片的方式

 for name in namelist:
#     addr=name.attrs[‘src‘] #迭代每一条标签src属性    
#     filename=addr.split(‘/‘)[-1]
#     with open(filename,‘wb‘) as f:
#         response = urllib.request.urlopen(addr)    
#         img = response.read()
#         f.write(img)

标签：code find pen 网页文件 class dir logs mil

原文地址：http://www.cnblogs.com/caojunjie/p/6796711.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行