Python批量下载百度贴吧贴子图片

时间：2016-01-07 22:50:04 阅读：191 评论：0 收藏：0 [点我收藏+]

标签：

批量下载贴吧里面某个贴子的所有图片，或者只下载某一页中的图片。

#!/usr/bin/env python3
import re
import urllib.request


class DownTiebaImg:

    def __init__(self, url):
        self.url = url

    def getImgLinks(self):
        response = urllib.request.urlopen(self.url)
        pattern = re.compile(r‘<img class="BDE_Image" src="(.+?)" size=‘, re.S)
        imgLinks = re.findall(pattern, response.read().decode(‘utf-8‘))
        return imgLinks

    def saveImgs(self, path=‘./‘, pn=‘‘):
        imgLinks = self.getImgLinks()
        if not path.endswith(‘/‘):
            path += ‘/‘
        name = 0
        for link in imgLinks:
            print(link)
            urllib.request.urlretrieve(link, path + str(pn) + ‘_%s.jpg‘ % name)
            name += 1
        print(‘completed‘)


def main(path=‘./‘):
    url = input(‘输入贴子网址：‘)
    Img = DownTiebaImg(url)
    pn = input(‘输入想保存的贴子页数，留空为url所在的当前页，输入 x 为贴子前x页:\n‘)
    if not pn:
        Img.saveImgs(path)
    else:
        _url = url.split(‘?pn=‘)
        Img.url = _url[0]
        Img.saveImgs(path, 1)
        for i in range(2, int(pn) + 1):
            _url = url.split(‘=‘)
            Img.url = _url[0] + ‘=‘ + str(i)
            Img.saveImgs(path, i)

if __name__ == ‘__main__‘:
    main()

运行如下：下载了图中网址贴子前3页中吧友所发的图片。图中输入3下载前3页，如果留空页码则下载第2页，因为输入的贴子网址是pn=2。

技术分享

Python批量下载百度贴吧贴子图片

标签：

原文地址：http://www.cnblogs.com/aeropig/p/py_down_tieba_pics.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行