码迷,mamicode.com
首页 > 其他好文 > 详细

实例练习:正则表达式爬取百度贴吧照片

时间:2020-02-25 21:48:51      阅读:76      评论:0      收藏:0      [点我收藏+]

标签:src   col   ima   coding   url   图片   def   code   res   

  代码出自小甲鱼,复盘,省略了图片的下载部分

  正则真的太好用了,不过关键在你想不想的到最高效的正则表达式

 1 #!/usr/bin/env python
 2 # -*- coding: utf-8 -*-
 3 import urllib.request
 4 import re
 5 
 6 url = "https://tieba.baidu.com/p/6512141636"
 7 
 8 def web(url):
 9     response = urllib.request.urlopen(url)
10     html = response.read().decode(UTF-8,ignore)
11     test = r<img class="BDE_Image" src="([^"]+\.jpg)"
12     out = re.findall(test,html)
13     print(out)
14 web(url)

 

实例练习:正则表达式爬取百度贴吧照片

标签:src   col   ima   coding   url   图片   def   code   res   

原文地址:https://www.cnblogs.com/vhhi/p/12363937.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!