码迷,mamicode.com
首页 > 其他好文 > 详细

寒假一(爬虫)

时间:2020-01-27 19:08:58      阅读:70      评论:0      收藏:0      [点我收藏+]

标签:time   com   表达   成功   表达式   ade   http   sts   search   

在爱网上自己学习爬虫,并进行了一个实践。网站取自于https://www.bilibili.com/video/av75562300?from=search&seid=11774811603250332545

针对于https://vmgirls.com网站,对其一个子网站进行了爬去

采用requests方法,从网站前台获取网站的布局以及信息

由于网站有自我保护,获取到的网站信息为:

技术图片

 

 

由于header的缘故,我选择使用网站本身的header

技术图片

 

 其代码为:技术图片

 

 为了防止爬取网站图片的时候网站奔溃掉,选择了使用time包

将时间调整为一秒钟爬取一次

调用re的findall方法利用正则表达式,将图片全部保存下来

最后成功将图片保存在一个文件夹下

 

寒假一(爬虫)

标签:time   com   表达   成功   表达式   ade   http   sts   search   

原文地址:https://www.cnblogs.com/zjm15511858030/p/12236392.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!