码迷,mamicode.com
首页 > 编程语言 > 详细

自从教学弟学会了Python,他每天都爬一些好不正经的图片!

时间:2018-09-11 14:19:05      阅读:163      评论:0      收藏:0      [点我收藏+]

标签:main   技术   二维码   函数   分享图片   space   时间   域名   bsp   

学弟他作为一个宅男,闲着没事就喜欢用我教他的Python来爬一些 “资源” 套图欣赏,我每次都骂他你总是这样找个女朋友不好点,他不以为然,依旧如故。气的我只好把他写的东西发出来让更多的人来谴责他!

技术分享图片

 

我们先看一下他的效果图:

技术分享图片

 

技术分享图片

 

技术分享图片

 

第一步:选取爬取的分类

第二步:开始爬取(默认保存C:sex, )

技术分享图片

 

好了我们来看看代码

一、导包

技术分享图片

 

二、定义全局变量

网址我和谐了,怕带坏你们。As we know,这些网站的域名一直变但是网站结构一般不会变化,所以日后变化就改动一下url变量就行。

技术分享图片

技术分享图片

 

三、总共八个核心处理函数

1、伪装报头访问函数

技术分享图片

 

2、菜单,捕获输入函数

技术分享图片

 

3、爬虫调度器函数

技术分享图片

 

4、加载页面函数

技术分享图片

 

5、加载图片

技术分享图片

 

6、生成文件夹

默认c:/sex/

技术分享图片

 

8、main

技术分享图片

 

四、程序运行效果

技术分享图片

 

技术分享图片

 

技术分享图片

 

 

全部是7个分类,使用多进程,保存了多少个分类就自动开多少个进程。输入目录对应编号就可以了,输入0时则结束输入,开始爬取

(每次运行前,如果旧的c:/sex/没删除,则应先手动删除)写的有点仓促,以后有时间会完善这个程序。

 

喜欢的小伙伴们可以搜索我们个人的微信公众号“程序员的成长之路”点击关注或扫描下方二维码

技术分享图片

自从教学弟学会了Python,他每天都爬一些好不正经的图片!

标签:main   技术   二维码   函数   分享图片   space   时间   域名   bsp   

原文地址:https://www.cnblogs.com/cxydczzl/p/9626815.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!