码迷,mamicode.com
首页 > 编程语言 > 详细

Python爬虫系列(一):从零开始,安装环境

时间:2017-10-18 23:21:15      阅读:425      评论:0      收藏:0      [点我收藏+]

标签:目标   err   4.0   href   lan   学习   bit   img   org   

在上一个系列,我们学会使用rabbitmq。本来接着是把公司的celery分享出来,但是定睛一看,celery4.0已经不再支持Windows。公司也逐步放弃了服役多年的celery项目。恰好,公司找人进来新人也要给他们培训爬虫。接下来,我们就从零开始,学习爬虫,目标是能掌握到执行js,反爬虫这个水平,做一般的商业爬虫没问题。牛小妹,接下来要仔细看了哦。

软件环境:

python 3.6.3:不必说

beautifulsoup4:pip install beautifulsoup4 用来解析HTML

requests2.18:pip install requests 用来请求网页

网上,还大量有urllib,urllib2等玩意,我一一尝试。最后信了这个:

技术分享

事实却是如此。

接下来,我们将用request获取网页。。。。。。

Python爬虫系列(一):从零开始,安装环境

标签:目标   err   4.0   href   lan   学习   bit   img   org   

原文地址:http://www.cnblogs.com/zijiyanxi/p/7689481.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!