码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫的概念

时间:2018-06-01 22:21:12      阅读:257      评论:0      收藏:0      [点我收藏+]

标签:pytho   ref   关于   otto   政府   百度   spi   splay   list   

为什么要做爬虫?

首先请问:都说现在是"大数据时代",那数据从何而来?

爬虫是什么?

百度百科:网络爬虫

关于Python爬虫,我们需要学习的有:

1. Python基础语法学习(基础知识)
2. HTML页面的内容抓取(数据抓取)
3. HTML页面的数据提取(数据清洗)
4. Scrapy框架以及scrapy-redis分布式策略(第三方框架)
6. 爬虫(Spider)、反爬虫(Anti-Spider)、反反爬虫(Anti-Anti-Spider)之间的斗争....

 

爬虫的概念

标签:pytho   ref   关于   otto   政府   百度   spi   splay   list   

原文地址:https://www.cnblogs.com/amou/p/9123508.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!