标签:strong block 设计 panda http exce 简单的 地方 print
本文主要介绍 Web Scraping 的基本原理,基于Python语言,大白话,面向可爱的小白(^-^)。
很多时候,大家会把,在网上获取Data的代码,统称为“爬虫”,
但实际上,所谓的“爬虫”,并不是特别准确,因为“爬虫”也是分种的,
常见的“爬虫”有两种:
而,这篇文章,主要讲解的是第二种“爬虫”(Web Scraper)的原理。
简单的说 Web Scraping,(在本文里)就是指,用Python代码,从肉眼可见的网页上,抓取数据。
因为,重复工作太多,自己做,可能会累死!
首先,你需要了解,网页是怎么呈现在,我们屏幕上的;
然后,我们要了解,使用Python,如何实现它,实现原理基本就四个步骤:
这篇文章,重点在于讲解实现的思路和过程,
所以,并非详尽,也并没有给出实际的代码,
但是,这个思路,几乎是网页抓取的通用套路。
就写到这里吧,想起什么再更新,
要是有写的不到位的地方,还请包涵!
标签:strong block 设计 panda http exce 简单的 地方 print
原文地址:https://www.cnblogs.com/bitssea/p/12555045.html