Python3---AJAX---爬虫

时间：2019-12-19 13:25:53 阅读：97 评论：0 收藏：0 [点我收藏+]

前言

该文章主要介绍面对AJAX的网页如何爬去信息，主要作用是适合刚入门爬虫查看学习

修改时间：20191219

天象独行

　　首先，我们先介绍一下什么是AJAX，AJAX是与服务器交换数据并跟新部分网页的艺术，整个过程并没有加载整个页面。下面我们直接举例：

　　1；确定爬虫目标，这里选择豆瓣电影来举例，这里我们点击“加载更多”发现在网页局部发生变化。

　　技术图片

　　2；使用抓包工具抓取数据：

技术图片

　　3；这里主要分析参数page_limit,以及page_start,经过分析，我们发现，page_limit参数表示需要获取电影的数目。page_start参数控制页面显示的页数。下面我们来构建爬虫。

我们先设定算法，计算page_limit以及page_start关系。

技术图片

　　4；设定请求地址，设定GET字典传参，请求头字典

技术图片

　　5；拼接URL，构建请求对象，发送请求，输出请求数据

技术图片

原文地址：https://www.cnblogs.com/aaron456-rgv/p/12066863.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行