码迷,mamicode.com
首页 > 编程语言 > 详细

Python爬虫9-----实例-抓取上海高级人民法院网开庭公告数据

时间:2018-10-16 17:43:38      阅读:263      评论:0      收藏:0      [点我收藏+]

标签:知识   toc   动态加载   爬虫   data   返现   strong   目标地址   目标   

通过前面的文章已经学习了基本的爬虫知识,通过这个例子进行一下练习,毕竟前面文章的知识点只是一个

一个单独的散知识点,需要通过实际的例子进行融合。

分析网站

其实爬虫最重要的是前面的分析网站,只有对要爬取的数据页面分析清楚,才能更方便后面爬取数据

目标站和目标数据
目标地址:http://www.hshfy.sh.cn/shfy/gweb/ktgg_search.jsp
目标数据:目标地址页面的中间的案开庭公告数据

对数据页面分析
从打开页面后可以看到默认的数据是一个月的数据,即当天到下个月该天的
通过翻页可以返现这个时候页面的url地址是不变的,所以这里我们大致就可以判断出,中间表格的数据是通过js动态加载的,我们可以通过分析抓包,找到真实的请求地址

 

Python爬虫9-----实例-抓取上海高级人民法院网开庭公告数据

标签:知识   toc   动态加载   爬虫   data   返现   strong   目标地址   目标   

原文地址:https://www.cnblogs.com/edeny/p/9798831.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!