码迷,mamicode.com
首页 > 编程语言 > 详细

python3 爬虫小技巧,

时间:2020-04-07 12:37:13      阅读:90      评论:0      收藏:0      [点我收藏+]

标签:图片   inf   footer   keyword   sea   head   bsp   res   不同的   

  前几天采集一个网站的数据,发现在翻页查询数据的时候,网址是不变的,其实这样的情况很多,关键是获取到真正的URL

  比如:查询链接是:http://so.nen.com.cn/m_fullsearch/searchurl/mfullsearch!descResult.do 翻页r查询,地址栏里面的url始终是不变的,但实际上是变化的,

  具体的参数变化可以在From Data看到,如下图:技术图片

 

   

  所以具体的完整的url应该是:http://so.nen.com.cn/m_fullsearch/searchurl/mfullsearch!descResult.do?keywords=%E7%96%AB%E6%83%85&channelId=0&channelId=0&channel_id=0&size=&header=&keywords=&footer=&orderFlg=&startPage=&endPage=&pageNoCurrent=2&pageNoRecode=&allChannelId=

 

不过有的参数在 Query String 里面,不同的网站可能不一样,只有F12查看一下就可以

12技术图片

 

 技术图片

 

python3 爬虫小技巧,

标签:图片   inf   footer   keyword   sea   head   bsp   res   不同的   

原文地址:https://www.cnblogs.com/shaosks/p/12652385.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!