码迷,mamicode.com
首页 > Web开发 > 详细

爬虫中使用格式化参数动态修改URL

时间:2020-05-18 00:37:10      阅读:120      评论:0      收藏:0      [点我收藏+]

标签:商品   png   接口   page   nbsp   alt   cti   通过   ima   

在爬取京东商品评论区的过程中,发现每个商品的评论区接口相似,应立即意识到:

技术图片

 

于是编写函数,通过格式化参数动态改变URL

定义fetch_url为商品ID,page为当前评论页数,将原URL中的id和page用%s占位符代替,后面使用%(fetch_url, page)替换

注意:若是单个参数,使用 %page 即可

   如果是多个函数,使用 %(fetch_url, page).而并不是我之前的写法:%fetch_url, %page

def fetch_comment(fetch_url, page=0):

url = ‘https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=%s&score=0&sortType=5&page=%s&pageSize=10&isShadowSku=0&fold=1‘ %(fetch_url, page)

爬虫中使用格式化参数动态修改URL

标签:商品   png   接口   page   nbsp   alt   cti   通过   ima   

原文地址:https://www.cnblogs.com/kintsugi/p/12907735.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!