码迷,mamicode.com
首页 > 其他好文 > 详细

scrapy从命令行传值

时间:2019-09-18 09:14:54      阅读:83      评论:0      收藏:0      [点我收藏+]

标签:ini   命令行   star   com   字典   ack   imp   形式   urllib   

1.新建文件run.py

from scrapy.cmdline import execute


# tmall:爬虫的名字
# pro=男装为需要传入的参数值
execute([scrapy, crawl, tmall, -a, pro=男装, --nolog])

# 下面是无参数用法
# execute([‘scrapy‘, ‘crawl‘, ‘tmall‘, ‘--nolog‘])

 

2.爬虫.py中重写init方法,传入参数;(字典编码以字符串形式拼接到url后边)

# 倒入头文件 (字典编码后以参数形式拼接到url)
from urllib.parse import urlencode


class TmallSpider(scrapy.Spider):
    name = tmall
    allowed_domains = [tmall.com]

    def __init__(self, pro=None, *args, **kwargs):
        super(TmallSpider, self).__init__(*args, **kwargs)
        self.params = {
            q: pro,
            total_Page: 1,
            jumpto: 1,
        }

        self.start_url = https://list.tmall.com/search_product.htm? + urlencode(self.params)

    def start_requests(self):
        print(self.start_url: + self.start_url)
        # yield scrapy.Request(
        #     url=self.start_url,
        #     callback=self.get_total_page,
        #     dont_filter=True,
        # )

    def get_total_page(self, response):
        pass

 

scrapy从命令行传值

标签:ini   命令行   star   com   字典   ack   imp   形式   urllib   

原文地址:https://www.cnblogs.com/ptwg/p/11538301.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!