标签:python 爬虫
爬虫保存数据库的样子:
详细数据在json_text字段里面
安装使用方法:
git clone https://github.com/shancang/spider.git pip install -r requirements.txt mysql spider< sql/createTable.sql
修改配置
spider/config.py
# -*- coding: utf-8 #日志---------------------------------------- #日志目录 LOG_DIR= "/tmp/spider" #日志级别:debug,info,warning,error,critical LOG_LEVEL = "info" #process----------------------------------- #pid 文件 PID_FILE = "/tmp/spider/spider.pid" #线程数量 THARED_NUMBER = 6 #数据库------------------------------------ DB_USER = "spider" PASSWORD = "123456" DB_HOST = "localhost" PORT = "3306" DB_NAME = "spider"
进程管理
python setup.py start #启动 python setup.py stop #停止 python setup.py status # 查看运行状态
具体详细请移步
https://github.com/shancang/spider
代码仅供学习交流,不得做商业使用,不得恶意使用,造成后果请自行负责。
本文出自 “运维笔记” 博客,转载请与作者联系!
标签:python 爬虫
原文地址:http://sandy521.blog.51cto.com/5728588/1812623