码迷,mamicode.com
首页 > 编程语言 > 详细

python 实现汽车之家车型数据爬虫

时间:2016-07-08 20:11:43      阅读:335      评论:0      收藏:0      [点我收藏+]

标签:python 爬虫

爬虫保存数据库的样子:

技术分享

详细数据在json_text字段里面

安装使用方法:

git clone https://github.com/shancang/spider.git 
pip install -r requirements.txt
mysql spider< sql/createTable.sql

修改配置

spider/config.py

# -*- coding: utf-8
#日志----------------------------------------
#日志目录
LOG_DIR= "/tmp/spider"
#日志级别:debug,info,warning,error,critical
LOG_LEVEL = "info"
#process-----------------------------------
#pid 文件
PID_FILE = "/tmp/spider/spider.pid"
#线程数量
THARED_NUMBER = 6
#数据库------------------------------------
DB_USER = "spider"
PASSWORD = "123456"
DB_HOST = "localhost"
PORT = "3306"
DB_NAME = "spider"

进程管理

python setup.py start #启动
python setup.py stop  #停止
python setup.py status # 查看运行状态

具体详细请移步

https://github.com/shancang/spider   

代码仅供学习交流,不得做商业使用,不得恶意使用,造成后果请自行负责。

本文出自 “运维笔记” 博客,转载请与作者联系!

python 实现汽车之家车型数据爬虫

标签:python 爬虫

原文地址:http://sandy521.blog.51cto.com/5728588/1812623

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!