码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫常用库的安装

时间:2017-05-15 13:08:34      阅读:195      评论:0      收藏:0      [点我收藏+]

标签:设置   image   port   浏览器   控制   官网   load   doc   html   

 

请求库

解析库

存储库

工具库

 

 请求库

urlib re  python内置库

Requests   pip3 install requests  #pip2,pip-conda都是可以选择的

selenium  pip3 install selenium

 

chromedriver 

下载页面:https://sites.google.com/a/chromium.org/chromedriver/

下载解压后,将解压文件放入python\scripts目录下

技术分享

测试

技术分享

 python下输入:

from selenium import webdriver
driver = webdriver.Chrome()

 

顺利打开了网页

技术分享

技术分享

driver.get(‘https://www.python.org‘)  就能打开python官网

 

phantomjs  静默浏览器  无界面浏览器

下载页:http://phantomjs.org/download.html

下载后解压,找个地方存放,进入bin目录,将该目录路径放入系统环境变量下。

进入交互控制台

技术分享

python下输入

from selenium import webdriver
driver = webdriver.PhantomJS()

driver.get(https://www.python.org)
driver.page_source

 

 

网页解析库

lxml      pip3 install lxml

BeautifulSoup   pip3 install beautifulsoup4

pyquery     pip3 install pyquery

  语法同Jquery,pyquery文档 https://pythonhosted.org/pyquery/

 

 

 存储库

pymysql   pip3 install pymysql 

pymongo  pip3 install pymongo

redis  pip3 install redis

 

工具库

flask  web服务,代理设置  pip3 install flask

  flask文档http://docs.jinkan.org/docs/flask/

django  pip3 install django

jupyter  pip3 install jupyter

 

爬虫常用库的安装

标签:设置   image   port   浏览器   控制   官网   load   doc   html   

原文地址:http://www.cnblogs.com/ttrrpp/p/6855656.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!