打开sublime text2,按Ctrl+~调出console粘贴以下代码到底部命令行并回车:import urllib2,os;pf='Package Control.sublime-package';ipp=sublime.installed_packages_path();os.makedi...
分类:
系统相关 时间:
2015-09-04 07:05:47
阅读次数:
249
add-apt-repository ppa:webupd8team/sublime-text-2apt-get updateapt-get install sublime-text安装控制器:ctrl+`,调出控制台:输入:import urllib2,os;pf='Package Control...
分类:
系统相关 时间:
2015-08-31 09:57:43
阅读次数:
230
requests简介
requests是python的一个HTTP客户端库,跟urllib,urllib2类似,但是python的标准库urllib2提供了大部分需要的HTTP功能,但是API太逆天了,一个简单的功能就需要一大堆代码。
Requests 使用的是 urllib3,因此继承了它的所有特性。Requests 支持 HTTP 连接保持和连接池,支持使用 cookie 保持会话...
分类:
编程语言 时间:
2015-08-29 12:38:32
阅读次数:
253
#!/usr/bin/env python #coding:utf-8import urllib2,re,sys,os,types #from bs4 import BeautifulSoup ...
分类:
其他好文 时间:
2015-08-28 07:14:24
阅读次数:
201
调用图灵机器人api#!/usr/bin/env python# coding=utf-8import urllibimport urllib2api_url='http://www.tuling123.com/openapi/api'key='26b1ef2041bcfac6079ce76e332...
分类:
Web程序 时间:
2015-08-28 00:37:44
阅读次数:
303
1. urllib2的opener和handler概念 1.1Openers: 当你获取一个URL你使用一个opener(一个urllib2.OpenerDirector的实例)。正常情况下,我们使用默认opener:通过urlopen。但你能够创建个性的openers。可以用build_ope.....
分类:
编程语言 时间:
2015-08-21 22:57:00
阅读次数:
195
Q1:HTTP Error 403: Forbidden python中经常使用urllib2.urlopen函数提取网页源码,但是有些时候这个函数返回的却是:HTTP Error 403: Forbidden,这表明源网站不允许爬虫进行爬取 解决方法:伪装成浏览器进行访问 #!/usr/bin/e...
分类:
编程语言 时间:
2015-08-20 10:23:15
阅读次数:
132
经常去站长工具查找某个域名的IP,然后定位这个IP的位置,位于哪里,如哪家省运营商,python可以很好的完成这个任务,主要使用urllib2和re模块
下面就直接贴代码了:
import urllib2
import re
url="ip.chinaz/?IP=211.152.42.6"
res=urllib2.urlopen(url)
msg=res.read()
#此处一定...
分类:
编程语言 时间:
2015-08-19 20:39:11
阅读次数:
136
最近准备深入学习Python相关的爬虫知识了,如果说在使用Python爬取相对正规的网页使用"urllib2 + BeautifulSoup + 正则表达式"就能搞定的话;那么动态生成的信息页面,如Ajax、JavaScript等就需要通过"Phantomjs + CasperJS + Selenium"来实现了。所以先从安装和功能介绍入门,后面在介绍一些Python相关的爬虫应用。基础性文章希望对你有所帮助~...
分类:
编程语言 时间:
2015-08-19 20:22:32
阅读次数:
201
#!/usr/bin/python
#coding:UTF-8
importurllib,urllib2,cookielib,time,re,random
classLogin:
_loginurl=‘http://home.51cto.com/index.php?s=/Index/doLogin‘
_ua=‘*****‘#username
_ps=‘*****‘#password
_re=‘src="(.+?)"‘
_headers=[(‘User-agent‘,‘Mozilla/4.0(compati..
分类:
编程语言 时间:
2015-08-19 17:43:20
阅读次数:
178