1.多线程的创建 import threading t = t.theading.Thread(target, args……) t.SetDeamon(True)//设置为守护进程 t.start(),启动线程 t.join(),阻塞当前线程,即使得在当前线程结束时,不会退出。会等到子线程结束之后才 ...
分类:
编程语言 时间:
2016-11-04 23:15:41
阅读次数:
299
1.启用Package Control,利用它进行插件安装; 启用方法:菜单栏-view-show console 在弹出的输入框内,输入以下代码,按回车,稍后会出现package control安装成功的提示框,点击确定 import urllib2,os;pf='Package Control. ...
分类:
其他好文 时间:
2016-11-04 19:43:41
阅读次数:
246
模块: (1)url管理器:对url进行管理 (2)网页下载器(urllib2):将需要爬取的url指定的网页以字符串的形式下载下来 (3)网页解释器(BeautifulSoup):解析 利用urllib2下载网页的方法: 方法1: 方法2: 方法3: 网页解释器种类: (1)正则表达式 (2)ht ...
分类:
编程语言 时间:
2016-11-04 16:45:13
阅读次数:
265
以前爬虫用urllib2来实现,也用过scrapy的爬虫框架,这次试试requests,刚开始用,用起来确实比urllib2好,封装的更好一些,使用起来简单方便很多。 安装requests库 最简便的方法就是使用pip来安装:pip install requests;如果需要安装特定版本,则在后面加 ...
分类:
编程语言 时间:
2016-11-04 16:43:27
阅读次数:
554
转:http://www.cnblogs.com/yuxc/archive/2011/08/01/2123995.html Python 标准库中有很多实用的工具类,但是在具体使用时,标准库文档上对使用细节描述的并不清楚,比如 urllib2 这个 HTTP 客户端库。这里总结了一些 urllib2 ...
分类:
编程语言 时间:
2016-11-01 19:24:32
阅读次数:
236
import urllib2 import json response = urllib2.urlopen('http://imanage.spreadtrum.com/imanage/home/pm?act=GetAllUser') all_staff = [] result = response ...
分类:
编程语言 时间:
2016-10-31 22:09:26
阅读次数:
248
# -*- coding:utf -8 -*-import urllib2import redef getlist(): html = urllib2.urlopen("http://www.quanshu.net/book/0/269/").read() reg = re.compile(r'<l ...
分类:
Web程序 时间:
2016-10-29 16:34:38
阅读次数:
322
你可能对于Python中两个独立存在的-urllib2和-urllib2感到好奇。更有趣的是:它们并不是可以相互代替的。那么这两个模块间的区别是什么,并且这两个我们都需要吗?urllib 和urllib2都是接受URL请求的相关模块,但是提供了不同的功能。两个最显著的不同如下: urllib2可以接 ...
分类:
编程语言 时间:
2016-10-29 09:38:23
阅读次数:
148
项目介绍 使用python抓取京东商城商品(以手机为例)的详细信息,并将相应的图片下载下载保存到本地。 爬取步骤 1.选取种子URL:http://list.jd.com/list.html?cat=9987,653,655 2.使用urllib和urllib2下载网页 3.使用BeautifulS ...
分类:
其他好文 时间:
2016-10-27 17:12:43
阅读次数:
321
1.使用xpath从html文档得到其中元素: <a href="www.abidu.com">123we</a>为了得到其中的123we元素 tree=html.fromstring(***.text) tt=list(set(tree.xpath("//a[@href='www.abidu.co ...
分类:
编程语言 时间:
2016-10-23 11:49:16
阅读次数:
325