1、How to force urllib2 not to use a proxyHere is an example to remove proxy settings for all requests:proxy_handler = urllib2.ProxyHandler({})opener =...
分类:
编程语言 时间:
2014-11-24 11:23:32
阅读次数:
180
IOS网络编程:HTTPHTTP定义了一种在服务器和客户端之间传递数据的途径。URL定义了一种唯一标示资源在网络中位置的途径。REQUESTS 和 RESPONSES:客户端先建立一个TCP连接,然后发送一个请求。服务器受到请求处理后发送一个响应向客户端传递数据。然后客户端可以继续发送请求或者关闭这...
分类:
移动开发 时间:
2014-11-22 12:00:25
阅读次数:
253
JSP有9个隐含对象,而EL也有自己的隐含对象。EL隐含对象总共有11 个隐含对象类型说明PageContextjavax.servlet.ServletContext表示此JSP的PageContextPageScopejava.util.Map取得Page范围的属性名称所对应的值RequestS...
分类:
其他好文 时间:
2014-11-22 11:46:36
阅读次数:
301
续上篇文章,网页抓取到手之后就是解析网页了。在Python中解析网页的库不少,我最开始使用的是BeautifulSoup,貌似这个也是Python中最知名的HTML解析库。它主要的特点就是容错性很好,能很好地处理实际生活中各种乱七八糟的网页,而且它的API也相当灵活而且丰富。但是我在自己的正文提取项...
分类:
编程语言 时间:
2014-11-15 17:00:12
阅读次数:
277
今天同事让看一个sql,无意中学到一个查看sql执行情况的命令,以前都是傻傻的等的,今后不用了SELECT percent_complete FROM sys.dm_exec_requests至尊箭神:http://www.zhizunjianshen.com/
分类:
数据库 时间:
2014-11-13 18:45:35
阅读次数:
190
现在经常需要在网页中获取相关内容。其中无非获取网页返回状态,以及查看网页获取的内容几个方面,那么在这方面来看requests可能比urllib2库更简便一些。比如:先用方法获取网页r = requests.get("http://www.baidu.com")#查看返回码r.status_code#...
分类:
编程语言 时间:
2014-11-13 00:21:11
阅读次数:
260
bs3即BeautifulSoup,官方已经停止维护全部转到bs4(BeautifulSoup4)了,官方建议使用bs4兼容python3和python2,可以参看官方文档那么,问题来了。当import lxml.html.soupparser的时候报bs包找不到。可以用以下方法解决:>>> imp...
分类:
Web程序 时间:
2014-11-08 18:07:13
阅读次数:
189
再写一个用BeautifulSoup抓站的工具,体会BeautifulSoup的强大。根据小说索引页获取小说全部章节内容并在本地整合为小说全文。不过不是智能的,不同的站点对代码需要做相应的修改。#!/usr/bin/env pythonimport osimport sysimport reimpo...
分类:
编程语言 时间:
2014-11-08 16:25:57
阅读次数:
199
这里我们重点讲一下find的几种用法,其他的类比: find(name=None, attrs={}, recursive=True, text=None, **kwargs)(ps:只讲几种用法,完整请看官方link :http://www.crummy.com/software/Beautif....
分类:
编程语言 时间:
2014-11-07 18:53:41
阅读次数:
257
最近闲着没事想看小说,找到一个全是南派三叔的小说的网站,决定都下载下来看看,于是动手,在很多QQ群里高手的帮助下(本人正则表达式很烂,程序复杂的正则都是一些高手指导的),花了三四天写了一个脚本需要 BeautifulSoup 和 requests 两个库(我已经把注释写得尽量详细)这个程序的执行速度...
分类:
编程语言 时间:
2014-11-07 09:48:22
阅读次数:
227