Sometimes you might need to modify HTTP requests and responses. This could be for a variety of reasons such as adding global logic handling for HTTP e...
分类:
Web程序 时间:
2015-01-15 07:04:20
阅读次数:
166
小说网站用的程序都是千篇一律的,jieqi + guanguang,无聊时间学习python+django,也做了一个小说网站,下面说一说做这个网站一些过程,制作这种采集站,最要紧的是要有一个好的采集器,在python的世界里面,爬取网页真是小菜一碟,urllib urllib2 requests ...
分类:
数据库 时间:
2015-01-12 14:16:15
阅读次数:
462
如何辨认一个请求的源domain?如何发送和处理cors请求?优势 和 弱点cookie 和 伪装1.http://www.staticapps.org/articles/cross-domain-requests-with-cors2. wikipedia3.
分类:
其他好文 时间:
2015-01-11 16:00:15
阅读次数:
161
bs4:转换成unicode编码,http://www.crummy.com/software/BeautifulSoup/from bs4 import BeautifulSoupsoup = BeautifulSoup(open("index.html"))soup = BeautifulSou...
分类:
编程语言 时间:
2015-01-09 14:06:37
阅读次数:
194
此网站整理的2014年值得一学的pytho项目,http://pycoders.com/2014/
项目资源都在github上,python程序员进阶必备。
就当作2015年的计划吧。先列表,再对号
Projects
1. robobrowser
A library for web scraping built on Requests and BeautifulSou...
分类:
编程语言 时间:
2015-01-08 02:07:30
阅读次数:
301
reactor design pattern 详见:http://en.wikipedia.org/wiki/Reactor_pattern The reactor design pattern is ??an event handling pattern for handling service requests delivered(交付的)concurrently(...
分类:
其他好文 时间:
2015-01-07 19:22:10
阅读次数:
178
功能 1.自动登录csdn 2.查找未评论的资源并自动评论 用到的库 1.python自带的requests,获取以及发送网页数据 2.python自带的time,用作休眠,csdn资源一段时间内只允许评论一个资源,每评论一个资源要休息一段时间 3.BeautifulSoup,解析htm...
分类:
编程语言 时间:
2015-01-07 16:20:56
阅读次数:
274
只要出现Failed requests就会多出现一行要求失败的各原因的数据统计,分别有Connect, Length,与Exception三种,分别代表的意义为:Connect 无法送出要求、目标主机连接失败、要求的过程中联机被中断Length 响应的内容长度不一致(以Content-Lengt.....
分类:
Web程序 时间:
2015-01-07 12:29:49
阅读次数:
466
雅虎给出了优化网站加载速度的34条法则(包括Yslow规则22条) 详细说明,下载转发 ponytail 的译文1.Minimize HTTP Requests 减少HTTP请求图片、css、script、flash等等这些都会增加http请求数,减少这些元素的数量就能减少响应时间。把多个JS、CS...
分类:
Web程序 时间:
2015-01-07 10:39:20
阅读次数:
131
看知乎的时候发现了一个 “如何正确地吐槽” 收藏夹,里面的一些神回复实在很搞笑,但是一页一页地看又有点麻烦,而且每次都要打开网页,于是想如果全部爬下来到一个文件里面,是不是看起来很爽,并且随时可以看到全部的,于是就开始动手了。工具1.Python 2.72.BeautifulSoup分析网页我...
分类:
编程语言 时间:
2015-01-03 19:49:03
阅读次数:
187