最近想做一个图书馆的客户端,由于学校没有提供API,只能模拟登陆然后爬取数据了。
首先要解决的就是登陆问题,其实会了之后并不难,我在此竟然耗费了两天……都是一些细节问题。
采用HTTPclient模拟请求,需要注意:
HttpClient(DefaultHttpClient)代表了一个会话,在同一个会话中,HttpClient对cookie自动进行管理(当然,也可以在程序中进行控制...
分类:
Web程序 时间:
2014-12-18 17:05:01
阅读次数:
206
web服务器压力测试工具:ab一、apache压力测试工具ab是apache自带的一款测试工具,功能非常强大语法格式:ab【option】URL-cconcurrency:一次性发起的请求个数,默认为1;-i:测试时使用HEAD方法,默认为GET;-k:启用HTTP长连接请求方式;-nrequests:发起的模拟请求总个数;..
分类:
Web程序 时间:
2014-10-01 12:45:11
阅读次数:
222
最近在做的一个项目..由于全是通过远程http请求来调用php的接口程序..接收到的参数和返回的内容对开发人员来说都是未知不可见的..虽然可以通过直接在脚本中模拟请求..但由于实际环境复杂的多..调试极其不方便.于是想是否可以写一个函数用来记录对php接口调用的情况.想到以前看到过的一个php函数r...
分类:
Web程序 时间:
2014-09-18 20:38:24
阅读次数:
296
1,curl 常用选项-X 常用罗列 put get post head delete;
分类:
其他好文 时间:
2014-09-09 22:48:39
阅读次数:
206
基本概念: 请求,是指对一个url的单次访问 并发,是在同一个时间点内对单个url的多次请求 1,注册页面测试 使用工具: 1,apache ab 2,pylot 请求页面: Register.php 页面模拟请求注册一个用户,包括获取验证码,及注册。测试页面可以成功注册用户 测试...
分类:
其他好文 时间:
2014-08-11 17:37:42
阅读次数:
241
网上找了很多资料,PHP的比较多,然后找到有csv文件的,处理起来很麻烦,国外的网站速度很慢。
最后还是去页面上抓取数据,我是从中国银行抓取的,各位可去其他网站抓取。
1、模拟请求URL。
string url = "http://srh.bankofchina.com/search/whpj/search.jsp?pjname=1316";
HttpWebRequest reques...
分类:
Web程序 时间:
2014-07-23 17:00:01
阅读次数:
228
1.使用get方式时,url类似如下格式:
[html] view
plaincopy
index.jsp?id=100&op=bind
GET报问头如下:
[html] view
plaincopy
GET /sn/index.php?sn=123&n=asa HTTP/1.1
Accept: */*...
分类:
编程语言 时间:
2014-07-14 18:42:29
阅读次数:
336
我们如果在公司或家里使用网络爬虫去抓取自己索要的一些数据的时候,常常对方的网站有defence机制,会给你的http请求返回500错误,只要是相同IP就请求不到数据,这时候我们只能去重启路由器,这样IP地址会改变,网络爬虫就能正常工作了
下面是通过发送Socket请求来模拟路由器的重启指令:
protected void rebotadsl() {
try {
BufferedO...
分类:
编程语言 时间:
2014-07-14 13:00:50
阅读次数:
274