#! /usr/bin/env python# -*-coding:utf-8 -*-import urllibimport urllib2import cookielibclass NetRobot: def __init__(self, baseurl): self.cj =...
分类:
编程语言 时间:
2015-03-21 01:03:46
阅读次数:
268
首先,你得学会curl下的各个参数的作用,能很大程度上帮助你完成,往往需要几十行甚至几百行的代码,确只需要两三行的命令代码就能搞定一切了!-a/--append上传文件时,附加到目标文件
-A/--user-agent<string>模拟浏览器登陆服务器
-anyauth可以使用“任何”身份验证方..
分类:
Web程序 时间:
2015-03-18 18:37:01
阅读次数:
233
利用HttpClient模拟浏览器行为获取网页内容时,当参数中有中文,在服务器端解析出的参数值中的中文都是“?”,这里就给你完美的解决方案...
分类:
Web程序 时间:
2015-03-18 12:30:59
阅读次数:
118
前言先在文章前面说好了,省得大家发现我根本没有这样的头发,duang的一下一堆人骂我。这篇文章的标题有点大,其实挺low的,我需要在开头解释一下。我这里只想写一个小的控制台,旨在模拟浏览器的http通信。不是真的能用的浏览器。简单的说,今天的全部工作就是 建立Socket→发送请求报文→ 服务器返回...
分类:
Web程序 时间:
2015-03-16 00:59:15
阅读次数:
255
在上次Java Socket现实简单的HTTP服务我 们实现了简单的HTTP服务,它可以用来模拟HTTP服务,用它可以截获HTTP请求的原始码流,让我们很清楚的了解到我们向服务发的HTTP消息的结 构,对HTTP请求消息有个清晰的认识。这一节我想写了一个客户的程序,就是用来模拟浏览器,用来向服务器发...
分类:
编程语言 时间:
2015-03-11 10:37:45
阅读次数:
193
python自带的urllib,urllib2可以极方便做http操作,在我们按照http方式提交消息请求后,有可能会看见返回这个错误“403 forbidden",这是请求的网站做了阻止,于是我们需要把自己伪装成模拟器。对此,可以加上headers={'User-Agent':user-ag...
分类:
编程语言 时间:
2015-02-09 15:28:43
阅读次数:
559
一、htmlunit是一款开源的java页面分析工具,读取页面后,可以有效的使用htmlunit分析页面上的内容。项目可以模拟浏览器运行,被誉为java浏览器的开源实现。这个没有界面的浏览器,运行速度也是非常迅速的。二、下载地址:http://sourceforge.net/projects/htm...
分类:
Web程序 时间:
2015-02-03 12:59:27
阅读次数:
500
因为公司业务的需要,要在公司内部网上(jsp网站)系统中做大量的重复操作,之前也用过如“按键精灵”或“Auto_ACN"之类的自动操作软件。但是这些东西不但脚本编写困难(主要是对网页上特定原素的定位等)运行的时候还占用整台电脑,不能有任何干扰。也考虑过使用python 来直接模拟浏览器,自动构建表单数据发送来自动操作,但公司这个破网站,一大堆的frame 一大堆的javascript 跟踪了几次还...
分类:
编程语言 时间:
2015-01-13 17:42:15
阅读次数:
191
前言 其实老喜欢取经,偶尔也得分享下。关于阿里巴巴国际站的登陆,过程有点复杂但是算不上难。一不小心少个东西倒也挺麻烦的。 主要是看下请求类HttpClient基本请求封装使用,AliClient模拟浏览器的操作与数据封装 这里只是简单说一下主要的类和注意点,主要步骤与注意点都写在代码注释里了。...
分类:
Web程序 时间:
2015-01-07 23:18:43
阅读次数:
268
本文偏重使用,简单讲述httpclient,其实在网络编程中,基于java的实现几乎都是包装了socket的通信,然后来模拟各种各样的协议;httpclient其实就是模拟浏览器发起想服务器端的请求,而这种更加类似于JS的请求或页面的POST、GET,不过这种数据的返回一般需要得到有意义的数据,才方...
分类:
编程语言 时间:
2014-12-31 12:38:36
阅读次数:
273