码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫模拟登陆之formdata表单数据

时间:2017-06-28 20:38:44      阅读:241      评论:0      收藏:0      [点我收藏+]

标签:logs   文件中   格式   服务器   登陆   账号密码   还需   rom   账号   

首先HTTP协议是个无连接的协议,浏览器和服务器之间是以循环往复的请求回复来交互的,交互的形式是以文件形式来进行的。比如在chrome开发者工具network中看到了

技术分享

 

每一行是一个文件,又文件大小啊,文件类型啊,比如脚本,图片等。

根据协议,把每个文件的内容按照协议格式填入HTTP数据协议结构,其中,对于爬虫模拟登陆来说最重要的是表单数据formdata这个字段

技术分享

 

 在这我们看到又loginname字段,又password字段,我们看到这都是明码,所以做了遮挡。我们得到了这个,就可以根据字段名称自己组装数据了,

另外还需要注意的是,formdata所在的文件,前面我们说了,浏览器与服务器之间是以文件形式交互的,开发者工具也是以文件为单位来抓包的,所以我们需要找对文件

这个只能自己找了,比如知乎,包含账号密码的表单数据存在与“email"文件中,比如在智联招聘中,包含账号密码的表单数据存在与“login"文件中

技术分享

 

爬虫模拟登陆之formdata表单数据

标签:logs   文件中   格式   服务器   登陆   账号密码   还需   rom   账号   

原文地址:http://www.cnblogs.com/fanyuchen/p/7091041.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!