python模拟浏览器登陆人人网站

时间：2015-04-25 18:23:06 阅读：149 评论：0 收藏：0 [点我收藏+]

想要实现网站的登陆，post方法就是提交数据到网站，所以要post数据来用python实现登陆。当你想要登陆人人时，首先要知道网站的登陆细节（先发送账号和密码，返回cookie值，发送cookie到服务器，返回页面，再使用正则提取你想要的数据），我是通过HTTPfox来抓取http数据包来分析这个网站的登陆流程。同时，我们还要分析抓到的post包的数据结构和header，要根据提交的数据结构和heander来构造自己的post数据和header。

分析结束后，我们要构造自己的HTTP数据包，并发送给指定url。我们通过urllib2等几个模块提供的API来实现request请求的发送和相应的接收。大部分网站登录时需要携带cookie，所以我们还必须设置cookie处理器来保证cookie。具体httpfox的使用可以通过定制来将其加入到工具栏，之后它出现在右上角直接点击就可以了，或者使用快捷键Ctrl+Shift+F2。

实现登陆人人还是比较简单的，淘宝就有了一点难度，因为淘宝有验证码和它自己的post格式，明天再写淘宝的登陆，跪求大牛带走啊。

#-*- coding:utf-8 -*-
import sys
import re
import urllib2
import urllib
import requests
import cookielib

loginurl = 'http://www.renren.com/PLogin.do'
logindomain = 'renren.com'
"""
    当我们使用urllib处理url的时候，实际上是通过urllib2.OpenerDirector实例进
    
行工作，他会自己调用资源进行各种操作如通过协议、打开url、处理cookie等。而urlopen

方法使用的是默认的opener来处理问题，基本的urlopen()函数不支持验证、cookie或其他

的HTTP高级功能。要支持这些功能，必须使用build_opener()函数来创建自己的自定义Opener对象。
"""
class Login(object):
    def __init__(self):
        self.name = ''
        self.passwprd = ''
        self.domain = ''
        #更改默认的opener，因为默认的opener没有处理cookie的功能。
        self.cj = cookielib.LWPCookieJar()
        self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cj))
        urllib2.install_opener(self.opener)
        
    def setLoginInfo(self,username,password,domain):
        '''''设置用户登录信息'''
        self.name = username
        self.pwd = password
        self.domain = domain
        
    def login(self):
        '''''登录网站'''
        loginparams = {'domain':self.domain,'email':self.name, 'password':self.pwd}
        headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:14.0) Gecko/20100101 Firefox/14.0.1'}
        req = urllib2.Request(loginurl, urllib.urlencode(loginparams),headers=headers)
        response = urllib2.urlopen(req)
        self.operate = self.opener.open(req)
        thePage = response.read()
        print thePage

        
if __name__ == '__main__':
    print loginurl #测试
    userlogin = Login()
    #username = '账号'
    #password = '密码'
    #可以自己指定，也可以实时输入。
    username = raw_input("Please input your username in renren: ")
    password = raw_input("Please input your password of renren: ")
    domain = logindomain
    userlogin.setLoginInfo(username,password,domain)
    userlogin.login()
    print loginurl #测试

python模拟浏览器登陆人人网站

标签：网络爬虫 python http协议浏览器 renren

原文地址：http://blog.csdn.net/djd1234567/article/details/45271601

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行