爬虫再探实战（二）———模拟登陆豆瓣

时间：2016-07-10 12:29:45 阅读：129 评论：0 收藏：0 [点我收藏+]

标签：

　　　　爬虫有时候也要进入登陆页面之后进行爬取，这就避免不了模拟登陆了。自己在这里卡了好久，终于算是模拟成功一次。

　　　　当然，这次也是用requests，真是好用的很呢。上代码。

#------------
#2016/6/11
#模拟登陆豆瓣成功！！！

import requests

url = ‘https://accounts.douban.com/login‘
headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36‘,
‘Referer‘:‘https://accounts.douban.com/login?uid=&alias=123456&redir=https%3A%2F%2Fwww.douban.com%2F&source=None&error=1008‘}
s = requests.Session()

# 构建表单
payload = {‘source‘:‘None‘,
‘redir‘:‘https://www.douban.com/‘,
‘form_email‘:‘这里是你注册的邮箱‘,
‘form_password‘:‘这里是你的密码‘,
‘login‘:‘登录‘}

data1 = s.post(url, data=payload, verify=False)  # 绕过了SSL验证
print(data1.status_code)
# print(data1.text)

data2 = s.get(‘https://www.douban.com/people/146448257/‘) # 这里是我的主页。。。当然你可以访问任何人的主页
print(data2.status_code)
print(data2.text)

　　下面是代码输出结果。

技术分享

爬虫再探实战（二）———模拟登陆豆瓣

标签：

原文地址：http://www.cnblogs.com/buzhizhitong/p/5657335.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行