码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫再探实战(二)———模拟登陆豆瓣

时间:2016-07-10 12:29:45      阅读:129      评论:0      收藏:0      [点我收藏+]

标签:

    爬虫有时候也要进入登陆页面之后进行爬取,这就避免不了模拟登陆了。自己在这里卡了好久,终于算是模拟成功一次。

    当然,这次也是用requests,真是好用的很呢。上代码。

#------------
#2016/6/11
#模拟登陆豆瓣成功!!!

import requests

url = ‘https://accounts.douban.com/login‘
headers = {‘User-Agent‘:‘Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36‘,
‘Referer‘:‘https://accounts.douban.com/login?uid=&alias=123456&redir=https%3A%2F%2Fwww.douban.com%2F&source=None&error=1008‘}
s = requests.Session()

# 构建表单
payload = {‘source‘:‘None‘,
‘redir‘:‘https://www.douban.com/‘,
‘form_email‘:‘这里是你注册的邮箱‘,
‘form_password‘:‘这里是你的密码‘,
‘login‘:‘登录‘}

data1 = s.post(url, data=payload, verify=False)  # 绕过了SSL验证
print(data1.status_code)
# print(data1.text)

data2 = s.get(‘https://www.douban.com/people/146448257/‘) # 这里是我的主页。。。当然你可以访问任何人的主页
print(data2.status_code)
print(data2.text)

  下面是代码输出结果。

技术分享

 

爬虫再探实战(二)———模拟登陆豆瓣

标签:

原文地址:http://www.cnblogs.com/buzhizhitong/p/5657335.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!