码迷,mamicode.com
首页 > 其他好文 > 详细

Requests库抓取数据

时间:2018-10-10 01:03:27      阅读:254      评论:0      收藏:0      [点我收藏+]

标签:utf-8   源码   ima   分享图片   work   F12   赋值   字符串   install   

 

安装requests库 pip install requests

1.使用GET方式抓取数据:

import requests #导入requests库

url="http://www.cntour.cn/"  #需要爬取的网址
strhtml = requests.get(url);    #使用GET方式,获取网页数据

print(strhtml.text) #打印html源码

技术分享图片

2.使用POST方式抓取数据

网址:有道翻译:http://fanyi.youdao.com/

按F12 进入开发者模式,单击Network,此时内容为空,如图:

技术分享图片

输入‘’我爱中国‘’,翻译就会出现:

技术分享图片

单击Headers,发现请求数据的方式为POST:

技术分享图片

将url指取出来赋值:url=‘http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule’(把_o去掉)

POST请求获取数据的方式不同于GET,POST请求数据必须构建请求头才可以,所以把Form Data中的请求参数复制出来构建新字典:

技术分享图片

#!/usr/bin/env python
# -*- coding:utf-8 -*-
# Author:XXC
import requests
import json

#定义获取信息函数
def get_translate_date(word=None):
    url=http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule
    Form_data = {
        i: 我爱中国,
        from: AUTO,
        to: AUTO,
        smartresult: dict,
        client: fanyideskweb,
        salt: 1539098682270,
        sign: f293c39aa50f57d4d35eb6822f162f72,
        doctype: json,
        version: 2.1,
        keyfrom:fanyi.web,
        action: FY_BY_REALTIME,
        typoResult: false,
    }
    #请求表单数据
    response = requests.post(url,data=Form_data)
    #将json格式字符串转字典
    content = json.loads(response.text)
    #打印翻译后的数据
    print(content[translateResult][0][0][tgt])
if __name__ == __main__:
    get_translate_date(我爱中国)

技术分享图片

 

Requests库抓取数据

标签:utf-8   源码   ima   分享图片   work   F12   赋值   字符串   install   

原文地址:https://www.cnblogs.com/alex-xxc/p/9763890.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!