码迷,mamicode.com
首页 > 编程语言 > 详细

Python分析豆辨电影

时间:2020-05-08 09:51:00      阅读:70      评论:0      收藏:0      [点我收藏+]

标签:良好的   into   mac   资料   ofo   apple   工作   解答   http   

豆瓣电影

  1. 分析
    分析流程图
    技术图片
    分析结果
    结果概要
    技术图片

注意:
请求头一般都是先放User-Agent,如果爬取失败再补Referer,还是失败就再补Cookie,如果喜欢稳一点的,可以每次都加上
请求参数分析
技术图片

代码实现流程分析
先完成一次请求的抓取
再完成多次请求的爬取
总结:
循序渐进养成良好的习惯
代码
#!/usr/bin/python3

-- coding: utf-8 --

import requests
import json

定义请求url

url = "https://movie.douban.com/j/search_subjects"

定义请求头

headers = {
"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36"
}

循环构建请求参数并且发送请求

for page_start in range(0, 100, 20):
params = {
"type": "movie",
"tag": "热门",
"sort": "recommend",
"page_limit": "20",
"page_start": page_start
}
response = requests.get(
url=url,
headers=headers,
params=params
)

方式一:直接转换json方法

# results = response.json()
# 方式二: 手动转换
# 获取字节串
content = response.content
# 转换成字符串
string = content.decode(‘utf-8‘)
# 把字符串转成python数据类型
results = json.loads(string)
# 解析结果
for movie in results["subjects"]:
    print(movie["title"], movie["rate"])

    总结

以上所述是小编给大家介绍的python里的命名规范,希望对大家有所帮助,看下图可免费领取python学习资料适合在校大学生,小白,想转行,想通过这个找工作的加入。裙里有大量学习资料,有大神解答交流问题,每晚都有免费的直播课程想要了解python或学习Python的可直接点击链接即可领取相关学习福利包:小白学python:详解python里的命名规范技术图片

Python分析豆辨电影

标签:良好的   into   mac   资料   ofo   apple   工作   解答   http   

原文地址:https://blog.51cto.com/14646124/2493197

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!