码迷,mamicode.com
首页 > 编程语言 > 详细

[Python] 通过采集23万条数据,对《哪吒》影评分析

时间:2019-08-31 19:41:06      阅读:134      评论:0      收藏:0      [点我收藏+]

标签:span   print   网络   charts   样本   内容   转发   echarts   图形   

一、说明

  数据来源:猫眼;

  运行环境:Win10/Python3.7 和 Win7/Python3.5;

  分析工具:jieba、WorldCloud、pyecharts和matplotlib;

  程序基本思路:分析接口 —> 下载数据 —> 过滤数据 —> 保存文件 —> 统计分析;

  注意:本文所有图文和源码仅供学习,请勿他用,转发请注明出处!

  参考:https://www.cnblogs.com/reader/p/10070629.html

 

二、开始

  样本数据(23万+):

技术图片

 

  因为运行的脚本和之前基本差不多,对于数据采集和统计分析的流程直接参考:https://www.cnblogs.com/reader/p/10070629.html

  优化下载部分代码,防止因网络原因导致下载失败,导致的程序停止(这里也可以考虑设置重试下载次数):

 1     def download(self, url):
 2         """下载内容"""
 3         self.showstep(Downloading:+url)
 4         
 5         # 防止网络原因导致下载失败
 6         while True:
 7             try:
 8                 response = requests.get(url, headers=self.headers)
 9 
10                 if response.status_code == 200:
11                     return response.json()
12                 else:
13                     self.showstep(Download Fail: + url)
14                     return ""
15             except Exception as e:
16                 print(e)
17                 time.sleep(3)

  

三、图形化分析

  3.1 观众城市分布热点图

    技术图片

  3.2 观众位置分布图

技术图片

  3.3 城市分布人数排行 TOP 20

  技术图片

  3.4 词云

技术图片

[Python] 通过采集23万条数据,对《哪吒》影评分析

标签:span   print   网络   charts   样本   内容   转发   echarts   图形   

原文地址:https://www.cnblogs.com/reader/p/11439879.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!