标签:cto bcd 分享图片 ddl EDA vpd pandas http python学习
前言
懂球帝上的“女神大会”专栏,作为一个大型“钢铁直男”聚集地,“懂球帝”上对各位女神的评分,对广大“钢铁直男”群体也具有一定代表性。这么好的地方,咱们必须得用Python分析一波了呀。
基本环境配置
版本:Python3
系统:Windows
相关模块:requests、bs4、pandas
用pip安装即可。
数据来源
目前女神大会更新至了第 90 期,总共出场了 90 位女神,界面如下:
我们通过 fiddler 获取该界面中女神的照片地址以及每一篇文章的 id 编号,用于之后的爬取和可视化,代码如下:
另一方面,每位女神的评分都在下一期当中,我们需要爬取文章内容进行获取:
爬取代码如下:
数据分析结果
排名相对靠后的几位:
区域对比
分区域看一下目前各个区域排名前十的名单:
我们进行一下区域的对比:
年份对比
你最喜欢的女星是哪个呢?欢迎留言评论,同时如果你跟我一样都喜欢python,想成为一名优秀的程序员,也在学习python的道路上奔跑,欢迎你加入python学习群:839383765 群内每天都会分享最新业内资料,分享python免费课程,共同交流学习,让学习变(编)成(程)一种习惯!
利用Python分析“女神大会”,分析码农最喜欢的top10女星!
标签:cto bcd 分享图片 ddl EDA vpd pandas http python学习
原文地址:http://blog.51cto.com/14186420/2348285