码迷,mamicode.com
首页 > 其他好文 > 详细

Requwsts+正则表达式爬取猫眼电影Top100

时间:2018-09-23 11:38:02      阅读:137      评论:0      收藏:0      [点我收藏+]

标签:请求   audio   目标   图片   controls   线程   站点   返回   返回结果   

流程框架:

抓取单页内容:利用requests请求目标站点,得到单个网页HTML代码,返回结果。

正则表达式分析:根据HTML代码分析得到电影和名称、主演、上映时间、评分、图片链接等信息。

开启循环及多线程:对多页内容遍历,开启多线程提高抓取速度。

保存至文件:通过文件的形式将内容结果保存,每一部电影一个结果一行Json字符串。

 

Requwsts+正则表达式爬取猫眼电影Top100

标签:请求   audio   目标   图片   controls   线程   站点   返回   返回结果   

原文地址:https://www.cnblogs.com/779084229yyt/p/9692010.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!