简单爬取一个影院单个页面的所有电影名称

时间：2020-07-29 21:39:19 阅读：106 评论：0 收藏：0 [点我收藏+]

标签：页面比较 gen 爬取 span end find like safari

具体代码如下：

import requests
import re
headers = {‘user-agent‘:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36‘}#创建头部信息
url = ‘https://v.sogou.com/vertical/2w65l6nv47j3bnhtzcv4hyvx2g45xp5u.html‘
resp = requests.get(url,headers=headers)
info = re.findall(r‘<a href=".*" uigs=".*" target="_blank">(.*)</a>‘,resp.text)
print( info )
lst=[]  #用于存储拼接后的url
for item in info:
    lst.append(‘https:‘+item) #这样哪些连接的颜色就变了

技术图片

比较简单，稍微练练手

简单爬取一个影院单个页面的所有电影名称

标签：页面比较 gen 爬取 span end find like safari

原文地址：https://www.cnblogs.com/dazhi151/p/13399336.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行