码迷,mamicode.com
首页 > 其他好文 > 详细

bs4常用用法

时间:2018-09-01 12:43:49      阅读:273      评论:0      收藏:0      [点我收藏+]

标签:find   get   for   XML   view   sub   网页   tle   代码   

from bs4 import BeautifulSoup
import requests
#获取爬去的网址
url=requests.get(‘https://movie.douban.com/subject/24773958/‘)
#获取网页源代码

v_source=BeautifulSoup(url.text,‘lxml‘)
# print(v_source)
# 爬取标题
v_title=v_source.find(‘span‘,attrs={‘property‘:‘v:itemreviewed‘})
#print(v_title.text)

v_jianjie=v_source.find(‘span‘,attrs={‘property‘:‘v:summary‘})
print(v_jianjie.text)

v_leixing=v_source.find_all(‘span‘,attrs={‘property‘:‘v:genre‘})
# for i in range(len(v_leixing)):
# print(v_leixing[i].text,end=‘ ‘)

for i in v_leixing:
print(i.text)

bs4常用用法

标签:find   get   for   XML   view   sub   网页   tle   代码   

原文地址:https://www.cnblogs.com/inorilzy/p/9569300.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!