码迷,mamicode.com
首页 > 其他好文 > 详细

BeautifulSoup的基本操作

时间:2018-04-22 19:57:10      阅读:206      评论:0      收藏:0      [点我收藏+]

标签:http   操作   内容   格式化   技术   int   info   选择   打印   

>>> from bs4 import BeautifulSoup   #导入

>>> soup = BeautifulSoup(url.content,"lxml") 

>>> print(soup.prettify) #格式化代价

>>> print(soup.title.string)
郑州轻工业学院OJ     #打印title

>>> print(soup.title)
<title>郑州轻工业学院OJ</title>

标签选择器:

>>> print(soup.a)
<a class="navbar-brand" href="./" style="font-weight:bold;">郑州轻工业学院OJ</a>

>> print(soup.title.name)
title

以zzuli的zcm网为抓取对象:

>>> print(soup.div.attrs[‘class‘])
[‘container‘]
>>> print(soup.nav.attrs[‘class‘])
[‘navbar‘, ‘navbar-default‘]
>>> print(soup.nav.attrs[‘role‘])
navigation

技术分享图片

 

(可使用此方法获取标签后对应的内容)

其余的写法:

>>> print(soup.nav[‘role‘])
navigation

 

BeautifulSoup的基本操作

标签:http   操作   内容   格式化   技术   int   info   选择   打印   

原文地址:https://www.cnblogs.com/kangdong/p/8908595.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!