码迷,mamicode.com
首页 > 其他好文 > 详细

Bs4 BeautifulSoup取值

时间:2018-12-01 22:13:35      阅读:438      评论:0      收藏:0      [点我收藏+]

标签:使用   htm   签名   attr   name   detail   art   find   sel   

原文网址:https://blog.csdn.net/u010244522/article/details/79627073

从网页获取HTML数据后,获取对应标签、属性的值

取值方法主要有以下几种:

1.通过标签名(tag)获取: tag.name        tag对应的type是<class ‘bs4.element.Tag‘>

2.通过属性(attrs)获取:tag.attrs

 

通过标签属性获取:    tag["class"]  或     tag.get("class")

 

获取对应的内容

1.    tag.string    获取当前标签的内容

2.    tag.get_text()    获取标签内所有的字符串

查找相应的内容

1.find_all(class_="class")    返回的是多个标签,格式为<class ‘bs4.element.ResultSet‘>

2.find(class_="class")    返回一个标签,格式是<class ‘bs4.element.Tag‘>

3.select_one()    返回一个标签,格式是<class ‘bs4.element.Tag‘>

4.select()    返回的是多个标签,格式为<class ‘bs4.element.ResultSet‘>

1和4是返回组标签(就算只有一个标签也是一组)

取值时需要先定位,定位是list(ResultSet)中的那个标签在取值

tag[0].string

使用    find_all()    不带条件查找,tag[0]["class"].string

Bs4 BeautifulSoup取值

标签:使用   htm   签名   attr   name   detail   art   find   sel   

原文地址:https://www.cnblogs.com/moying-wq/p/10050720.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!