码迷,mamicode.com
首页 > 其他好文 > 详细

BeautifulSoup 用法

时间:2018-04-15 20:59:58      阅读:244      评论:0      收藏:0      [点我收藏+]

标签:bubuko   标签   解析   建议   属性   多个   inf   bsp   文本   

一、标签选择器

1、子节点contents child(迭代器)

2、子孙节点 descendants(迭代器)

3、父节点 parent  

4、祖节点  parents

5、兄弟节点 next_siblings (下一个兄弟) previous_siblings(上一个兄弟)

二、标准选择器

1、find_all(name,attrs,recursive,text,**kwargs)

name

技术分享图片

attrs        

技术分享图片

技术分享图片

text

 

技术分享图片

2、find(name,attrs,recursive,text,**kwargs)

find返回单个元素,find_all返回所有元素

 技术分享图片

 技术分享图片

三、CSS选择器

通过select()直接传入css选择器就可以完成选择

 技术分享图片

获取属性

 技术分享图片

获取内容

技术分享图片

 

总结

推荐使用lxml解析库,必要是使用html.parser

l 标签选择器筛选功能弱但是速度快

建议使用find(),find_all()查询匹配单个结果或者多个结果

如果对CSS选择器熟悉建议使用select

l 记住常用的获取属性和文本值得方法

BeautifulSoup 用法

标签:bubuko   标签   解析   建议   属性   多个   inf   bsp   文本   

原文地址:https://www.cnblogs.com/zlel/p/8849069.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!