码迷,mamicode.com
首页 > 其他好文 > 详细

BeautifulSoup的选择器

时间:2016-09-28 22:29:40      阅读:198      评论:0      收藏:0      [点我收藏+]

标签:

用BeautifulSoup查找指定标签(元素)的时候,有几种方法:

soup=BeautifulSoup(html)

1.soup.find_all(tagName),返回一个指定Tag元素的列表

2.soup.select(selector),返回一个指定Tag元素的列表,是非常好用的方法,它支持大部分css选择器(可在链接页面内查找"CSS选择器"相关章节),如类选择器,id选择器,子代选择器(但不支持直接子代选择器)

例如可以这样写,soup.select(‘.listConent div ul li‘),表示要查找class=‘listContent‘的某个标签下的div标签的ul标签下的所有li元素。

如果你想查找class=‘listContent‘的某个标签下的直接子代div标签,soup.select(‘.listConent > div‘),而jquery写成$(‘.listConent > div‘)

3.你可以逐层访问Tag的子标签[链接,可在链接页面内查找".contents 和 .children"章节],如 x.div.next_sibling.div.p.a.string

 

参考:

http://blog.csdn.net/fangwc/article/details/51192057

 

BeautifulSoup的选择器

标签:

原文地址:http://www.cnblogs.com/aaronhoo/p/5917828.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!