码迷,mamicode.com
首页 > 编程语言 > 详细

find_all的用法 Python(bs4,BeautifulSoup)

时间:2019-11-15 22:46:03      阅读:34      评论:0      收藏:0      [点我收藏+]

标签:href   lin   过滤   字符   内容   span   news   class   new   

find_all()简单说明:

find_all()

find_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件

用法一:

rs=soup.find_all(‘a‘)

将返回soup中所有的超链接内容

类似的还有rs.find_all(‘span‘)、rs.find_all(‘title‘)、rs.find_all(‘h1‘)

也可加入查找条件,eg:

rs.find_all(‘img‘,{‘class‘:‘news-img‘})

将返回所有的class属性为news-img的img内容

用法二:

这里的true指的就是选中所有有id这个属性的标签

soup.find_all(id=True)

返回结果:

  [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>, # <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, # <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

用法三:

soup.find_all("a", string="Elsie")

通过 string 参数可以搜搜文档中的字符串内容.与 name 参数的可选值一样, string 参数接受 字符串 , 正则表达式 , 列表, True

用法四:

soup.find_all("a", limit=2)

limit即为查找的数量,此处查找数量为两次

 

find_all的用法 Python(bs4,BeautifulSoup)

标签:href   lin   过滤   字符   内容   span   news   class   new   

原文地址:https://www.cnblogs.com/wangyongfengxiaokeai/p/11869595.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有 京ICP备13008772号-2
迷上了代码!