码迷,mamicode.com
首页 > 其他好文 > 详细

BeautifulSoup库

时间:2018-11-09 10:52:55      阅读:150      评论:0      收藏:0      [点我收藏+]

标签:查找   parser   执行   get   选择器   lib   文档   text   方式   


1.BeautifulSoup支持的解析器:

  • python标准库:BeautifulSoup(markup, "html.parser") 执行速度适中,文档容错能力强
  • lxml HTML解析器:BeautifulSoup(markup, "lxml") 执行速度适快,文档容错能力强
  • lxml XML解析器:BeautifulSoup(markup, "xml") 执行速度适快,唯一支持XML的解析器
  • html5lib解析器:BeautifulSoup(markup, "html5lib") 最好的容错性、以浏览器的方式解析文档、生成html5格式的文档

2.find_all 返回所有查找到的元素

3.find 返回单个元素

4.CSS选择器:

  • select() 直接传入CSS选择器
  • get_text() 获取文本

BeautifulSoup库

标签:查找   parser   执行   get   选择器   lib   文档   text   方式   

原文地址:https://www.cnblogs.com/wangshx6/p/9933419.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!