码迷,mamicode.com
首页 > 其他好文 > 详细

bs4解析xml文件

时间:2019-09-08 18:04:20      阅读:180      评论:0      收藏:0      [点我收藏+]

标签:log   rom   第一个   文本   logs   xml文件   来讲   查找   nbsp   

使用BS4解析XML文件用法

1. html.parser

from bs4 import BeautifulSoup

soup = BeautifulSoup(html, "html.parser")
两个参数:第一个参数是要解析的html文本,第二个参数是使用那种解析器,对于HTML来讲就是html.parser,这个是bs4自带的解析器
2.

 soup = BeautifulSoup(html, "lxml")

查找所有符合条件的标签

a)使用tag查找

soup.find_all(b‘)
b)正则表达式查找
soup.find_all(re.compile("^b"))

c)按列表中提供的tab查找
soup.find_all(["a", "b"])
 

参考链接:

https://www.cnblogs.com/gl1573/p/9480022.html
  

bs4解析xml文件

标签:log   rom   第一个   文本   logs   xml文件   来讲   查找   nbsp   

原文地址:https://www.cnblogs.com/i-shu/p/11487438.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!