码迷,mamicode.com
首页 > 编程语言 > 详细

Python-bs4解析html

时间:2019-10-26 22:38:03      阅读:75      评论:0      收藏:0      [点我收藏+]

标签:ring   标签   pip   提取数据   公众号   一个   导航   通过   etag   

Beautiful Soup简介(简称bs4)

它是一个可以从HTML或XML文件中提取数据的Python库,它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式,节省工作时间

 所有对象可以归纳为4种:

Tag:标签对象,例如<p class=”title”><b>yoyoketang</b></p>,这就是一个标签

NavigableString:字符对象,如:这里是我的微信公众号:yoyoketagn

BeautifulSoup:就是整个html对象

Comment:注释对象,如:!-- for HTML5 --,它其实就是一个特殊NavigableString

安装pip install beautifulsoup4

 

Python-bs4解析html

标签:ring   标签   pip   提取数据   公众号   一个   导航   通过   etag   

原文地址:https://www.cnblogs.com/python-lll/p/11745811.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!