码迷,mamicode.com
首页 > 其他好文 > 详细

11-BeautifulSoup库详解

时间:2017-11-01 13:25:35      阅读:107      评论:0      收藏:0      [点我收藏+]

标签:嵌套   选择   文本   一个   结束   实战   取出   除了   解析   

---恢复内容开始---

灵活又方便的网页解析库,处理高效,支持多种解析器。

利用它不用编写正则表达式即可方便地实现网页信息的提取。

这个库有四个主要方法吧,其中xlml是最常用的,他的标签选择器可以取出任何标签的内容。

如果有多个标签的话,只获取第一个标签的内容。

除了获取标签的内容之外,还可以获取标签内的属性。

具体的方法,,,估计还是要实战去学习下吧。

还有嵌套选择器,获取更深层的文本内容,就像前端代码的子节点之类的,就是这个样子。

 

 

 

---恢复内容结束---

11-BeautifulSoup库详解

标签:嵌套   选择   文本   一个   结束   实战   取出   除了   解析   

原文地址:http://www.cnblogs.com/suiyisuixing/p/7765829.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!