码迷,mamicode.com
首页 > 其他好文 > 详细

bs4 库 BeautifulSoup类

时间:2017-09-25 20:52:51      阅读:167      评论:0      收藏:0      [点我收藏+]

标签:标签   技术   port   encoding   width   _for   images   parent   rom   

bs4 库 BeautifulSoup类:

 

1. bs4 库 :

    定义:  bs4 库 是用来解析 遍历 维护 html (标签树) 的功能库
技术分享

 技术分享


 2 .  bs4 库的引用,导入:

技术分享

 

 

 3  BeautifulSoup 类:

 

技术分享

 

soup=BeautifulSoup(content,‘html.parser‘) # 实例化对象 | content是内容 | ‘html.parser‘ 是解析器

技术分享


技术分享

 

import requests
from bs4 import BeautifulSoup

url=‘http://www.bilibili.com/video/av9784617/index_56.html#page=22‘
try:
r=requests.get(url)
r.raise_for_status()
r.encoding=r.apparent_encoding
content=r.text[:500]
except:
print(‘Error!‘)

soup=BeautifulSoup(‘‘,‘html.parser‘) # 实例化 soup 对象 | content是内容 ‘html.parser‘ 是解析器

print(soup.head.prettify())
 

 4  bs库的遍历 :

技术分享

 

技术分享

 

技术分享

 技术分享

 

bs4 库 BeautifulSoup类

标签:标签   技术   port   encoding   width   _for   images   parent   rom   

原文地址:http://www.cnblogs.com/big-handsome-guy/p/7593693.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!