码迷,mamicode.com
首页 > 编程语言 > 详细

Python3 BeautifulSoup和Pyquery解析库随笔

时间:2018-07-02 13:05:00      阅读:339      评论:0      收藏:0      [点我收藏+]

标签:初始   query   bsp   css选择器   xxx   定位   节点   import   方法   

BeautifuSoup和Pyquery解析库方法比较

1.对象初始化:

  • BeautifySoup库:
    1 from bs4 import BeautifulSoup
    2 
    3 html = html string......
    4 soup = BeautifulSoup(html, lxml)
  • Pyquery库:
    1 from pyquery import PyQuery as pq
    2 
    3 # 以字符串初始化
    4 html = html string...
    5 doc = pq(html)
    6 # 以url初始化
    7 doc = pq(url=https://....)
    8 # 以文件初始化
    9 doc = pq(filename=XXX.html)

     

2. 节点属性获取:

  • BeautifuSoup库:
    1 # 在根据节点选择器、方法选择器或者CSS选择器,选择出节点(例如:li)后,两种方法获取属性值
    2 value = li[attr_name]
    3 value = li.attrs[attr_name]
  • Pyquery库:
    1 # 在根据CSS选择器定位到节点(例如li)后,两种方法获取属性值
    2 value = li.attr.attr_name
    3 value = li.attr(attr_name)

     

3. 文本内容获取

  • BeautifulSoup库:
    # 在根据节点选择器、方法选择器或者CSS选择器,选择出节点(例如:li)后,两种方法获取属性值
    text = li.string
    text = li.get_text()
  • Pyquery库: 
    1 # 在根据CSS选择器定位到节点(例如li)后
    2 text = li.text()

     

 

Python3 BeautifulSoup和Pyquery解析库随笔

标签:初始   query   bsp   css选择器   xxx   定位   节点   import   方法   

原文地址:https://www.cnblogs.com/strivepy/p/9253311.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!