码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫利器pyquery使用介绍

时间:2020-02-29 11:34:30      阅读:73      评论:0      收藏:0      [点我收藏+]

标签:安装   查找   基本   字符串   空格   span   containe   pytho   news   

1.安装和引用

安装方法:

pip install pyquery 

引用方法:

from pyquery import PyQuery as pq

 

2.使用方法

2.1 初始化方法

from pyquery import PyQuery as pq
doc = pq(html) # 解析html字符串
print(doc)
url = "http://news.baidu.com/guonei"
doc = pq(url) # 解析网页
print(doc)
doc = pq("./a.html") #解析html文本
print(doc)

 2.2 基本用法

from pyquery import PyQuery as pq

html = """
<html lang="en">
    <div class ="py_divc" id="py_divi">
        <ul class="container">
            <li class="object-1" href="www.aaa.com">hello Python</li>
            <li class="object-2" href="www.bbb.com">大法</li>
            <li class="object-3" href="www.ccc.com">好</li>
        </ul>
    </div>
</html>
"""

doc = pq(html)
print(doc("#py_divi .container li"))

运行结果:

<li class="object-1" href="www.aaa.com">hello Python</li>
<li class="object-2" href="www.bbb.com">大法</li>
<li class="object-3" href="www.ccc.com">好</li>

# 是查找id的标签  .是查找class的标签  li 是查找li标签 中间空格表示里层

2.3 查找子元素

 

爬虫利器pyquery使用介绍

标签:安装   查找   基本   字符串   空格   span   containe   pytho   news   

原文地址:https://www.cnblogs.com/-fengmu/p/12381957.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!