码迷,mamicode.com
首页 > 编程语言 > 详细

Python——XPath使用

时间:2017-06-16 11:23:26      阅读:134      评论:0      收藏:0      [点我收藏+]

标签:selector   位置   转化   xpath   strong   pre   style   lxml   sel   

一:XPath介绍

XPath全称XML路径语言,用于确定XML文档中某部分位置。XPath基于XML树状结构,在树中寻找结点。

现在,一般使用XPath在XML中查找、提取信息,同时,它也支持HTML。所以,我们可以用XPath取代正则表达式来提取信息。

XPath通过元素以及属性进行导航。

 

二:XPath使用大概步骤

1:安装lxml模块

2:导入树形结构

from lxml import etree

3:把requests抓取的网页转化为树形结构

selector=etree.HTML(网页源码)

4:从树形结构中查找信息

selector.xpath(查找条件)

 

三:代码实战

 

Python——XPath使用

标签:selector   位置   转化   xpath   strong   pre   style   lxml   sel   

原文地址:http://www.cnblogs.com/ygj0930/p/7026261.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!