码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫相关知识(二 )xpath

时间:2018-06-02 22:51:38      阅读:186      评论:0      收藏:0      [点我收藏+]

标签:title   除了   xpath   基本   name   选择   col   相对   div   

#xpath表达式的基本格式

# 斜杠(/)作为路径内部的分割符。

# 同一个节点有绝对路径和相对路径两种写法。

# 绝对路径(absolute path)必须用"/"起首,后面紧跟根节点,比如/step/step/...。

# 相对路径(relative path)则是除了绝对路径以外的其他写法,比如 step/step,也就是不使用"/"起首。

# "."表示当前节点。

# ".."表示当前节点的父节点
选择节点的基本规则

- nodename(节点名称):表示选择该节点的所有子节点

- "/":表示选择根节点

- "//":表示选择任意位置的某个节点

- "@": 表示选择某个属性
通配符

# "*"表示匹配任何元素节点。

# "@*"表示匹配任何属性值。
 //title[@*] :表示选择所有带有属性的title元素。
 # node()表示匹配任何类型的节点。 
选择多个路径

用"|"选择多个并列的路径。

//book/title | //book/price :表示同时选择book元素的title子元素和price子元素。

 

爬虫相关知识(二 )xpath

标签:title   除了   xpath   基本   name   选择   col   相对   div   

原文地址:https://www.cnblogs.com/dingyutao/p/9127180.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!