码迷,mamicode.com
首页 > 其他好文 > 详细

xpath获取下一页,兄弟结点的妙用

时间:2018-03-29 20:07:39      阅读:160      评论:0      收藏:0      [点我收藏+]

标签:inf   body   image   就会   观察   图片   page   xpath   alt   

第一页的情况:

技术分享图片

 

第四页的情况 :

 

技术分享图片文章的链接:  http://tech.huanqiu.com/science/2018-02/11605853_4.html

 

    从上面我们可以看到,如果仅仅用xpath获取下一页的链接 例如:  //div[@id="pages"]/a[@class="a1"][text()="下一页"]/@href     

就会在第四页的时候重复获取相同的链接,我们通过观察可以发现一些规律:

所在的页码是在与链接a标签同级的span标签里面,这个时候我们可以采用兄弟结点,来解决这个问题,

//div[@id="pages"]/span/following-sibling::a[text()!="下一页"]/@href

 

说明:

1  获取到span标签的下一个兄弟结点a标签  (following-sibling::a)

2  另它的text内容不为"下一页"  ([text()!="下一页"])

3  再取这个a标签的href属性  (@href)

 

这样在第四页的时候获取到的链接为Null , 就不会重复获取下一页的链接了

 

xpath获取下一页,兄弟结点的妙用

标签:inf   body   image   就会   观察   图片   page   xpath   alt   

原文地址:https://www.cnblogs.com/haitianzhimen/p/8671806.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!