码迷,mamicode.com
首页 > 其他好文 > 详细

Scrapy XPath语法

时间:2017-07-11 23:30:31      阅读:466      评论:0      收藏:0      [点我收藏+]

标签:exp   head   tail   extract   部分   selector   nbsp   cto   pat   

  • selectors = response.xpath(‘[exp]‘)

返回所有符合exp的语句Selector列表

  • data = response.xpath(‘[exp]‘)[0].extract()

返回Selector列表第一项的内容

  • ‘/html/head‘

从根节点匹配

  • ‘//td/p‘

从任意节点匹配

  • ‘//td/p/../..‘

从任意节点匹配上两级

  • ‘//p/a/text()‘

匹配文本内容

  • ‘//p/a[@colspan="2"]‘

匹配属性符合条件

  • ‘//p/a/@href‘

匹配属性

  • response.xpath(‘//p/a/@href‘).re(".*cnblogs.com.*")

匹配符合正则的部分的列表

 

参考文献:http://blog.csdn.net/qzc295919009/article/details/42743077

Scrapy XPath语法

标签:exp   head   tail   extract   部分   selector   nbsp   cto   pat   

原文地址:http://www.cnblogs.com/jhc888007/p/7152648.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!