码迷,mamicode.com
首页 > 其他好文 > 详细

分享一个非常棒的xpath教程

时间:2014-08-25 17:22:44      阅读:168      评论:0      收藏:0      [点我收藏+]

标签:http   io   ar   art   问题   div   cti   html   amp   

不多说,直接上地址: http://zvon.org/xxl/XPathTutorial/General/examples.html

点击左上角“中文”即可显示中文翻译实例。

xpath用于解析html,xml.xhtml这一类标签文档很方便,也很直接,用简短的语法提取标签文档的内容、属性等。

在linux下终端可以用xpath, xmllint --xpath这一类的工具来即时测试xpath语法提取效果。

一个简易的范例,从cnBeta获取首页热门新闻的标题和摘要

curl -s http://www.cnbeta.com | xmllint --html --xpath ‘/html/body/div/section/section/section/div/div/div[@id="hot"]/dl/dt/a‘ - 2>/dev/null
<a href="/articles/321967.htm" target="_blank">LG将推出圆形智能手表与摩托360竞争</a><a href="/articles/321965.htm" target="_blank">小米回应电量虚标问题 称质检总局抽样系非官方渠道购买</a><a href="/articles/321985.htm" target="_blank">充电宝冒烟 北京地铁15号线一列车清车</a>

最后xpath改为a/text()即可获取a标签内文本内容

分享一个非常棒的xpath教程

标签:http   io   ar   art   问题   div   cti   html   amp   

原文地址:http://my.oschina.net/abcfy2/blog/306383

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!