码迷,mamicode.com
首页 > 编程语言 > 详细

python 打印html源码中xpath

时间:2017-09-26 19:24:36      阅读:195      评论:0      收藏:0      [点我收藏+]

标签:path   print   http   from   utf-8   iter   pre   color   getpath   

实例:

#coding:utf-8
from lxml import etree
import urllib
url=urllib.urlopen(http://www.baidu.com).read().decode(utf-8)
htm=etree.HTML(url)
htree=etree.ElementTree(htm)
print htree
print htm.iter()
###依次打印出每个元素的文本内容和xpath路径
for t in htm.iter():
    print t.text
    print htree.getpath(t)

 

python 打印html源码中xpath

标签:path   print   http   from   utf-8   iter   pre   color   getpath   

原文地址:http://www.cnblogs.com/liuliu-word/p/7598159.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!