码迷,mamicode.com
首页 > 编程语言 > 详细

python的lxml解析器

时间:2018-06-20 18:46:05      阅读:128      评论:0      收藏:0      [点我收藏+]

标签:tostring   XML   des   range   bsp   parse   style   open   div   

from lxml import etree

import codecs
import sys
from lxml import etree

def parser(p):
    tree = etree.HTML(open(str(p)+.html, r).read())
    
    nodes = tree.xpath("//div[@class=‘BlueTable‘]//tr")
    #nodes = tree.xpath("//text()")
    for n in nodes:
        #mystr=etree.tostring(n,pretty_print=True)
        mystr=etree.tostring(n, method="html")
        print(etree.HTML(mystr).xpath("//text()"))

for p in range(1,211):
    parser(p);

 

python的lxml解析器

标签:tostring   XML   des   range   bsp   parse   style   open   div   

原文地址:https://www.cnblogs.com/timxgb/p/9204537.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!