标签:
去除etree中的某个子节点有两种方法:
1、parentnode.remove(node)
2、etree.strip_elements(html, ‘element_name‘, with_tag=True/False)
但是在实际使用的时候如果要删除的node.tail不为空,则会把node.tail也删除掉,导致不必要的丢失,解决办法如下:
parent = node.getparent() if parent is not None: parent_text = re.sub(‘\s‘, ‘‘, get_child_text(parent)) text = node.tail if anchor.tail else ‘‘ previous = node.getprevious() if previous is not None: previous.tail = (previous.tail or ‘‘) + text else: parent.text = (parent.text or ‘‘) + text parent.remove(node) break
通过在前序节点中保留node.tail,可以在删除node的同时,保留node.tail的内容。
标签:
原文地址:http://www.cnblogs.com/chybot/p/5046258.html