标签:
一、JAXP
JAVA API For XML Processing,数以J2SE的一部分.
1. DOM解析,解析文档时需要读取整个xml文档,在内存中构建代表整个DOM树的document对象,从而再对XML文档进行操作。
此种情况下,如果XML文档特别大,容易消耗大量内存,容易导致内存溢出。
public class JAXPDemo { public static void main(String[] args) throws Exception { DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();//得到解析器工厂 DocumentBuilder builder = factory.newDocumentBuilder();//得到解析器 Document doc = builder.parse("files/book.xml");//解析执行的xml文档,得到代表内存DOM树的document对象 NodeList nl = doc.getElementsByTagName("售价"); Node n = nl.item(0); Element price = doc.createElement("批发价"); price.setTextContent("28.00元"); n.getParentNode().insertBefore(price, n); TransformerFactory tff = TransformerFactory.newInstance(); tff.setAttribute("indent-number", new Integer(2)); Transformer tf = tff.newTransformer(); tf.setOutputProperty(OutputKeys.INDENT, "yes"); tf.transform(new DOMSource(doc), new StreamResult(new OutputStreamWriter(new FileOutputStream("files/book.xml"), "GBK"))); } }
2.SAX解析
采用的是事件处理机制,涉及到两个部分:解析器和事件处理器。原理是,读取xml文档的时候,当读到了文档的一部分时,例如文档的开始、元素的开始、文本、元素的结束、文档的结束,都会调用事件处理器的对应的方法,读到的数据以参数的形式传递给对应的方法。相对于DOM解析方式来说,SAX方式节省内存,但是它只适用于查询操作,不能对xml文档进行修改。
二、 DOM4J
JAXP提供的SAX的API用起来比较麻烦,不够简洁,可以使用DOM4J这个开源包,它“使用起来像DOM一样简单,使用的是SAX解析方式来解析”。DOM4J很强大的一点在于它对XPATH的支持。DOM4J依赖jaxen包。
public class DOM4JDemo { public static void main(String[] args) throws DocumentException { SAXReader reader = new SAXReader(); Document doc = reader.read("files/book.xml"); Element root = doc.getRootElement(); List<Element> list = root.elements("书"); Element book0 = list.get(0); Element author = book0.element("作者"); System.out.println(author.getText()); } }
利用XPATH
public static void dom4jDemo2() throws DocumentException{ SAXReader reader = new SAXReader(); Document doc = reader.read("files/book.xml"); Node node = doc.selectSingleNode("/书架/书[1]/作者"); Element e = (Element) node; System.out.println(e.getText()); }
标签:
原文地址:http://www.cnblogs.com/byron0918/p/4716736.html