用DOM实现对XML文件的解析

时间：2020-05-26 18:34:45 阅读：70 评论：0 收藏：0 [点我收藏+]

DOM 解析器介绍

DOM的 xml.dom.minidom 子模块、xml.dom.pulldom 子模块分别提供两种形式的解析器。

xml.dom.minidom 子模块
主要提供对 XML 文档的读、修改操作，解析器的使用格式如下：
xml.dom.minidom.parse(filename_or_file,parse=None,bufsize=None)
该解析器解析成功，返回指定 XML 文件的一个文档对象。

本文用到的 DOM 对象的相关函数介绍

1.1 Node 接口对象相关函数
Node.childNodes,返回当前节点中包含的节点列表，这是一个只读属性。
1.2 Document 接口对象相关函数
Document.documentElement，返回文档的所有元素。
Document.getElementsByTagName(tagName)，搜索所有具有特定元素类型名称下的子元素，返回元素集合。
1.3 Element 接口对象相关函数
Element.hasAttribute(name)，如果元素具有按指定 name 命名的属性，返回True。
Element.getAttribute(name)，以字符串形式返回指定 name 命名的属性的值，如果不存在这样的标签，则返回空字符串。
Element.setAttribute(name,value)，设置 name 标签指定的值。
Element.removeAttribute(name)，删除 name 标签指定的元素。

文件解析示例

1、 XML文件(movies.xml)

<collection shelf="New Arrivals">
   <movies title="Enemy Behind">
      <type>War, Thriller</type>
      <format>DVD</format>
      <year>2003</year>
      <rating>PG</rating>
      <stars>10</stars>
      <description>Talk about a US-Japan war</description>
   </movies>
</collection>

2、 DOM解析XML文件(sax_movie.py)

from xml.dom.minidom import parse
import xml.dom.minidom
# 使用minidom解析器打开 XML 文档
DOMTree = xml.dom.minidom.parse(‘D:\\My-python\\XML\\movies.xml‘)
# 该解析器解析成功，返回一个文档对象DOMTree接收
collection = DOMTree.documentElement # 把所有的元素存入集合中
print(collection.toxml())
if collection.hasAttribute("shelf"):
   print ("Root element : %s" % collection.getAttribute("shelf"))
# 获取movie元素下的子元素集合
movies = collection.getElementsByTagName("movies")
movies_record = []
# 打印每部电影的详细信息
for movie in movies:
   if movie.hasAttribute("title"): # 判断是否存在title属性
      movies_record.append(movie.getAttribute("title")) # 获取属性对应的值
   type = movie.getElementsByTagName(‘type‘)[0] # 获取 type 标签对应的元素
   movies_record.append(type.childNodes[0].data) # 获取 type 元素对应的值
   format = movie.getElementsByTagName(‘format‘)[0]
   movies_record.append(format.childNodes[0].data)
   rating = movie.getElementsByTagName(‘rating‘)[0]
   movies_record.append(rating.childNodes[0].data)
   stars = movie.getElementsByTagName(‘stars‘)[0]
   movies_record.append(stars.childNodes[0].data)
   description = movie.getElementsByTagName(‘description‘)[0]
   movies_record.append(description.childNodes[0].data)
print(movies_record)

3、运行结果

<collection shelf="New Arrivals">

   <movies title="Enemy Behind">
      <type>War, Thriller</type>
      <format>DVD</format>
      <year>2003</year>
      <rating>PG</rating>
      <stars>10</stars>
      <description>Talk about a US-Japan war</description>
   </movies>
</collection>

Root element : New Arrivals
[‘Enemy Behind‘, ‘War, Thriller‘, ‘DVD‘, ‘PG‘, ‘10‘, ‘Talk about a US-Japan war‘]

用DOM实现对XML文件的解析

标签：列表属性 mtr lld 点列文档解析命名只读

原文地址：https://www.cnblogs.com/monsterhy123/p/12966988.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

用DOM实现对XML文件的解析

DOM 解析器介绍

本文用到的 DOM 对象的相关函数介绍

文件解析示例

1、 XML文件(movies.xml)

2、 DOM解析XML文件(sax_movie.py)

3、 运行结果

3、运行结果