码迷,mamicode.com
首页 > 其他好文 > 详细

Pyhton3 操作xml文件-根据标签名称输出标签的文本值

时间:2019-02-12 21:47:14      阅读:226      评论:0      收藏:0      [点我收藏+]

标签:subject   对象   fir   nts   span   采集   文本   png   ima   

文件截图:

技术图片

我将豆瓣某用户的想读、在读、读过书籍的名称以及链接采集下来并存入xml文件中,上图为某用户想读书籍的信息截图。

存储好书籍的链接以后,我们若想根据这个链接去访问每一本书的书籍主页并获得详细信息时,要面临的第一个问题就是:如何使用Python语言读取多个同名标签的文本值呢?

 1 import xml.dom.minidom
 2 
 3 #打开xml文档,其中abc代表想要读取的xml文件名称
 4 dom = xml.dom.minidom.parse(abc.xml)
 5 
 6 #得到文档的元素对象
 7 root = dom.documentElement
 8 
 9 #bookUrl代表想要读取的标签名称
10 info= dom.getElementsByTagName(bookUrl)
11 
12 #因为xml文件中存在多个同名的标签,因此我们需要使用for循环来遍历每一对符合要求的标签读取、显示它们的文本信息
13 for i in range(len(info)):
14     url=info[i].firstChild.data
15     print(url)

程序运行结果:

https://book.douban.com/subject/30361646/
https://book.douban.com/subject/27064871/
https://book.douban.com/subject/11442993/
https://book.douban.com/subject/26584727/
https://book.douban.com/subject/26928713/
https://book.douban.com/subject/27055756/
https://book.douban.com/subject/27044356/
https://book.douban.com/subject/26901114/
https://book.douban.com/subject/1186348/
https://book.douban.com/subject/2109619/
https://book.douban.com/subject/27005639/
https://book.douban.com/subject/26739163/

如有错误,恳请大家指正,共同进步~

Pyhton3 操作xml文件-根据标签名称输出标签的文本值

标签:subject   对象   fir   nts   span   采集   文本   png   ima   

原文地址:https://www.cnblogs.com/LiXinx/p/10367018.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!