Python xml 解析百度糯米信息

时间：2016-08-04 07:55:55 阅读：234 评论：0 收藏：0 [点我收藏+]

标签：

先利用爬虫利用百度糯米提供的api来采集北京当天的团购信息，保存为numi.html

import xml.etree.ElementTree as ET
import os

class Nuomi():

   def __init__(self):

       self.numi=[]
   def Parse(self,filepath):

       tree=ET.parse(filepath)
       root =tree.getroot()
       for url in root.iter(‘url‘):
           nuomi_lei={}
           data=url.find(‘data‘)
           if data is not None:
               display=data.find(‘display‘)
               if display is not None:
                   try:
                       nuomi_lei[‘title‘]=display.find(‘title‘).text
                   except Exception as e:
                       print("No title")
                   try:
                       nuomi_lei[‘businessTitle‘]=display.find(‘businessTitle‘).text
                   except Exception as e:
                       print ("No businessTitle")
                   try:
                       nuomi_lei[‘value‘] =display.find(‘value‘).text
                   except Exception as e:
                       print ("No value")
                   try:
                       nuomi_lei[‘price‘]=float(display.find(‘price‘).text)
                   except Exception as e:
                       print("No pire")
                   self.numi.append(nuomi_lei)
       return(self.numi)


if __name__ == ‘__main__‘:

   nuomi=Nuomi()
   date=nuomi.Parse(‘numi.html‘)
   print(len(date))

Python xml 解析百度糯米信息

标签：

原文地址：http://www.cnblogs.com/leiziv5/p/5735235.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行