码迷,mamicode.com
首页 > 编程语言 > 详细

Python_爬虫_数据解析回顾

时间:2019-09-11 09:48:01      阅读:94      评论:0      收藏:0      [点我收藏+]

标签:text   数据   soup   xpath   sel   python   方法   表达   行数据   

--数据解析原理

  --定位标签

  --提取标签中存储的数据

--xpath解析原理

  --实例化一个etree的对象且将解析的页面源码数据加载到该对象中

  --通过xpath方法(返回值:列表)结合者xpath表达式进行数据解析

      -- //tagName

      -- //tagName[@attr = ‘value‘]

      -- //tagName[index]

      -- /text() //text()

      -- /@attrName

--bs4解析原理

  --实例化一个bs4的对象且将解析的页面源码数据加载到该对象中

  --通过相关的方法和属性进行数据解析

      -- soup.tagName

      -- soup.find(‘tagName‘, attrName = ‘value‘)  <==> find_all()

      -- select(‘css选择器‘) //标签, 类, id, 层级

      -- string,text,get_text()

      -- tag[‘attrName‘]

 

 

  

Python_爬虫_数据解析回顾

标签:text   数据   soup   xpath   sel   python   方法   表达   行数据   

原文地址:https://www.cnblogs.com/helloboke/p/11504150.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!