码迷,mamicode.com
首页 > Web开发 > 详细

pands模块的妙用爬取网页中的表格

时间:2019-10-25 09:54:44      阅读:220      评论:0      收藏:0      [点我收藏+]

标签:before   href   first   log   组件   内容   html   屏幕   爬取   

拿我这篇为例https://www.cnblogs.com/pythonywy/p/11574340.html

import pandas as  pd

df = pd.read_html('https://www.cnblogs.com/pythonywy/p/11574340.html')
print(df)
'''[             设备 rpx换算px (屏幕宽度/750) px换算rpx (750/屏幕宽度)
0       iPhone5      1rpx = 0.42px      1px = 2.34rpx
1       iPhone6       1rpx = 0.5px         1px = 2rpx
2  iPhone6 Plus     1rpx = 0.552px      1px = 1.81rpx,                 选择器              样例                             样例描述
0            .class          .intro         选择所有拥有 class="intro" 的组件
1               #id      #firstname          选择拥有 id="firstname" 的组件
2           element            view                     选择所有 view 组件
3  element, element  view, checkbox  选择所有文档的 view 组件和所有的 checkbox 组件
4           ::after     view::after                  在 view 组件后边插入内容
5          ::before    view::before                  在 view 组件前边插入内容]
'''

主要就是处理一些特别的网站,

pands用法点我

pands模块的妙用爬取网页中的表格

标签:before   href   first   log   组件   内容   html   屏幕   爬取   

原文地址:https://www.cnblogs.com/pythonywy/p/11736183.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!