码迷,mamicode.com
首页 >  
搜索关键字:soup    ( 551个结果
Python数据清理之解析XML文件
解析XML 使用Beautiful Soup ...
分类:编程语言   时间:2017-04-09 23:21:20    阅读次数:257
css选择器
我们在写css时,标签名不加任何修饰,类名前加 '.',id前加#,在这里我们也可以用类似的方法来筛选元素 用到的方法是soup.select(),返回类型list (1)通过标签名查找 (2)通过类名查找 (3)通过id名查找 (4)组合查找 组合查找即和写 class 文件时,标签名与类名、id ...
分类:Web程序   时间:2017-04-09 17:00:03    阅读次数:216
python 学习之FAQ:find 与 find_all 使用
FAQ记录 1. 错误源码 错误源码如下 def fillUnivList(_html,_ulist): soup =BeautifulSoup(_html,'html.parser') for tr in soup.find_all('tbody').children: if isinstance ...
分类:编程语言   时间:2017-04-08 00:44:17    阅读次数:311
Python爬虫入门遇到的坑
1. 环境 - Python mac os预装的python - IDE Pycharm - 辅助 安装pip - Python库 2. 问题 - 问题1 代码: soup = BeautifulSoup(html, 'lxml') 报错: Traceback (most recent call l ...
分类:编程语言   时间:2017-04-04 17:38:53    阅读次数:342
python-股票数据定向爬取
re.findall soup.find_all Q for i in ***: ***可以是什么类型,主要是关心什么类型的不可以 trackback用法 >>> >>> import traceback>>> try:... 1/0... except (Exception,e):... trac ...
分类:编程语言   时间:2017-04-04 09:38:38    阅读次数:460
爬虫之获取当当网全部图书
#爬取当当网图书,未使用框架 #main是主函数 #KindLinks.py和 获取数据信息.py 是2个封装的类 #KindLinks只有一个方法,它返回的是 listUrl (name(小分类名称),url(小分类对应的链接)) LB (总的分类) #获取数据信息有2个方法, getpage() ...
分类:其他好文   时间:2017-04-02 17:33:52    阅读次数:221
beautifulsoup 根据class属性查找标签的方法。
写爬虫的时候遇到的: 导入beautifulSoup后, 查找类似<div class = "abcd">的时候, 直接使用beautifulsoup的方法: soup.findall("div", class="abcd") 这样写的时候回报错, 按照官方的一种方法写在class后加“_“试了试没 ...
分类:其他好文   时间:2017-04-01 12:52:14    阅读次数:498
Beautiful Soup4库文档学习
https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/#id4中文版BeautifulSoup库作用提取HTML和XML文档中的数据修改、导航、查找文档创建html_doc>>>html_doc="""...<html><head><title>TheDormouse‘sstory</title></head>...&l..
分类:其他好文   时间:2017-03-23 17:02:17    阅读次数:162
BeautifulSoup学习 之结构
Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: ()1)、Tag 就是html中的标签,如图所示 代码: (2)NavigableString 要想获取标签内部的文字怎么办呢 很简单,用 .string 即可,例如 可以 ...
分类:其他好文   时间:2017-03-12 23:50:40    阅读次数:193
python xml与字典的相互转换
def trans_xml_to_dict(xml): """ 将微信支付交互返回的 XML 格式数据转化为 Python Dict 对象 :param xml: 原始 XML 格式数据 :return: dict 对象 """ soup = BeautifulSoup(xml, features= ...
分类:编程语言   时间:2017-03-08 17:38:03    阅读次数:203
551条   上一页 1 ... 45 46 47 48 49 ... 56 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!