码迷,mamicode.com
首页 >  
搜索关键字:bs4    ( 922个结果
BS4(BeautifulSoup4)的使用--find_all()篇
可以直接参考 BS4文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#find-all 注意的是: 1.有些tag属性在搜索不能使用,比如HTML5中的 data-* 属性: data_soup = Beau ...
分类:其他好文   时间:2016-12-03 20:48:36    阅读次数:535
CentOS下安装bs4
系统带的python2.7 到官网下载最新的python3.5.2 https://www.python.org/downloads/release/python-352/ 由于CentOS没有自带apt-get,只能自行下载安装 如果你的linux有apt-get,请执行 bs4的下载地址 htt ...
分类:其他好文   时间:2016-12-02 13:58:37    阅读次数:757
beautifulsoup测试
import re from bs4 import BeautifulSoup html_doc = """ <html><head><title>The Dormouse's story</title></head> <body> <p class="title"><b>The Dormouse' ...
分类:其他好文   时间:2016-11-30 02:50:15    阅读次数:250
抓取新浪新闻的内容以及链接
import requestsfrom bs4 import BeautifulSoupres = requests.get('http://news.sina.com.cn/china/')res.encoding='utf-8'soup = BeautifulSoup(res.text,'htm ...
分类:其他好文   时间:2016-11-27 19:23:08    阅读次数:206
Python爬虫抓取 python tutorial中文版,保存为word
看到了中文版的python tutorial,发现是网页版的,刚好最近在学习爬虫,想着不如抓取到本地 首先是网页的内容 查看网页源码后发现可以使用BeautifulSoup来获取文档的标题和内容,并保存为doc文件。 这里需要使用from bs4 import BeautifulSoup 来导入该模 ...
分类:编程语言   时间:2016-11-27 07:26:36    阅读次数:167
python爬取手机归属地
用python+bs4爬取了手机归属地数据: import urllib.request from bs4 import BeautifulSoup def spider1(url): headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) App ...
分类:移动开发   时间:2016-11-25 17:28:06    阅读次数:256
【python】坑,坑,折腾一个下午python 3.5中 ImportError: No module named BeautifulSoup
将语句 from bs4 import BeautifulSoup4 改成 from bs4 import BeautifulSoup 通过 尼玛………………………………………………………………! 总结一下: python 2.7.9调用 from BeautifulSoup import Beau ...
分类:编程语言   时间:2016-11-08 19:46:36    阅读次数:312
爬取某电影网站最新电影
1 # -*- coding: utf-8 -*- 2 """ 3 Created on Wed Oct 12 16:48:33 2016 4 5 @author: fuzzier 6 """ 7 8 import requests 9 from bs4 import BeautifulSoup 1 ...
分类:Web程序   时间:2016-10-12 19:59:08    阅读次数:223
用Python写爬虫爬取58同城二手交易数据
爬了14W数据,存入Mongodb,用Charts库展示统计结果,这里展示一个示意 模块1 获取分类url列表 from bs4 import BeautifulSoup import requests,pymongo main_url = 'http://bj.58.com/sale.shtml' ...
分类:编程语言   时间:2016-09-20 19:56:09    阅读次数:224
python之lxml(xpath)
bs4确实没这个好用,bs4的树太复杂 lxml很好 定位非常好 详细解说在注释里面有了 打印结果: ...
分类:编程语言   时间:2016-09-02 13:15:52    阅读次数:588
922条   上一页 1 ... 81 82 83 84 85 ... 93 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!