可以直接参考 BS4文档:https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#find-all 注意的是: 1.有些tag属性在搜索不能使用,比如HTML5中的 data-* 属性: data_soup = Beau ...
分类:
其他好文 时间:
2016-12-03 20:48:36
阅读次数:
535
系统带的python2.7 到官网下载最新的python3.5.2 https://www.python.org/downloads/release/python-352/ 由于CentOS没有自带apt-get,只能自行下载安装 如果你的linux有apt-get,请执行 bs4的下载地址 htt ...
分类:
其他好文 时间:
2016-12-02 13:58:37
阅读次数:
757
import re from bs4 import BeautifulSoup html_doc = """ <html><head><title>The Dormouse's story</title></head> <body> <p class="title"><b>The Dormouse' ...
分类:
其他好文 时间:
2016-11-30 02:50:15
阅读次数:
250
import requestsfrom bs4 import BeautifulSoupres = requests.get('http://news.sina.com.cn/china/')res.encoding='utf-8'soup = BeautifulSoup(res.text,'htm ...
分类:
其他好文 时间:
2016-11-27 19:23:08
阅读次数:
206
看到了中文版的python tutorial,发现是网页版的,刚好最近在学习爬虫,想着不如抓取到本地 首先是网页的内容 查看网页源码后发现可以使用BeautifulSoup来获取文档的标题和内容,并保存为doc文件。 这里需要使用from bs4 import BeautifulSoup 来导入该模 ...
分类:
编程语言 时间:
2016-11-27 07:26:36
阅读次数:
167
用python+bs4爬取了手机归属地数据: import urllib.request from bs4 import BeautifulSoup def spider1(url): headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1) App ...
分类:
移动开发 时间:
2016-11-25 17:28:06
阅读次数:
256
将语句 from bs4 import BeautifulSoup4 改成 from bs4 import BeautifulSoup 通过 尼玛………………………………………………………………! 总结一下: python 2.7.9调用 from BeautifulSoup import Beau ...
分类:
编程语言 时间:
2016-11-08 19:46:36
阅读次数:
312
1 # -*- coding: utf-8 -*- 2 """ 3 Created on Wed Oct 12 16:48:33 2016 4 5 @author: fuzzier 6 """ 7 8 import requests 9 from bs4 import BeautifulSoup 1 ...
分类:
Web程序 时间:
2016-10-12 19:59:08
阅读次数:
223
爬了14W数据,存入Mongodb,用Charts库展示统计结果,这里展示一个示意 模块1 获取分类url列表 from bs4 import BeautifulSoup import requests,pymongo main_url = 'http://bj.58.com/sale.shtml' ...
分类:
编程语言 时间:
2016-09-20 19:56:09
阅读次数:
224
bs4确实没这个好用,bs4的树太复杂 lxml很好 定位非常好 详细解说在注释里面有了 打印结果: ...
分类:
编程语言 时间:
2016-09-02 13:15:52
阅读次数:
588