早上还有实验验收,先上代码,早上再写。import urllib2import refrom bs4 import BeautifulSoupcontent = urllib2.urlopen("http://www.cnblogs.com/ly941122/").read();soup=Beaut...
分类:
Web程序 时间:
2015-06-13 01:06:05
阅读次数:
215
由于之前的改造,现在将爬虫的功能做了一些改变,具体实现的功能是将推荐的日志全部抓取下来,并存放在以文章标题命名的文件中,代码如下:
import urllib
import os,re
import sys
from bs4 import BeautifulSoup
reload(sys)
sys.setdefaultencoding("utf-8")
def if_st...
分类:
其他好文 时间:
2015-05-26 09:10:41
阅读次数:
229
废话不多说,直接贴代码,主要采用BeautifulSoup写的
# -*- coding: utf-8 -*-
"""
Created on Mon May 18 19:12:06 2015
@author: Administrator
"""
import urllib
import os
from bs4 import BeautifulSoup
impo...
分类:
编程语言 时间:
2015-05-19 10:44:07
阅读次数:
145
#coding:utf-8#version: 0.1#note:实现了查找0daydown最新发布的10页资源。import urllib.requestfrom bs4 import BeautifulSoupfor i in range(1,11): url = "http://www.0day...
分类:
其他好文 时间:
2015-05-16 14:42:12
阅读次数:
130
1.在线文档 http://www.crummy.com/software/BeautifulSoup/bs4/doc/
2.常用方法
选择器 find_all(name, attrs, recursive, text, limit, **kwargs)
3.主要调用方法
4.完整代码
#-*- coding:utf-8 -*-
from bs4 import B...
分类:
其他好文 时间:
2015-05-12 11:29:48
阅读次数:
118
http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html"你可能在寻找 Beautiful Soup3 的文档,Beautiful Soup 3 目前已经停止开发,我们推荐在现在的项目中使用Beautiful Soup 4,...
分类:
其他好文 时间:
2015-04-15 18:42:43
阅读次数:
178
1、安装bs4我用的ubuntu14.4,直接用apt-get命令就行sudo apt-get install Python-bs42、安装解析器Beautiful Soup支持Python标准库中的HTML解析器,还支持一些第三方的解析器,其中一个是lxml。sudo apt-get instal...
分类:
编程语言 时间:
2015-04-07 15:05:13
阅读次数:
230
#coding:utf-8'''Created on 2015?-4-5@author: Administrator'''from bs4 import BeautifulSoupimport urllib2import sysreload(sys)sys.setdefaultencoding('u...
分类:
编程语言 时间:
2015-04-05 17:13:09
阅读次数:
200
#coding:gbkimport sys,reimport urllib.request#from bs4 import BeautifulSoupdef getId(url,i): postdata = urllib.parse.urlencode({'currentPage': i}) ...
分类:
其他好文 时间:
2015-03-18 23:08:29
阅读次数:
187
第一步:下载beautifulsoup4-4.3.2.tar.gz第二步:拷贝解压缩目录到C:\Python34\beautifulsoup4-4.3.2第三步:第四步:第五步:拷贝C:\Python34\beautifulsoup4-4.3.2\build\lib\bs4目录到C:\Python3...
分类:
编程语言 时间:
2015-02-28 14:16:28
阅读次数:
309