今天来讲如何利用Python爬虫下载文章,拿韩寒的博客为例来一步一步进行详细探讨。。。
韩寒的博客地址是:http://blog.sina.com.cn/s/articlelist_1191258123_0_1.html
可以看出左边是文章列表,而且不止一页,我们先从最简单的开始,先对一篇文章进行下载,再研究对一页所有的文
章进行下载,最后再研究对所有的文章下载。...
分类:
编程语言 时间:
2014-07-22 22:59:35
阅读次数:
330
1.Java基础
很多朋友一上手就开始学习Android,似乎太着急了一些。Android应用程序开发是以Java语言为基础的,所以没有扎实的Java基础知识,只是机械的照抄别人的代码,是没有任何意义的。那么Java学到什么程度才算是过关呢?我个人认为至少要掌握以下两个方面的内容:
a) Java基...
分类:
移动开发 时间:
2014-05-07 14:56:38
阅读次数:
426
t = '''www.jeapedu.com
www.chinagame.me
www.quanzhan.org
'''
print t.splitlines()
Python的split方法函数可以分割字符串成列表,默认是以空格作为分隔符sep来分割字符串。
In [1]: s = "www jeapedu com"
In [2]: p...
分类:
编程语言 时间:
2014-05-07 02:37:08
阅读次数:
478
网站开发概述LAMP开发概述HTML基础CSS基础DIV+CSSJavascriptJquery(Ajax)WAMP 环境搭建PHP基本语法,变量,数据类型,表达式,常量,流程控制,函数,数组超全局数组面向对象字符串处理正则表达式文件处理错误处理异常机制日期和时间图像处理MySQL 数据库使用PHP使用mysql扩展库PHP使用mysqli扩展库PDO的使用memchached 安装和使用PHP...
分类:
其他好文 时间:
2014-05-04 18:29:58
阅读次数:
396
第一阶段 第一讲,WEB基础 1.1 网站基本知识;1.2 网络协议介绍;1.3
B/S与C/S结构的区别;1.4 WEB编程、网站开发技术介绍。 第二讲,网页设计 2.1 Dreamweaver介绍及使用;2.2
静态网页HTML语言;2.3 标题与段落,换行与分割线;2.4 表格、表单;2.5....
分类:
Web程序 时间:
2014-04-30 03:40:34
阅读次数:
678
这两天看了好几篇不错的文章,有的时候想把好的文章 down 下来放到 kindle
上看,便写了个爬虫脚本,因为最近都在搞 node,所以就很自然的选择 node
来爬咯~本文地址:http://www.cnblogs.com/hustskyking/p/spider-with-node.html,...
分类:
Web程序 时间:
2014-04-28 12:20:09
阅读次数:
566