Scrapy是一个用python实现都爬虫框架,简单易用,功能强大,只需要在框架的基础上自定义自己的分析规则即可,具体如何新建工程等待都在官方文档上面讲解得非常清楚,官方文档tutorial(http://doc.scrapy.org/en/latest/intro/tutorial.html).....
分类:
编程语言 时间:
2014-07-22 22:50:15
阅读次数:
307
之前使用scrapy实现了一个超级简单的爬虫工具,用于抓取豆瓣上面所有的编程书籍信息(由于不需要爬取整个页面的所以链接,所以不需要用到BFS or DFS,只实现顺序抓取下一页) 这次使用的是python自带的urllib 和urllib2等python模块实现,同样以豆瓣上面的爱情电影信息作...
分类:
编程语言 时间:
2014-07-22 22:47:35
阅读次数:
347
假期重新拾起Java来学,先是拿来《Think in Java》看,但不幸的是,那本书真心有点生涩乏味。于是上豆瓣寻找到一本李刚老师写的《疯狂Java讲义》,这几天看了一百来页,来总结总结。网上对于此书的评论,捧的大致上说这本书相对于国外教材来说,语言贴近中国人思维,容易理解,而且内容翔实;批的说这本书太罗嗦,让人捉不到重点。实际上,就我这几天的阅读看来,这本书是非常适合我的,在细节方面的解释,以...
分类:
编程语言 时间:
2014-07-22 00:05:37
阅读次数:
275
豆瓣简介:2005年3月上线 以分享和发现为核心的社区,读书、电影、音乐、小组、同城、九点,我的豆瓣、友邻!
分类:
其他好文 时间:
2014-07-17 22:23:47
阅读次数:
301
来自豆瓣:http://www.douban.com/note/347831403/2014年最新中国手机号段大全2014-04-28 10:46:56 【最新中国手机号段大全】移动:134、135、136、137、138、139、150、151、152、157、158、159、182、183、18...
分类:
移动开发 时间:
2014-07-16 20:02:24
阅读次数:
189
本文有感于《精通Puppet配置管理工具》在豆瓣上的某些差评而顺手写的书评。半路出家 故事要从12年初说起。 某天,部门老大让我所在team的老大调研一下当下业界的配置管理工具。于是我的老大给我分配了一个棘手的任务,要求我转型去做devops,并尝试在本季度内使用Puppet来管理现有的IA...
分类:
其他好文 时间:
2014-07-16 19:32:29
阅读次数:
240
pipy国内镜像目前有:http://pypi.douban.com/ 豆瓣http://pypi.hustunique.com/ 华中理工大学http://pypi.sdutlinux.org/ 山东理工大学http://pypi.mirrors.ustc.edu.cn/ 中国科学技术大学手动指定...
分类:
编程语言 时间:
2014-07-14 14:41:42
阅读次数:
331
近期在帮人弄一个豆瓣API应用,在豆瓣的OAuth2.0认证过程中遇到了各种问题,同一时候自己须要一个个的尝试与解决,终于完毕了豆瓣API的訪问.作者这里就不再吐槽豆瓣的认证文档了,毕竟人家也不easy.可是作者发现关于豆瓣OAuth认证过程的文章很之少,所以想具体写这样一篇文章方便后面要做相同东....
分类:
其他好文 时间:
2014-07-13 13:01:21
阅读次数:
483
1.《职场软实力 人生硬道理》豆瓣 7.6分内容简介:每个人都希望自己能拥有实力,能在激烈的职场竞争中胜出。但现在是职场软实力的时代了,你必须要有对“实力”的重新认识,才能有与众不同的表现;必须拥有良好的人际交往、协调沟通和自我管理等“软实力”,才能去得更高、走得更远。现在,就让世界500强资深经理...
分类:
其他好文 时间:
2014-07-02 20:49:33
阅读次数:
164
最近经常上豆瓣,也关注了一下他们最近推出的API服务,据说淘宝也将开放API,google更是不用说,开始为众多的ajax库提供服务器端分发服务。越来越多的网站开始提供API服务,也表示有越来越多的Mashup可能性,抛砖引玉,希望越来越多的开发者加入到这个领域。一、JsonP + API:Java...