简单爬虫R实现1、广度优先搜索策略网页的结构通常是一个页面包含正文和多个链接,这些链接大部分是域内链接,但也含有域外链接。通过对这些链接进行遍历,一层一层地搜索就可以搜索到所有页面。如图,网页结构已经很好的显示了一种图的层次结构。在这种图的结构中,简单地实现遍历,我们就可以采用两种遍历方式,广度优先...
分类:
其他好文 时间:
2014-05-16 21:08:33
阅读次数:
339
学了差不多两年的编程,沉下心来回想一下,除了类似 HelloWorld
这样简单的程序会写,其他稍微复杂一点的程序代码,连看都不敢看。说没有学过什么语言,那肯定不是啦!可能就是因为接触的语言多了,都是学了些皮毛,感觉什么语言都会。其实,是什么都不会。大一,有接触过Java,SQL
server,Ma...
分类:
其他好文 时间:
2014-05-16 08:11:15
阅读次数:
232
最近在做语义方面的问题,需要反义词。就在网上找反义词大全之类的,但是大多不全,没有我想要的。然后就找相关的网站,发现了http://fanyici.xpcha.com/5f7x868lizu.html,还行能把“老师”-“学生”,“医生”-“病人”这样对立关系的反义词查出来。一开始我想把网站中数据库...
分类:
编程语言 时间:
2014-05-16 08:10:36
阅读次数:
465
转自:http://blog.csdn.net/jinxfei/article/details/5545874从网上发现这篇文章,发现和我写的一篇关于《知识体系》的文章互相呼应,就转过来了。转自:http://tieba.baidu.com/f?kz=692446591怎么学习Java,这是很多新手...
分类:
编程语言 时间:
2014-05-12 10:46:32
阅读次数:
318
1 #!/usr/bin/python 2 #coding:utf8 3 import re 4
import urllib 5 6 def gethtml(url): 7 page=urllib.urlopen(url) 8
html=page.read() 9 ret...
分类:
编程语言 时间:
2014-05-10 18:39:47
阅读次数:
399
来源:http://www.cnblogs.com/mjios/p/3226954.html
分类:
移动开发 时间:
2014-05-10 06:00:58
阅读次数:
312
这几天闲着没事,写了个python爬虫,专把堆糖上的摄影类图片扒下来...
分类:
编程语言 时间:
2014-05-09 01:05:09
阅读次数:
295
先看看列表里的__setslice__方法函数的帮助文档
help(list.__setslice__)
帮助文档如下所示:
__setslice__(...)
x.__setslice__(i, j, y) x[i:j]=y
Use of negative indices is not supported.
从帮助文档可以看出这个方法函数可...
分类:
编程语言 时间:
2014-05-09 01:01:56
阅读次数:
326
1 .NET Framework常见的API要熟练掌握。 2 Linq to Object。Linq
to
Object是一项很重要的技术。如果没有这项技术,数据的查找和操作的代码会被foreach充满,这样不容易维护,而且有很多代码都是routine代码,可以省略的。
同时,与Linq搭配的技术L...
分类:
Web程序 时间:
2014-05-08 23:57:10
阅读次数:
524