寒假开始学习一些简答的爬虫并且做一些有意义的事情。首先,百度一下爬虫的意思:网络爬虫:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。我所理解的...
分类:
其他好文 时间:
2016-01-17 01:11:22
阅读次数:
216
写CSS的同学们往往会体会到,随着项目规模的增加,项目中的CSS代码也会越来越多,如果没有及时对CSS代码进行维护,CSS代码不断会越来越多。CSS代码交错复杂,像一张庞大的蜘蛛网分布在网站的各个位置,你不知道修改这行代码会有什么影响,所以如果有修改或增加新功能时,开发人员往往不敢去删除旧的冗余.....
分类:
Web程序 时间:
2016-01-13 12:55:13
阅读次数:
247
写CSS的同学们往往会体会到,随着项目规模的增加,项目中的CSS代码也会越来越多,如果没有及时对CSS代码进行维护,CSS代码不断会越来越多。CSS代码交错复杂,像一张庞大的蜘蛛网分布在网站的各个位置,你不知道修改这行代码会有什么影响,所以如果有修改或增加新功能时,开发人员往往不敢去删除旧的冗余的代...
分类:
Web程序 时间:
2016-01-05 01:31:04
阅读次数:
238
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
分类:
其他好文 时间:
2015-10-30 12:37:42
阅读次数:
99
网络爬虫又称网页蜘蛛、网络机器人、在FOAF社区常称网页追逐者。网络爬虫是一种按照一定规则,自动抓取万维网信息的程序或脚本。另外一些不常使用名称还有蚂蚁、自动索引、模拟程序或蠕虫。随着网络的迅速发展,万维网成为大量信息的载体,如何有效提取并利用这些信息成为一个巨大挑战。搜索引擎(Search Eng...
分类:
其他好文 时间:
2015-10-28 19:09:22
阅读次数:
7115
在介绍HTML之前,我想先说说Web,就是我们经常所说的互联网,web的页面就是一个网页,或者说是一种文档,而这种文档是从何而来的那?紧接着,HTML就要出厂了。一、Web与HTMLWeb是互联网的总称,Wbe的本意是蜘蛛网或网的意思,在网页设计中我们称为网页的意思。现广泛译作网络、互联网等技术领域...
分类:
Web程序 时间:
2015-08-21 13:30:28
阅读次数:
151
Spiderman - 又一个Java网络蜘蛛/爬虫Spiderman 是一个基于微内核+插件式架构的网络蜘蛛,它的目标是通过简单的方法就能将复杂的目标网页信息抓取并解析为自己所需要的业务数据。主要特点* 灵活、可扩展性强,微内核+插件式架构,Spiderman提供了多达 10 个扩展点。横跨蜘蛛线...
分类:
编程语言 时间:
2015-08-11 07:13:36
阅读次数:
280
在介绍HTML之前,我想先说说Web,就是我们经常所说的互联网,web的页面就是一个网页,或者说是一种文档,而这种文档是从何而来的那?紧接着,HTML就要出厂了。
一、Web与HTML
Web是互联网的总称,Wbe的本意是蜘蛛网或网的意思,在网页设计中我们称为网页的意思。现广泛译作网络、互联网等技术领域,其表现形式为:超文本(hypertext)超媒体(hypermed...
分类:
Web程序 时间:
2015-07-19 13:36:48
阅读次数:
188
两周前,做的一个项目需要模拟一批用户评价数据,如果想让数据看着真实点,那就得使用随机的用户昵称和头像啊。要是头像或者昵称全都差不多,那别人一看就看出来这是做的数据了。 于是乎我就写了个从我QQ空间开始的蜘蛛网式的爬虫程序,程序断断续续的运行了两周。总共爬到了腾讯3000万QQ数据,其中有300万包....
分类:
其他好文 时间:
2015-07-18 12:13:28
阅读次数:
123
定义网络爬虫 网络爬虫(Web Spider,也被称为网络蜘蛛,网络机器人,也被称为网页追逐者)。按照一定的规则,维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自己主动索引,模拟程序或者蠕虫。假设把互联网比喻成一个蜘蛛网。那么Spider就是在网上爬来爬去的蜘蛛。 网络蜘蛛是通...
分类:
编程语言 时间:
2015-06-16 16:07:24
阅读次数:
189