参照着网上的爬虫案例(点我),先做了一个demo,基本的爬虫项目创建,以及数据抽取,数据分析,数据保存等等过程基本上有所掌握。
我的需求是需要检索指定的百度贴吧,根据指定的关键字库,搜索出含有关键字的链接,并抽取出来,用于后续告警。 因此,基于需求,分如下步骤:
第一:基于Scrapy创建爬虫项目;...
分类:
编程语言 时间:
2014-04-28 17:37:30
阅读次数:
707
索引(Index)是帮助mysql高效获取数据的数据结构。对于高性能非常关键。索引的重要性主要体现在数据量非常大的时候。规模小,负载轻的数据库即使没有索引也可以获到好的查询效果例如:1
mysql>select first_name from actor where actor_id=5;改索引列位...
分类:
数据库 时间:
2014-04-28 06:31:23
阅读次数:
959