标签:
已经做搜索一段时间了,觉得有必要记录下来,不然就没有沉淀了,这个系列准备一直延续下去,后面也会有越来越多高深点的东西等着去学习。目前准备有这些内容,后面会慢慢的添加
入门篇
1.C#获取网页信息核心方法(入门系列一)
2.页面解析和内容提取
3.SOLR的增删改查
4.Nutch爬虫的使用
5.自己开发的一个完整定制爬虫(C#)
杂记
1.Nutch抓取需要登录的页面
2.C#读取RSS源,并利用Solr索引
信息采集入门系列目录(更新中...)
原文地址:http://www.cnblogs.com/xiaoshuai1992/p/search.html