最初是想端午节放假3天写一个爬虫,原型版本完成后。。发现自己想要的其实是数据采集工具。
目前进度如下
已完成:
1.简易WPF界面,Log显示,开关暂停
2.硬盘结果写入,xml配置文件读写。
3.html分析,用的indexof分析全文。但稳定抓了一星期百度贴吧,中途没崩过。
未完成:
1.xml文件图形化编辑,保存,预览。
2.网页搜索结果,可图形化预览。
最近抓取准备换成HtmlAgility或者Jumony。走这一步问题很多,于是排在后面。
原文地址:http://www.cnblogs.com/FEAUOR/p/3775594.html