码迷,mamicode.com
首页 > 其他好文 > 详细

爬虫工具开发进度

时间:2014-06-08 22:07:41      阅读:261      评论:0      收藏:0      [点我收藏+]

标签:c   blog   a   http   com   文件   

最初是想端午节放假3天写一个爬虫,原型版本完成后。。发现自己想要的其实是数据采集工具。

目前进度如下

 

已完成:

1.简易WPF界面,Log显示,开关暂停

2.硬盘结果写入,xml配置文件读写。

3.html分析,用的indexof分析全文。但稳定抓了一星期百度贴吧,中途没崩过。

 

未完成:

1.xml文件图形化编辑,保存,预览。

2.网页搜索结果,可图形化预览。

 

 

最近抓取准备换成HtmlAgility或者Jumony。走这一步问题很多,于是排在后面。

 

 

bubuko.com,布布扣

爬虫工具开发进度,布布扣,bubuko.com

爬虫工具开发进度

标签:c   blog   a   http   com   文件   

原文地址:http://www.cnblogs.com/FEAUOR/p/3775594.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!