码迷,mamicode.com
首页 >  
搜索关键字:网页抓取    ( 184个结果
nutch2.1抓取中文网站
对nutch添加中文网站抓取功能。1、中文网页抓取 A、调整mysql配置,避免存入mysql的中文出现乱码。修改 ${APACHE_NUTCH_HOME} /runtime/local/conf/gora.properties ################################ .....
分类:Web程序   时间:2014-05-19 17:44:52    阅读次数:326
【网页抓取】判断URL是否有效并可提供下载
问题的产生: 今天在提供API接口给客户的时候,客户提出了一个要求,有一个接口返回的语音文件的URL地址需要做有效性验证,这里所指的有效是指请求这个URL后能直接下载语音文件,反之则视为无效。 先来看看两个请求语音文件的URL地址: 有效的:http://xxx.xxx.xxx.xxx:60...
分类:Web程序   时间:2014-05-08 06:19:12    阅读次数:463
一个极其简洁的Python网页抓取程序
一个极其简洁的Python网页抓取程序...
分类:编程语言   时间:2014-05-03 23:48:29    阅读次数:459
【转载】HTTP/FTP客户端开发库:libwww、libcurl、libfetch
网页抓取和ftp访问是目前很常见的一个应用需要,无论是搜索引擎的爬虫,分析程序,资源获取程序,WebService等等都是需 要的,自己开发抓取库当然是最好了,不过开发需要时间和周期,使用现有的Open source程序是个更好的选择,一来别人已经写的很好了,就近考验,二来自己使用起来非常快速,三来...
分类:其他好文   时间:2014-04-29 16:45:47    阅读次数:749
184条   上一页 1 ... 17 18 19
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!