码迷,mamicode.com
首页 > Web开发 > 详细

php采集类库:Snoopy.class.php

时间:2014-10-02 13:08:14      阅读:245      评论:0      收藏:0      [点我收藏+]

标签:blog   http   ar   for   strong   文件   数据   art   c   

Snoopy的一些特点:
抓取网页的内容 fetch
抓取网页的文本内容 (去除HTML标签) fetchtext
抓取网页的链接,表单 fetchlinks fetchform
支持代理主机
支持基本的用户名/密码验证
支持设置 user_agent, referer(来路), cookies 和 header content(头文件)
支持浏览器重定向,并能控制重定向深度
能把网页中的链接扩展成高质量的url(默认)
提交数据并且获取返回值
支持跟踪HTML框架
支持重定向的时候传递cookies
要求php4以上就可以了 由于本身是php一个类 无需扩支持 服务器不支持curl时候的最好选择



参考文献:
1、snoopy(强大的PHP采集类) 详细介绍:http://www.9it.me/article-33.html
2、php的Snoopy类:http://www.cnblogs.com/meteoric_cry/archive/2011/05/10/2042512.html

php采集类库:Snoopy.class.php

标签:blog   http   ar   for   strong   文件   数据   art   c   

原文地址:http://my.oschina.net/u/205403/blog/323852

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!