码迷,mamicode.com
首页 > Web开发 > 详细

php中抓取网页内容的代码

时间:2016-10-24 02:36:17      阅读:206      评论:0      收藏:0      [点我收藏+]

标签:href   new   microsoft   表示   get   简单   .sh   timeout   set   

方法一:

使用file_get_contents方法实现

        $url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
        $html = file_get_contents($url);
        //如果出现中文乱码使用下面代码
        //$getcontent = iconv("gb2312", "utf-8",$html);
        echo "<textarea style=‘width:800px;height:600px;‘>".$html."</textarea>";

代码很简单,一看就懂,不解释了。

 

方法二:

使用curl实现

$url = "http://news.sina.com.cn/c/nd/2016-10-23/doc-ifxwztru6951143.shtml";
        
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
$html = curl_exec($ch);
curl_close($ch);

echo "<textarea style=‘width:800px;height:600px;‘>".$html."</textarea>";

 

curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

加上这句代码,表示如果请求被重定向时,可以访问到最终的请求页面,不然请求的结果会显示如下内容:

<head><title>Object moved</title></head>
<body><h1>Object Moved</h1>This object may be found <a HREF="some link.">here</a>.</body>

php中抓取网页内容的代码

标签:href   new   microsoft   表示   get   简单   .sh   timeout   set   

原文地址:http://www.cnblogs.com/modou/p/5991480.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!