码迷,mamicode.com
首页 > Web开发 > 详细

php利用curl获取网页title内容

时间:2017-05-09 11:21:44      阅读:217      评论:0      收藏:0      [点我收藏+]

标签:==   句柄   执行   headers   .com   title   ini   文字   output   

<?php
$url = ‘http://www.k7wan.com‘;
echo getTitle_web_curl($url);
function getTitle_web_curl($url){
	$title = ‘‘;
	$ch = curl_init();
//设置选项,包括URL
	curl_setopt($ch, CURLOPT_URL, $url);
	curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
	curl_setopt($ch, CURLOPT_HEADER, 0);
//执行并获取HTML文档内容
	$output = curl_exec($ch);
//释放curl句柄
	curl_close($ch);
// 解析 HTML 的 <head> 区段
	preg_match("/<head.*>(.*)<\/head>/smUi",$output, $htmlHeaders);
	if(!count($htmlHeaders)){
		$title = "无法解析数据中的 <head> 区段";
	}

// 取得 <head> 中 meta 设置的编码格式<meta charset="gb2312">
	if(preg_match(‘/charset="(.*)"/‘,$htmlHeaders[1], $results)){
		$charset =  $results[1];
	}else{
		$charset = "None";
	}

// 取得 <title> 中的文字
	if(preg_match("/<title>(.*)<\/title>/Ui",$htmlHeaders[1], $htmlTitles)){
		if(!count($htmlTitles)){
			$title = "无法解析 <title> 的内容";
			exit;
		}

		// 将  <title> 的文字编码格式转成 UTF-8
		if($charset == "None"){
			$title=$htmlTitles[1];
		}else{
			$title=iconv($charset, "UTF-8", $htmlTitles[1]);
		}
	}
	return $title;
}

  

php利用curl获取网页title内容

标签:==   句柄   执行   headers   .com   title   ini   文字   output   

原文地址:http://www.cnblogs.com/as3lib/p/6829208.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!