码迷,mamicode.com
首页 > 其他好文 > 详细

搜狗搜索公众号内容提取

时间:2015-01-06 15:56:24      阅读:270      评论:0      收藏:0      [点我收藏+]

标签:

搜狗搜索公众号内的文章,默认是特殊的json格式,无法用于wp_autopost采集,提取了一下。

<?php 
$url = "http://weixin.sogou.com/gzhjs?cb=sogou.weixin.gzhcb&openid=oIWsFtzSR_4RbC1QpdwrVLTEkxJk&page=1&t=1420517379862"; 
$ch = curl_init(); 
curl_setopt ($ch, CURLOPT_URL, $url); 
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); 
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT,100);

$dxycontent = curl_exec($ch); 
//echo $dxycontent; 

$str = $dxycontent;
$kw = "php";

preg_match_all(‘/http:\/\/([.a-zA-Z0-9_&=?\/]*)#rd/‘,$str,$mat);
//var_export($mat);
//die();
?>
<html>
<head>太虚讲堂微信</head>
	<body>
<?php

for($i=0;$i<count($mat[0]);$i++){
	echo ‘<a href="‘.$mat[0][$i].‘">weixin{$i}</a><br />‘;
}
	//    echo $str;
?> 	
	</body>
</html>


搜狗搜索公众号内容提取

标签:

原文地址:http://my.oschina.net/jianhui1980/blog/364271

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!