码迷,mamicode.com
首页 > Web开发 > 详细

百度知道有关php抓取问题

时间:2015-03-01 18:21:37      阅读:122      评论:0      收藏:0      [点我收藏+]

标签:

<?php 
/** 
desc:采集网页中的邮箱的代码 
link:http://pc100.net 
date:2013/2/24 
*/ 
$url=‘http://pc100.net‘; //要采集的网址 
$content=file_get_contents($url); 
//echo $content; 
function getEmail($str) { 
//$pattern = "/([a-z0-9]*[-_\.]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[\.][a-z]{2,3}([\.][a-z]{2})?/i"; 
$pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/"; 
preg_match_all($pattern,$str,$emailArr); 

return $emailArr[0]; 

print_r( getEmail($content)); 
?>

 

http://zhidao.baidu.com/question/919359236196363019.html

百度知道有关php抓取问题

标签:

原文地址:http://www.cnblogs.com/python001/p/4307368.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!