码迷,mamicode.com
首页 > 其他好文 > 详细

一个很粗糙的XXXX

时间:2015-06-24 16:01:03      阅读:117      评论:0      收藏:0      [点我收藏+]

标签:

 

改dnsrecon的代码改来改去都获取不到想要的结果,也不知道是不是py中的正则和PHP的有神马不一样的地方,但是用RegexBuddy测的时候是正确的,想不通啊想不通。果断不改了,自己动手PHP写了一个很粗糙的XX,用的X度来获取子域名,也没再改进了,能用就OK了,话说PHP真慢~~

 

<?php
$curl=curl_init();

$page=0;
$output="";

while($page<101)  //这里获取前十页结果,爬的企鹅的子域名
{
	$query="/s?wd=site%3A(qq.com)&pn=".$page."&oq=site%3A(qq.com)&tn=baiduadv&ie=utf-8&";
	$query=$query."rsv_pq=8b9b2ba40000b588&rsv_t=57ebHv8aFiGUGXVP%2ByZ4ek82WFVf1u0C6Vqhy9Pcs9fvkB7pkuKeDI7JllsBPK8&rsv_page=1";
	$page+=10;  //默认每页10条结果,所以翻页加10
	$url="http://www.baidu.com".$query;
	curl_setopt($curl, CURLOPT_URL, $url);
	curl_setopt($curl,CURLOPT_RETURNTRANSFER,true);
	$output.=curl_exec($curl);
}
$regexp="/<span class=\"g\">[a-z.0-9]*\.qq\.com\/ <\/span>/i";
$result=array();
preg_match_all($regexp, $output, $result,PREG_PATTERN_ORDER);
print_r($result);

 

一个很粗糙的XXXX

标签:

原文地址:http://www.cnblogs.com/debugzer0/p/4597764.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!