标签:
改dnsrecon的代码改来改去都获取不到想要的结果,也不知道是不是py中的正则和PHP的有神马不一样的地方,但是用RegexBuddy测的时候是正确的,想不通啊想不通。果断不改了,自己动手PHP写了一个很粗糙的XX,用的X度来获取子域名,也没再改进了,能用就OK了,话说PHP真慢~~
<?php $curl=curl_init(); $page=0; $output=""; while($page<101) //这里获取前十页结果,爬的企鹅的子域名 { $query="/s?wd=site%3A(qq.com)&pn=".$page."&oq=site%3A(qq.com)&tn=baiduadv&ie=utf-8&"; $query=$query."rsv_pq=8b9b2ba40000b588&rsv_t=57ebHv8aFiGUGXVP%2ByZ4ek82WFVf1u0C6Vqhy9Pcs9fvkB7pkuKeDI7JllsBPK8&rsv_page=1"; $page+=10; //默认每页10条结果,所以翻页加10 $url="http://www.baidu.com".$query; curl_setopt($curl, CURLOPT_URL, $url); curl_setopt($curl,CURLOPT_RETURNTRANSFER,true); $output.=curl_exec($curl); } $regexp="/<span class=\"g\">[a-z.0-9]*\.qq\.com\/ <\/span>/i"; $result=array(); preg_match_all($regexp, $output, $result,PREG_PATTERN_ORDER); print_r($result);
标签:
原文地址:http://www.cnblogs.com/debugzer0/p/4597764.html