码迷,mamicode.com
首页 > 其他好文 > 详细

Get_domains(调用ICP及mail反查接口获取资产)

时间:2019-04-20 16:55:46      阅读:327      评论:0      收藏:0      [点我收藏+]

标签:range   findall   目的   获取   mode   whois   jquer   orm   windows   

写了个小工具,目的是尽可能多的获取资产,这个工具调用的是站长工具的ICP备案查询和邮箱反查功能。

环境:Python3

get_domains.py:

import requests
import re


host = ‘‘
mail = ‘‘

headers = {
    ‘Cookie‘:‘‘,
    ‘User-Agent‘:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36‘
}

def getdomain_icp(host):
    url = ‘https://icp.chinaz.com/ajaxsync.aspx?at=beiansl&callback=jQuery111308504784465392665_1555747182932&host={}&type=host&_=1555747182933‘.format(host)
    req = requests.get(url)
    domains = re.findall(‘MainPage:"(.*?)",‘,req.text,re.S)
    for domain in domains:
        with open(‘domains.txt‘,‘a+‘) as f:
            f.write(domain + "\n")



def getdomain_mail(mail):
    url = ‘http://whois.chinaz.com/reverse?host={}&ddlSearchMode=1&page=1‘.format(mail)
    req = requests.get(url)
    page = re.findall(‘<span class="col-gray02">共(.*?)页‘,req.text)[0] #获取页数
    page = int(page) + 1
    for i in range(1,page):
        real_req = requests.get(‘http://whois.chinaz.com/reverse?host={}&ddlSearchMode=1&page={}‘.format(mail,i),headers=headers)
        domains = re.findall(‘<div class="w13-0 domain"><div class="listOther"><a href="/(.*?)"‘,real_req.text)
        for domain in domains:
            with open(‘domains.txt‘,‘a+‘) as f:
                f.write(domain + "\n")

def main(host,mail=‘‘):
    getdomain_icp(host)
    if mail!=‘‘:
        getdomain_mail(mail)

if __name__ ==‘__main__‘:
    main(host=host,mail=mail)

 

使用时只需要修改host以及mail,host为类似jd.com/tencent.com这种域名,即根域名,另headers中的cookie字段需要自己登录站长工具后在headers中获取,否则mail反查不到所有信息,mail默认为空,可以只使用icp备案查询,即只修改host。

 

未进行去重处理,可以用我上一个工具在获取banner时去重,结果会存在当前目录下的domains.txt中。

 

脚本使用的为单线程,因为怕被封IP。

 

Get_domains(调用ICP及mail反查接口获取资产)

标签:range   findall   目的   获取   mode   whois   jquer   orm   windows   

原文地址:https://www.cnblogs.com/P1g3/p/10741516.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!