码迷,mamicode.com
首页 > 编程语言 > 详细

利用Python进行SEPM virus definition自动下载:(一)环境准备及页面分析

时间:2020-04-29 10:54:14      阅读:96      评论:0      收藏:0      [点我收藏+]

标签:pre   解释   信息   文件   file   def   tab   release   python   

本文地址:https://blog.51cto.com/3chou/2491345

1、背景说明:

? 专线环境中有一套“Symantec Enpoint Protection Manager”(简称SEPM)软件,由于不能访问因特网,所以杀毒软件定义包文件等,需要每日手动下载后,拷贝到SEPM所在的服务器上。
?借助于Python写一个程序,每天定时的去下载这些定义包,等到上班后直接进行拷贝。


2、 环境准备:

?本程序需要借助于Python程序和一些软件包。


2.1 Python软件及IDE安装

?Python及IDE的安装网上有很多,可以自行搜索,


2.2 Python库安装:

?本程序需要另外安装以下两个库:

名称 PyPI链接 说明
requests requests主页 URL访问,文件下载
tqdm tqdm主页 模拟下载进度条显示

?安装过程:
①、查看已安装 Package:

# pip list

技术图片

②、安装 Package:

# pip install PackageName

技术图片

2.3 IDE环境配置

Pycharm设置

?打开PyCharm的环境设置(Configure>Settings),然后选择“Project Interpreter”,再右侧的“Project Interpreter”中选择我们的Python环境,如果你只有一个默认环境,这个直接设置即可。

技术图片

?选择了环境后,下方会加载出,此环境中已经安装的软件包

技术图片

Visual Studio Code设置

?需要先新建一个工作空间,然后通过快捷键“Ctrl + Shift + P”打开“命令选项板”,在其中输入“python:select interpreter”,然后启动“Python:选择解释器”,在已识别到的环境中,选择我们需要的环境即可。

技术图片

技术图片

?设置好解释器后,会在工作区目录下生成一个settings.json文件,里面保存着Python环境相关信息。

技术图片

?新建一个Python文件,命名为“SEPDefineDown.py”,在右面的编辑区就可以编辑代码了。

技术图片

3 编程前的网页分析

?Symantec被博通收购过后,网页显示的布局没有多大的变化。
定义包的下载链接为:

SEPM12:https://www.broadcom.com/support/security-center/definitions/download/detail?gid=sep
SEPM14:https://www.broadcom.com/support/security-center/definitions/download/detail?gid=sep14

3.1 页面显示布局分析

?我们以SEPM14的页面为例进行分析,以获取Windows 64-Bit平台的定义包信息。
?首先,页面布局为:
技术图片
?根据需求,找出我们需要的内容为:
?我们需要获取到SEPM14定义包有关的信息,包括:文件名称、文件下载URL、文件的大小、文件的MD5值
技术图片

3.2 借助开发者工具分析

?我们在网页中右击,点击“查看页面源代码”:
?网页的源代码内容很少,没有我们需要的信息。
技术图片
?打开浏览器的开发者模式(F12),然后按“F5”进行页面内容的刷新,。
?依次通过“网络>XHR”监测页面的XHR请求。这里发现页面加载了4个JSON文件,其中第四个JSON文件中包含我们需要的文件URL等信息。
技术图片

3.3 JSON文件分析

JSON文件URL1:https://www.broadcom.com/pubdate/pubdate.json
JSON文件URL2:https://www.broadcom.com/api/navigation?locale=avg_en
JSON文件URL3:https://www.broadcom.com/api/v2/getmetadata?vanityurl=support/security-center/definitions/download/detail&locale=avg_en&lastpubdate=2020-04-28-11:15:29
JSON文件URL4:https://www.broadcom.com/api/getjsonbyurl?vanityurl=support/security-center/definitions/download/detail&locale=avg_en&updateddate=2020-04-28-10:22:44&gid=sep14

?我们需要的内容在第四个JSON文件中,但是第四个JSON文件的URL中包含“updateddate”参数。
?“locale”字段位于第二个JSON文件中,但是这个不是变化的,所以我们可以不用管。
?“vanityurl”字段位于第三个JSON文件中,但是这个不是变化的,我们也可以不管。为了程序的健壮性,编程的时候,可以把这两个参数的值也用程序处理JSON内容获取
?我们对其他三个JSON文件的URL及文件的内容进行分析,可以发现“JSON文件URL4”中的“updateddate”字段内容位于“JSON文件3”的内容中,“JSON文件URL3”中的“lastpubdate”字段内容位于“JSON文件1”的内容中。

?我们对第1、3、4个JSON的文件内容先进行分析。
第1个JSON文件包含“lastpubdate”内容,结构如下:

{
        "content_id":"12345678910",
        "content_type":"Page",
        "lastpubdate":"2020-04-28-11:15:29",
        "lastnavdate":"2020-04-28-06:10:51"
}

技术图片

第3个JSON文件的结构:

{
        ……,
        "updateddate":"2020-04-28-10:22:44",
        ……
}

技术图片

?第4个JSON文件的结构:

{
        "groups":
            {
                "packages":
                        {……}
                        ……
                        {
                                    "id":"jdb_core3sds_package",
                                    ……
                                    "file":
                                            {"name":"jdb/core3sds/vd593617core3sds.jdb",
                                                "_url_":"https://definitions.symantec.com/defs/jdb/core3sds/vd593617core3sds.jdb",
                                                "ftp_url_":"http://definitions.symantec.com/defs/jdb/core3sds/vd593617core3sds.jdb",
                                                "created_date":"4/28/2020",
                                                "release_date":"4/28/2020",
                                                "size":"54.21 MB",
                                                "md5":"6654672CC5BAC2AD0ED9E383FFFC0F81",
                                                "md5_url_":"security-response/glossary",
                                                "md5_all_url":"https://www.broadcom.com/avcenter/download/md5-hash.txt"
                                            }
                            }
            }

技术图片

?后面可以通过编程对JSON文件进行处理(Python有个内置的JSON文件处理库),得到我们需要的URL等信息,之后再进行下载等操作。

利用Python进行SEPM virus definition自动下载:(二)代码实现
https://blog.51cto.com/3chou/2491348

利用Python进行SEPM virus definition自动下载:(一)环境准备及页面分析

标签:pre   解释   信息   文件   file   def   tab   release   python   

原文地址:https://blog.51cto.com/3chou/2491345

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!