正则表达式实际上爬虫一共就四个主要步骤:明确目标(要知道你准备在哪个范围或者网站去搜索)爬(将所有的网站的内容全部爬下来)取(去掉对我们没用处的数据)处理数据(按照我们想要的方式存储和使用)正则表达式,又称规则表达式,通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式匹配规则re模块一般使用步骤使用compile()函数将正则表达式的字符串形式编译为一个Pattern对象注意:re对特
分类:
编程语言 时间:
2020-04-13 23:12:52
阅读次数:
83
wireshark抓包新手使用教程 Wireshark是非常流行的网络封包分析软件,可以截取各种网络数据包,并显示数据包详细信息。常用于开发测试过程各种问题定位。本文主要内容包括: 1、Wireshark软件下载和安装以及Wireshark主界面介绍。 2、WireShark简单抓包示例。通过该例子 ...
分类:
其他好文 时间:
2020-04-08 13:43:19
阅读次数:
114
网络嗅探与协议分析 1. 每个人找一个抓包软件,分析其功能,设计的模块等,着重使用和分析,不建议用wireshark,编译过程可能比较难,也可挑战 (1)首先我们要清楚抓包的原理。 网络数据包捕获的原理:以太网(Ethernet)具有共享介质的特征,信息是以明文的形式在网络上传输,当网络适配器设置为 ...
分类:
其他好文 时间:
2020-03-29 16:40:35
阅读次数:
104
Mac系统: 显示进程状态,CPU使用率,内存使用情况 显示网络连接,路由表,接口状态等 查看网络配置 截获分析网络数据包 列出当前系统打开的文件列表,别忘记一切皆文件,包括网络连接、硬件等 iOS开发: It will output the Objective C class structures ...
分类:
移动开发 时间:
2020-03-25 19:27:10
阅读次数:
90
https://mp.weixin.qq.com/s/boRWlx1R7TX0NLuI2sZBfQ 作为业务 SRE,我们所运维的业务,常常以 Linux+TCP/UDP daemon 的形式对外提供服务。SRE 需要对服务器数据包的接收和发送路径有全面的了解,以方便在服务异常时能快速定位问题。以 ...
分类:
系统相关 时间:
2020-03-22 19:59:41
阅读次数:
78
第6章 TCP协议 6.1TCP协议 网络模型 | IOS七层网络模型 | 五层网络模型 | TCP/IP分层模型 | | | | | | 应用层 | | | | 表示层 | | | | 会话层 | 应用层 | 应用层 | | 传输层 | 传输层 | 传输层 | | 网络层 | 网络层 | 网络层 ...
分类:
其他好文 时间:
2020-03-16 13:17:23
阅读次数:
51
汽车是我们生活中不可缺少的代步工具,搭载先进的ECU控制单元、高精传感器、高性能的执行器,并融合现代4G/5G通讯与定位网络技术的智能网联汽车已经走向了我们的生活之中。通过TBOX终端实现了车与车、车与互联网、车与智能交通、车与智慧小区、景区之间的信息传输,实现了车载网络的多融合生态。
分类:
其他好文 时间:
2020-03-11 00:56:54
阅读次数:
73
反向代理 反向代理(Reverse Proxy)方式是指以代理来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个反向代理服务器。 理解正向代理: 正向代理是针对你的客户端,而反向代理 ...
分类:
其他好文 时间:
2020-03-10 14:05:36
阅读次数:
45
豆瓣这个网站做网络爬虫的例子教学是极好的,我这个入门者今天也来分享下自己的第一个爬虫例程~ (●'?'●) 爬虫的过程由数据获取+数据解析来组成: 数据获取—— 1 选择数据获取工具 想要爬取有用的数据,首先要获得数据 抓取数据主要有以下几种方式: 1)urllib内建模块,尤其是urllib.re ...
分类:
编程语言 时间:
2020-03-07 00:08:27
阅读次数:
127
OSI7层模型的小结 : 在7层模型中,每一层都提供一个特殊的网络功能。从网络功能的角度看:下面4层(物理层、数据链路层、网络层和传输层)主要提供数据传输和交换功能,即以节点到节点之间的通信为主;第4层作为上下两部分的桥梁,是整个网络体系结构中最关键的部分;而上3层(会话层、表示层和应用层)则以提供 ...
分类:
其他好文 时间:
2020-03-06 11:10:37
阅读次数:
129