requests模块数据解析 数据解析最根本的作用:定位到某个标签,并获取该标签的文本或者属性 解析:根据指定的规则对数据进行提取 作用:实现聚焦爬虫 聚焦爬虫的编码流程: 指定url 发起请求 获取响应数据 数据解析 持久化存储 数据解析的方式: 正则 bs4 xpath 通用原理: 1.标签定位 ...
分类:
其他好文 时间:
2020-06-09 12:49:24
阅读次数:
82
1.监控nginx状态1)现在需要被监控的服务器下的/etc/zabbix目录下创建scripts(建议脚本放到此创建并放置目录)2)vimnginx.sh脚本监控服务进程/端口(第二行是进程/第三行是端口)如果返回值为trun,则为1,如果返回值不对,则为0#!/bin/bash#result=netstat-anpt|grepnginx|grep-vgrepresult=netstat-anp
分类:
其他好文 时间:
2020-06-08 17:30:30
阅读次数:
89
大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子。与上一篇不同的是,这次我们需要用到文件的相关操作。 前言 亲爱的们,教程比较旧了,百度贴吧页面可能改版,可能代码不好使,八成是正则表达式那儿匹配不到了,请更改一下正则,当然最主要的还是帮助大家理解思路。 本篇目标 ...
分类:
编程语言 时间:
2020-06-08 15:06:09
阅读次数:
73
本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTML解析库,所以这里就选用正则表达式来作为解析工具。 1. 本节目标 本节中,我们要提取出猫眼电影TOP100的电影名称、时间、评分、图片等信 ...
分类:
编程语言 时间:
2020-06-08 14:16:46
阅读次数:
62
1.先启动模拟器,并打开某个软件 2.window系统使用gitbash工具,执行命令 adb logcat |grep -i displayed,获取打开的软件的appPackage和appActivity信息 红色框为要获取的信息,/前为appPackage,/后为appActivity 3.启 ...
分类:
移动开发 时间:
2020-06-08 13:09:31
阅读次数:
96
# 总核数 = 物理CPU个数 X 每颗物理CPU的核数 # 总逻辑CPU数 = 物理CPU个数 X 每颗物理CPU的核数 X 超线程数 # 查看物理CPU个数 cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l # 查看每个物理CPU中 ...
分类:
系统相关 时间:
2020-06-08 12:56:59
阅读次数:
91
工欲善其事必先利其器,一个好的开发工具不仅可以减少许多繁琐的步骤,也可以帮助我们进行快速的开发。 在这里我使用这个版本,各个版本大同小异,选择菜单栏File——Settings——Plugins可以按照需要选择插件安装,,每次安装完成注意重新启动IDEA, 一、Grep Console https: ...
分类:
其他好文 时间:
2020-06-08 12:45:11
阅读次数:
75
1:grep可以在档案中搜寻关键词。 2:tail -n100 filePath查看文件最后100行。 3:命令模式下输入:set number 查看文件行号。 4:grep -E "\b[[:alpha:]]+\b" /etc/fstab -o | sort | uniq -c | sort -n ...
分类:
其他好文 时间:
2020-06-08 12:39:07
阅读次数:
277
1、ifconfig确认ip 2、若ssh无法连接,netstat -ntlp|grep 22 查看22端口状态 3、Ubuntu安装默认不安装ssh服务,打开SSH服务,开启22端口,执行以下命令: sudo apt-get install openssh-server sudo apt-get ...
分类:
系统相关 时间:
2020-06-08 12:18:43
阅读次数:
77
高可用概述 # 什么是高可用 一般是指2台机器启动着完全相同的业务系统,当有一台机器down机了,另外一台服务器就能快速的接管,对于访问的用户是无感知的。 # 高可用常用软件 硬件:F5 软件:keepalived # keepalived如何实现高可用 keepalived软件是基于VRRP协议实 ...
分类:
其他好文 时间:
2020-06-07 21:14:13
阅读次数:
59