大家好,上次我们实验了爬取了糗事百科的段子,那么这次我们来尝试一下爬取百度贴吧的帖子。与上一篇不同的是,这次我们需要用到文件的相关操作。 前言 亲爱的们,教程比较旧了,百度贴吧页面可能改版,可能代码不好使,八成是正则表达式那儿匹配不到了,请更改一下正则,当然最主要的还是帮助大家理解思路。 本篇目标 ...
分类:
编程语言 时间:
2020-06-08 15:06:09
阅读次数:
73
本节中,我们利用requests库和正则表达式来抓取猫眼电影TOP100的相关内容。requests比urllib使用更加方便,而且目前我们还没有系统学习HTML解析库,所以这里就选用正则表达式来作为解析工具。 1. 本节目标 本节中,我们要提取出猫眼电影TOP100的电影名称、时间、评分、图片等信 ...
分类:
编程语言 时间:
2020-06-08 14:16:46
阅读次数:
62
0X01首先我们来了解下这个漏洞的关键函数 preg_replaceCTF的老函数了 preg_replace() 的第一个参数如果存在 /e 模式修饰符,则允许代码执行。 如果没有 /e 修饰符,可以尝试 %00 截断。 正则表达式修正符: 因为$pattern中指定的是要搜索的模式字符串,一般使 ...
分类:
Web程序 时间:
2020-06-07 17:56:40
阅读次数:
81
正则表达式 正则规则 第一条规则: 本身是哪一个字符,就匹配字符串中的哪一个字符 第二条规则:使用字符组,一个字符组就代表匹配一个字符,只要这个字符出现在字符组里,那么就说明这个字符能匹配上 字符组 [ ] 格式:[字符1字符2] 可以指定范围 所有的范围都必须遵循ascii码从小到大来指定 [0- ...
分类:
其他好文 时间:
2020-06-06 18:17:18
阅读次数:
59
grep:用于查找文件行中符合条件的字符串 grep [options] PATTERN [FILE...] -i:忽略大小写 --color:把匹配到的字符串用高亮颜色显示出来 -v: 显示没有被模式匹配到的行 -o:只显示被模式匹配到的字符串 -E(或者直接使用egrep): 使用扩展正则表达式 ...
分类:
系统相关 时间:
2020-06-06 12:35:37
阅读次数:
75
@ 正则表达式是一个强大的字符串处理工具 ,可以对字符串进行查找、提取、分割、替换等操作 。 String类里也提供了如下几个特殊的方法 : boolean matches(String regex): 判断该宇符串是否匹配指定的正则表达式 。 String replaceAll(String re ...
分类:
编程语言 时间:
2020-06-06 01:00:50
阅读次数:
59
文章目录 偷学Python第三十一天:Python正则表达式的语法以及re模块的使用正则表达式的语法什么是正则表达式字符类元字符正则中的重复分支条件贪婪和懒惰分组零宽断言零宽度正预测先行断言零宽度正回顾后发断言负向零宽断言零宽度负预测先行断言零宽度负回顾后发断言re模块正则表达式的装饰符查找单个匹配 ...
分类:
编程语言 时间:
2020-06-05 22:41:42
阅读次数:
66
今天分享一个Python正则表达式匹配日期与时间的方法,因为最近在做的项目需要从字符串里面把日期时间提取出来。 ...
分类:
编程语言 时间:
2020-06-05 09:12:09
阅读次数:
116
shell脚本-sed Linux处理文本文件的工具: grep 过滤文件内容 sed 编辑文件内容 awk 正则表达式Regex 正则表达式Regex 匹配单个字符的元字符 . [abc] [a-z] [A-Z] [0-9] [a-zA-Z0-9] [^a-z] [[:alpha:]] [[:up ...
分类:
系统相关 时间:
2020-06-05 00:50:35
阅读次数:
293