标签:regex 正则表达式 正则表达 模块 标准库 清单 ctf 手动 阅读
1.1 简介/动机
操作文本或者数据可是件大事。如果不相信,就仔细看看当今的计算机都在做些什么工
作:文字处理、网页表单的填写、来自数据库转储的信息流、股票报价信息、新闻源,而且
这个清单还会不断增长。因为我们可能还不知道需要用计算机编程来处理的文本或数据的具
体内容,所以能将这些文本或者数据以某种可被计算机识别和处理的模式表达出来是非常有
用的。
如果我在运营一个电子邮件存档公司,而作为我的一位客户,你希望查看你自己在去年
2 月份发送和接收的所有电子邮件。如果我能够设计一个计算机程序来收集这些信息,然后
转发给你,而不是人工阅读你的邮件然后手动处理你的请求,无疑要好很多。因为如果有人
看了你的邮件,哪怕只是用眼睛瞄了一下邮件的时间戳,你可能都会对此感到担心(甚至愤
怒)。又比如,你可能会认为凡是带有“ILOVEYOU”这样主题的邮件都是已感染病毒的邮
件,并要求从你的个人邮箱中删除它们。这就引出了一个问题,即我们如何通过编程使计算
机具有在文本中检索某种模式的能力。
正则表达式为高级的文本模式匹配、抽取、与/或文本形式的搜索和替换功能提供了基础。
简单地说,正则表达式(简称为 regex)是一些由字符和特殊符号组成的字符串,它们描述了
模式的重复或者表述多个字符,于是正则表达式能按照某种模式匹配一系列有相似特征的字
符串(见图 1-1)。换句话说,它们能够匹配多个字符串……一种只能匹配一个字符串的正则
表达式模式是很乏味并且毫无作用的,不是吗?
Python 通过标准库中的 re 模块来支持正则表达式。本节将做一个简短扼要的介绍。限于
篇幅,内容将仅涉及 Python 编程中正则表达式方面的最常见内容。当然,读者对于正则表达
式方面的经验(熟悉程度)肯定不同,我们强烈建议阅读一些官方帮助文档和与此主题相关
的文档。你将再次会对字符串的理解方式有所改变!
下载地址: https://u18103887.ctfile.com/fs/18103887-303384201
标签:regex 正则表达式 正则表达 模块 标准库 清单 ctf 手动 阅读
原文地址:https://www.cnblogs.com/wuyb123/p/10290203.html