第一个 regex 中是带有2个括号的,我们可以看到其输出是一个list 中包含2个 tuple 第二个 regex 中带有1个括号,其输出的内容就是括号匹配到的内容,而不是整个表达式所匹配到的结果。 第三个 regex 中不带有括号,其输出的内容就是整个表达式所匹配到的内容。 结论:findall ...
分类:
编程语言 时间:
2019-02-10 10:49:41
阅读次数:
576
本片博文主要记录Python中正则表达式re模块和中文分词模块jieba ...
分类:
其他好文 时间:
2019-02-09 17:58:35
阅读次数:
161
python贪婪和非贪婪 正则表达式通常用于在文本中查找匹配的字符串。Python里数量词默认是贪婪的(在少数语言里也可能是默认非贪婪),总是尝试匹配尽可能多的字符;非贪婪则相反,总是尝试匹配尽可能少的字符。在"*","?","+","{m,n}"后面加上?,使贪婪变成非贪婪。 >>> s="Thi ...
分类:
编程语言 时间:
2019-02-06 21:16:53
阅读次数:
232
re模块的方法总结 一,查找 1:match 示例: 2:findall 示例: 3:search 示例: 4:finditer 示例: 二,字符串处理的扩展 :split切割;sub/subn替换 1:split切割 2:sub:替换,谁 旧的 新的 替换次数 3:subn:返回一个元组,第二个元 ...
分类:
其他好文 时间:
2019-02-05 15:41:48
阅读次数:
190
[TOC] Python 模块(二) re re模块提供了正则表达式的相关操作 主要字符介绍: 通配符,除了换行符之外的任意字符 匹配字符串的开始 匹配字符串的结尾 关于次数的: 按紧挨着的字符重复无数次, 重复零次或更多次 1到无穷次, 重复一次或更多次 (0,1) 重复零次或一次 重复n次 重复 ...
分类:
编程语言 时间:
2019-02-04 18:04:45
阅读次数:
186
这里是一点小心得:由于下面两个原因,在正则表达式中使用反斜杠就会产生了一个双重转换的问题。 (1)、python自身处理字符串时,反斜杠是用于转义字符 (2)、正则表达式也使用反斜杠来转义字符 要匹配字符串中1个反斜杠应该怎么写正则表达式?"\\",这样行吗?试试就知道了,re模块抛异常了,因为在正 ...
分类:
编程语言 时间:
2019-01-31 13:29:54
阅读次数:
212
目录 2.1.1 正则表达式 2.1.1.1 简单的范围的字符组 2.1.1.2 字符 2.1.1.3 量词 2.1.1.4 字符集 2.1.1.5 分组 2.1.1.6 转义字符 2.1.1.7 flags 2.1.2 方法 2.1.2.1 .findall() 2.1.2.2 .finditer ...
分类:
其他好文 时间:
2019-01-30 18:30:16
阅读次数:
165
正则表达式元字符: 字符匹配 : 次数匹配: 位置锚定: 分组及引用: 或: 转义字符: ...
分类:
编程语言 时间:
2019-01-30 00:23:22
阅读次数:
200