码迷,mamicode.com
首页 > 其他好文 > 详细

常用模块 re 模块

时间:2017-08-07 20:48:00      阅读:142      评论:0      收藏:0      [点我收藏+]

标签:height   python   enter   手机号码   start   and   之间   git   idt   

模块是什么?

  一个模块就是一个包含了 python 定义和声明的文件,文件名就是模块名字加上.py 的后缀。

  但其实 import 加载的模块分为四个通用类别:

 

    1:使用 python 编写的代码(.py文件)

    2:已被编译为共享库或 DLL 的 C 或 C++扩展

    3:包好一组模块的包

    4:使用 C 编程并链接到 python 解释器的内置模块

 

为何用?

  我们可以想一下,如果你退出 python 解释器然后重新进入,那么你之前定义的函数或者变量都将丢失,因为我们通常将程序写到文件中以便永久保存下来,需要时就通过 python test.py 方式去执行,还可以把他们当做模块来导入到其他的模块中,实现了功能的重复利用。

 

  re 模块

假如现在需要用 python 代码来实现类似:

phone_number = input(‘plz enter your phonenumber :‘)

根据手机号码一共11位并且是只以13,15,17,18开头的数字这些特点,我们用 python 写了如下代码:


while 1 :
phone_number = input(‘plz enter your phonenumber:‘)
if len(phone_number) == 11 \
and phone_number.isdigit() \
and (phone_number.startswith(‘13‘)\
or phone_number.startswith(‘15‘)\
or phone_number.startswith(‘17‘)\
or phone_number.startswith(‘18‘)):
print(‘合法‘)
else :
print(‘不合法‘)


下面是老师的写法 ,也就是我们需要学习的写法:
import re
phone_number = input(‘plz enter your phonenumber :‘)
if re.match(‘^(13|15|17|18)[0-9]{9}$‘,phone_number):
print(‘hefa‘)
else :
print(‘buhefa‘)

^匹配字符串的开始
| 或
[0-9]代表0-9之间的数字
{9}代表重复9次
$代表字符串的结束

re.match :和search基本一致,不过只在字符串开始处进行匹配。


正则表达式:

正则表达式本身和 python 就没什么关系,就是 匹配字符串内容的一种规则
官方定义: 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、
  以及这些特定字符的组合,组成一个‘规则字符串’,这个‘规则字符串’用来表达对字符串的一种过滤逻辑。


只要说到正则, 它就只和 字符串 相关。
在线测试工具 http://tool.chinaz.com/regex/
在这个工具中,你输入的每一个字都是一个字符串。
  我们更多要考虑的是在 !!!同一个位置上!!! 可以出现的字符的范围。

待匹配字符
匹配
结果
说明
[0123456789]
8
True
在一个字符组里枚举合法的所有字符,字符组里的任意一个字符
和"待匹配字符"相同都视为可以匹配
[0123456789]
a
False
由于字符组中没有"a"字符,所以不能匹配
 
[0-9]
 
7
True
也可以用-表示范围,[0-9]就和[0123456789]是一个意思
 
[a-z]
 
s
 
True
 
同样的如果要匹配所有的小写字母,直接用[a-z]就可以表示
 
[A-Z]
 
B
 
True
 
[A-Z]就表示所有的大写字母
 
[0-9][a-f][A-F]
 
e
 
True
 
可以匹配数字,大小写形式的a~f,用来验证十六进制字

 
元字符
 
匹配内容
匹配除换行符以外的任意字符
\w 匹配字母或数字或下划线或汉字
\s 匹配任意的空白符
\d 匹配数字
\n 匹配一个换行符
\t 匹配一个制表符
\b 匹配一个单词的结尾
^ 匹配字符串的开始
$ 匹配字符串的结
\W
匹配非字母或数字或下划线或汉字
\D
匹配非空白符
\S
匹配非数字
a|b
匹配字符a或字符b
()
匹配括号内的表达式,也表示一个组
[...]
匹配字符组中的字符
[^...]
匹配除了字符组中字符的所有字符










常用模块 re 模块

标签:height   python   enter   手机号码   start   and   之间   git   idt   

原文地址:http://www.cnblogs.com/ugfly/p/7300759.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!