首页 > 其他好文 > 详细

正则表达式的基本语法

时间：2020-01-22 10:41:11 阅读：52 评论：0 收藏：0 [点我收藏+]

标签：src 表示 image mic 关系 html img 结束 lsp

下面有我整理的关于正则表达式的基本语法；
具体案例网络爬虫

一．正则表示式语法

1.1普通字符

字母、数字、汉字、下划线、以及没有特殊定义的标点符号都是“普通字符”。

1.2转义字符

与java中的转义字符一致

1.3标准字符集

\d	\d 任意一个数字，0~9 中的任意一个
\w	任意一个字母或数字或下划线，也就是 A~Z,a~z,0~9,_ 中任意一个
\s	包括空格、制表符、换行符等空白字符的其中任意一个
.	小数点可以匹配任意一个字符(除了换行符) 如果要匹配包括“\n”在内的所有字符，一般用[\s\S]

1.3自定义字符集

正则表达式的特殊符号，被包含到中括号中，则失去特殊意义，除了 ^,-之外。

如：[\d.\-+]将匹配：数字、小数点、+、-

	[ab5@]	匹配 "a" 或 "b" 或 "5" 或 "@"
^	[^ abc]	匹配 "a","b","c" 之外的任意一个字符
-	[f-k]	匹配 "f"~"k" 之间的任意一个字母
	[^A-F0-3]	匹配 "A"~"F","0"~"3" 之外的任意一个字符

1.4量词

a\d?b 将匹配ab之间出现0-1字符
a\d+b 将匹配ab之间最少出现1字符
a\d*b 将匹配ab之间最少出现0字符

{n}	表达式重复n次
{m,n}	表达式至少重复m次，最多重复n次
{m,}	表达式至少重复m次
?	匹配表达式0次或者1次，相当于 {0,1}
+	表达式至少出现1次，相当于 {1,}
*	表达式不出现或出现任意次，相当于 {0,}

1.5字符边界

匹配的不是字符而是位置

^	与字符串开始的地方匹配
$	与字符串结束的地方匹配
\b	匹配一个单词边界

1.6选择符与分组

\|	左右两边表达式之间 "或" 关系
([a-z]{2,})\1	分组已捕获的字符串

([a-z]{2,})\1

技术图片

1.7零式断言

(?=exp)

断言自身出现的位置的后面能匹配表达式exp

[a-z]+(?=\d)

技术图片

一．实例

2.1电话号码验证

(1)电话号码由数字和"-"构成 –
(2)电话号码为7到8位 –
(3)如果电话号码中包含有区号，那么区号为三位或四位, 首位是0. –
(4)区号用"-"和其他部分隔开

结果：0\d{2,3}-\d{6,8}

2.2手机验证

(1)移动电话号码为11位 –
(2)11位移动电话号码的第一位和第二位为"13“，”15”，”18”

结果：1[358]\d{3,9}\b

正则表达式的基本语法

标签：src 表示 image mic 关系 html img 结束 lsp

原文地址：https://www.cnblogs.com/hzcjd/p/12227970.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！