标签:code rip 定义 个数 元素 提取子串 返回 语言 子串
RegExp正则表达式
正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。
(1) \d
可以匹配一个数字
(2) \w
可以匹配一个字母或数字,
(3) .
可以匹配任意字符
(4)\s
可以匹配一个空格(也包括Tab等空白符)
(5)用*
表示任意个字符(包括0个),用+
表示至少一个字符,用?
表示0个或1个字符,用{n}
表示n个字符,用{n,m}
表示n-m个字符
(6)特殊字符,在正则表达式中,要用‘\‘
转义
(7)要做更精确地匹配,可以用[]
表示范围
(8)A|B
可以匹配A或B
(9)^
表示行的开头,^\d
表示必须以数字开头。$
表示行的结束,\d$
表示必须以数字结束。
作用:
1. RegExp对象的test()
方法用于测试给定的字符串是否符合条件。
var re = /^\d{3}\-\d{3,8}$/; re.test(‘010-12345‘); // true re.test(‘010-1234x‘); // false re.test(‘010 12345‘); // false
2.用正则表达式切分字符串比用固定的字符更灵活,请看正常的切分代码:
‘a,b;; c d‘.split(/[\s\,\;]+/); // [‘a‘, ‘b‘, ‘c‘, ‘d‘]
3.正则表达式还有提取子串的强大功能,用()
表示的就是要提取的分组(Group)。
^(\d{3})-(\d{3,8})$
分别定义了两个组,可以直接从匹配的字符串中提取出区号和本地号码:
var re = /^(\d{3})-(\d{3,8})$/; re.exec(‘010-12345‘); // [‘010-12345‘, ‘010‘, ‘12345‘] re.exec(‘010 12345‘); // null
如果正则表达式中定义了组,就可以在RegExp
对象上用exec()
方法提取出子串来。
exec()
方法在匹配成功后,会返回一个Array
,第一个元素是正则表达式匹配到的整个字符串,后面的字符串表示匹配成功的子串。
exec()
方法在匹配失败时返回null
。
4.需要特别指出的是,正则匹配默认是贪婪匹配,也就是匹配尽可能多的字符。举例如下,匹配出数字后面的0
:
var re = /^(\d+)(0*)$/; re.exec(‘102300‘); // [‘102300‘, ‘102300‘, ‘‘]
必须让\d+
采用非贪婪匹配(也就是尽可能少匹配),才能把后面的0
匹配出来,加个?
就可以让\d+
采用非贪婪匹配:
var re = /^(\d+?)(0*)$/; re.exec(‘102300‘); // [‘102300‘, ‘1023‘, ‘00‘]
5.全局搜索
JavaScript的正则表达式还有几个特殊的标志,最常用的是g
,表示全局匹配。
全局匹配类似搜索,因此不能使用/^...$/
,那样只会最多匹配一次。
正则表达式还可以指定i
标志,表示忽略大小写,m
标志,表示执行多行匹配。
标签:code rip 定义 个数 元素 提取子串 返回 语言 子串
原文地址:http://www.cnblogs.com/changely/p/6748540.html