码迷,mamicode.com
首页 > 其他好文 > 详细

正则表达式

时间:2017-08-20 17:00:13      阅读:232      评论:0      收藏:0      [点我收藏+]

标签:缓冲   语法   大小   数字   使用   斜杠   imp   分割   制表符   

第7章正则表达式
 1.  什么是正则表达式
正则表达式就是一种描述字符串结构的语法规则
 2. 为什么需要正则表达式?
因为需要对用户提交的信息进行验证,如果不验证的话,有可能用户提交的就是垃圾信息
 3. PHP里面的正则表达式函数库
 在PHP里面支持2套正则表达式函数库,一套是POSIX,另外一套是PCRE。比起POSIX,现在更多的是使用PCRE这一套正则表达式函数。原因有两个:PCRE函数库的兼容性更好,并且效率高。
 我们的正则表达式如果不配合正则表达式函数的话,它就只是一个普通的字符串。所以正则表达式一定要配合正则表达式函数来使用
 4. 正则表达式语法
 任何一个正则表达式的组成无外乎由4个部分组成 ① 定界符 ② 原子 ③ 元字符 ④ 模式修正符
  定界符
   我们所写的正则表达式都需要放在定界符里面。一般常见的定界符为两个斜杠//
但是,我们的定界符不仅仅只有//  任何除了数字,字母,反斜杠\ 以外的字符都可以成为正则表达式的定界符
  原子
原子是正则表达式里面最基本的组成单位。换句话说,一个正则表达式里面,可以没有元字符,可以没有模式修饰符,但是不能没有原子。
原子大致可以分为5大类
   1)普通字符作为原子
所谓普通字符,就是大小写字母,数字等字符
例如:
“/5/”   用于匹配字符串中是否有5这个字符出现
“/php/”   用于匹配字符串中是否有php这个字符串出现
   2)特殊字符作为原子
在正则表达式里面,有一些字符是有特殊含义,例如* +?.
如果我们就只想匹配普通的*+?. 的话,必须转义。转义字符是一个反斜杠\
   3)非打印字符作为原子
所谓非打印字符,就是字符串中的控制符号,例如:空格,回车,制表符(Tab)
   4)使用通用型字符作为原子
所谓通用型字符,就是指一个原子可以匹配多个字符。
\d:匹配任意一个十进制数字0-9
\D:匹配任意一个除了十进制以外的字符
\s:匹配任意一个非打印字符
\S:除了非打印字符以外的字符可以被匹配上
\w:匹配字母数字和下划线
\W:匹配除了数字,字母下划线以外字符
   5)自定义原子表作为原子
自定义原子表通过一对[ ]
可以在[]里面加上一个^ 代表不能匹配方括弧里面的字符
还可以在方括弧里面使用”   -  “ ,代表的是一个范围
  元字符
所谓元字符,就是用于构建正则表达式的具有特殊含义的字符。例如:+*?
   1)限定符
所谓限定符,就是限定一个原子必须出现多少次:* + ? {n} {n,} {n,m}
*:代表一个原子出现0次或者多次
+:代表一个原子出现1次或者多次
?:代表一个原子要么出现1次,要么出现0次
{n}:前面的原子出现几次
{n,}:前面的原子至少出现n次
{n,m}:前面的原子至少出现n次,最多m次

*:{0,}
+:{1,}
?:{0,1}
   2)边界限定符
^:字符串是否以某一个字符串开头
$:字符串是否以某一个字符串结尾
\b和\B
\b :是边界
\B :  不是边界
   3)点.
可以匹配任何一个除了换行符以外的字符
   4)模式选择符 |
   5) 模式单元
    所谓模式单元,就是可以使用()将多个原子组合成一个更大的原子
    One:将小原子组合成了一个大原子
  Two:改变元字符的优先级
    Three:开启了独立的模式,会将小括号里面的内容存入到缓冲区里面
  被存入到缓冲区里面的内容可以通过\1 \2 \3来进行反向引用
    缓冲区是可以被跳过的,通过一个?:来跳过缓冲区
   6)元字符的优先级
  ④ 模式修正符
所谓模式修正符,是对正则表达式功能的一种扩充,增强了正则表达式的处理能力,模式修正符一般是写在定界符外面
   i:忽略大小写
M:可以匹配多行,换句话说,可以多行查找
S:主要功能是用来增强点. 的功能
X:可以忽略空格
 正则表达式函数
  Preg_match():查看一个字符串是否和一个正则表达式匹配,匹配就返回TRUE,否则返回FALSE

Preg_match_all():第一次匹配成功之后也不会像Preg_match()一样停止搜索,而是会继续往后面搜索符合要求的字符串

Preg_grep():接受两个参数,一个是正则表达式,一个是数组,将符合条件的元素提出来返回一个新的数组,返回的新数组里面的元素下标不变

Preg_repalce(正则,替换的字符串,原来的字符串)

除了使用正则的方式,使用字符串替换函数也是可以实现字符串替换的
Str_replace(“要替换的字符串”,“新的字符串”,要操作的字符串,[替换的次数])

使用正则和字符串替换函数都可以实现字符串的替换,但是正则的功能比字符串替换函数要强大一些,但是功能强大的背后,是效率会降低
如果可以是字符串替换函数搞定的事儿,就不要去用正则
 字符串分割
  Preg_split()
 字符串处理
  Explode(分隔符,字符串)
  Implode():将一个数组组合成一个字符串
Implode(连接符号,数组)

正则表达式

标签:缓冲   语法   大小   数字   使用   斜杠   imp   分割   制表符   

原文地址:http://www.cnblogs.com/dlp-520/p/7400203.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!