java正则表达式中的POSIX 字符类和Unicode 块和类别的类介绍

时间：2017-06-15 17:49:07 阅读：166 评论：0 收藏：0 [点我收藏+]

假如现在有一个需求，要你用Java语言来匹配出一个文本里面的所有（英文半角）标点符号，你会怎么写呢？我想大多数人应该是把这些符号都罗列出来，

如：

!"#$%&‘()*+,-./:;<=>?@[\]^_`{|}~

但[!"#$%&‘()*+,-./:;<=>?@[\]^_`{|}~]这样写需要转义一下，

结果为：

[-!"\#\$%&‘()*+,./:;<=>?@

\^_`\{\|\}~]

然后写到java代码后，有需要转义一次，

变为：

[-!\"\\#\\$%&‘()*+,./:;<=>?@\\[\\\\\\]\\^_`\\{\\|\\}~]

这样的代码，细思极恐。技术分享

我们先来用java代码验证一下，这个长长的正则能不能用

[java] view plain copy

输出结果：

~-,#,+=;@.^(){}

很欣慰，正则应该是没错的。但这样的正则看起来挺反胃的，那么有没有简洁的写法呢？答案是有的，可以利用POSIX字符类来实现，正则为：\p{Punct}

[java] view plain copy

输出结果：

~-,#,+=;@.^(){}

简直了，是不是对正则又燃起了希望之火技术分享，这就是在恰当的时候用POSIX字符类的好处。虽然平时比较少运用POSIX字符类的写法，但在恰当的时机运用起来就会有一种一鸣惊人的感觉。

那么我们来看看POSIX字符类有哪些：

技术分享

除了POSIX字符类之外，还有一个也知道提一下，那就是Unicode块和类别的类

技术分享

原文地址：http://www.cnblogs.com/ptqueen/p/7019084.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行