码迷,mamicode.com
首页 > 编程语言 > 详细

java正则表达式

时间:2017-12-12 21:51:47      阅读:190      评论:0      收藏:0      [点我收藏+]

标签:blank   space   罗马   tar   pac   java正则   dig   replace   start   

参考http://blog.csdn.net/telnetor/article/details/6041323

String str = ",.!,,D_NAME。!;‘’”“**dfs  #$%^&()-+1431221\"\"中           国123漢字かどうかのjavaを決定";
str = str.replaceAll("[\\pP\\pS\\pZ]", "");
System.out.println(str);
DNAMEdfs1431221中国123漢字かどうかのjavaを

Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。 
/pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。

P:标点字符 
L:字母; 
M:标记符号(一般不会单独出现); 
Z:分隔符(比如空格、换行等); 
S:符号(比如数学符号、货币符号等); 
N:数字(比如阿拉伯数字、罗马数字等); 
C:其他字符

 

  1.  /**清除数字和空格*/  
  2.     public static  String cleanBlankOrDigit(String str){  
  3.         if(isBlankOrNull(str))return "null";  
  4.         return Pattern.compile("\\d|\\s").matcher(str).replaceAll("");  
  5.     }  
  6.   

 

 

public static final String REG_SPACE_PUNCTUATION = "(\\s)|(\\pP)";
List<News> news = newsDao.findNewsByComsOrInds(query);
// 所有的标点符号空格用空字符串替换后 再进行去重
TreeSet<News> newSet = new TreeSet<>((o1, o2) -> o1.getTitle().replaceAll(REG_SPACE_PUNCTUATION, "").compareTo(o2.getTitle().replaceAll(REG_SPACE_PUNCTUATION, "")));
newSet.addAll(news);
news = new ArrayList<>(newSet);

java里面\\s就是空格, \\pP代表标点符号。 !"#$%&‘()*+,-./:;<=>?@[\]^_`{|}~
/pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
第一个 \ 是转义字符
用在上面的replaceAll 方法中 写第一个\ 就代表匹配正则表达式了



java正则表达式

标签:blank   space   罗马   tar   pac   java正则   dig   replace   start   

原文地址:http://www.cnblogs.com/xiaolei2017/p/8028996.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!