想搞清楚这个问题的原因就是我无法把一个文本里的单词全部给找出来,因为接触C++的时候记得好像regex可以有好多个字符组成,这样就可以通过,。!和空格等标点来分割文本了,但是split的方法所接受的参数只有String类型的regex和int类型的limit,limit用来表示最多可以将字符串分成多少部分。后来通过在网上查找资料才知道原来String类型的regex可以由多部分组成,每个部分分别由 | 隔开,对于可能要出现的* + .等符号,可能需要 \\ 的转义,具体注意事项有以下几个部分:
1.首先 . * + | 都是关键字符,用它们分割的话必须用\\进行转义
2.多个分割字符进行连接是需要用到 | 字符
3.如果用 \作为分隔符,就得写成:str.split("\\\\"),因为在java中是用“\\"来表示”\"的,字符串写成这样:String str=“a\\b\\c";
栗子一枚:
String str1=new String("hello+world|I'm*mnmlist.sting"); String regexString=" |,|\\.|\\*|\\+|\\|"; String arr1[]=str1.split(regexString); for(int i=0;i<arr1.length;i++) System.out.println(arr1[i]);
原文地址:http://blog.csdn.net/mnmlist/article/details/44724431