标签:
import java.util.ArrayList; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Cao53b { /** * 白纸教你正则表达式的用法 * 找到评论列表中的小广告 * 输入:一个List<String> 评论列表 * 匹配词库:List<String> 匹配词库 * 结果 map:HashMap<String,String> */ public void findNoUseWords(ArrayList<String> commentsList ,ArrayList<String> keywordsList) { for (String comment : commentsList) { for (String keywords : keywordsList) { compare(comment,keywords); } } } public static void compare(String comment,String keywords) { String regex = ""; for(int i = 0 ; i < keywords.length(); i++) { regex += keywords.charAt(i)+"\\s*"; } Pattern p = Pattern.compile(regex); Matcher m = p.matcher(comment); while (m.find()) { System.out.println(m.group()); } } public static void main(String[] args) { String comment = "地址,www. baidu .com,网 店 地 址ds 销 售 电 话,1599网 店 地 址"; String keywords = "网店地址"; compare(comment,keywords); } }
标签:
原文地址:http://www.cnblogs.com/guizhongyi/p/4796599.html