标签:
算法描述:
Java实现代码:
1 public static List<String> FMM(String text) { 2 List<String> result = new ArrayList<String>(); 3 while (text.length() > 0) { 4 int len = MAX_LENGTH; 5 if (text.length() < len) { 6 len = text.length(); 7 } 8 String tryWord = text.substring(0, 0 + len); 9 while (!DIC.contains(tryWord)) { 10 if (tryWord.length() == 1) { 11 break; 12 } 13 tryWord = tryWord.substring(0, tryWord.length() - 1); 14 } 15 result.add(tryWord); 16 text = text.substring(tryWord.length()); 17 } 18 return result; 19 }
小结:
正向最大匹配算法是中文分词基本算法之一,它分词速度快但是准确度并不高,比如“长春市长春节快乐”用正向最大匹配分出的来得结果是“长春市,市长,节,快乐”,这显然不符合我们的语言习惯,所以在此思想上,我们可以用逆向最大匹配算法来解决此类问题。
标签:
原文地址:http://www.cnblogs.com/stardjyeah/p/4528781.html