码迷,mamicode.com
首页 > 编程语言 > 详细

最长公共子串、最长公共子序列的Java实现与NLP应用

时间:2014-11-07 16:17:17      阅读:174      评论:0      收藏:0      [点我收藏+]

标签:style   http   io   color   ar   使用   java   sp   strong   

bubuko.com,布布扣
前言以前HanLP使用“最短编辑距离”来做推荐器,效果有待提高,主要缺点是根据拼音序列的编辑距离推荐的时候,同音字交错很常见,而编辑距离却不那么大。这时我就在寻求一种补充的评分算法,去评判两个句子在拼音这一维度上的相似程度。区别最长公共子串(Longest Common Substring)指的是两个字符串中的最长公共子串,要求子串一定连续。最长公共子序列(Longest Common Substring)指的是两个字符串中的最长公共子串,不要求子串连续。求解两者的求解与编辑距离一样,都是动态规划,用空间换...

继续阅读码农场 » 最长公共子串、最长公共子序列的Java实现与NLP应用

原文链接http://www.hankcs.com/program/algorithm/implementation-and-application-of-nlp-longest-common-subsequence-longest-common-subsequence-of-java.html

最长公共子串、最长公共子序列的Java实现与NLP应用

标签:style   http   io   color   ar   使用   java   sp   strong   

原文地址:http://www.cnblogs.com/hankcs/p/4081253.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!