码迷,mamicode.com
首页 > 编程语言 > 详细

字符串算法之最长公共子序列

时间:2016-05-07 10:42:52      阅读:215      评论:0      收藏:0      [点我收藏+]

标签:

最长公共子序列,即 longest common subsequence,LCS。一个字符串删掉任意字符后所形成的字符串,不要求连续,注意和最长公共子串的区别。

LCS的应用:论文查重,图形相似度比较,基因序列比较等。


暴力求解:

分别求出X、Y串的子序列,而后进行搜索比较,容易得到该算法复杂度为O(2^m · 2^n ),显然不可取


动态规划:

设有两个字符串X[1....m],Y[1....n],求其最长公共子串

假设Xi Yi为两个字符串从1开始数的第i个字符,若xm=yn,则xm必在最长公共子序列中,即

设Z为最长公共子串,那么 Z = LCS(Xm,Yn)= LCS(Xm-1, Yn-1) + xm;

若不相等,则 Z =  max{LCS(Xm-1,Yn),LCS(Xm,Yn-1)};

则使用二维数组C[m][n], C[i][j]记录序列Xi和Yi的最长公共子序列的长度,当i或者j等于0时,公共子序列长度为0,即C[i][j]=0;

那么:

技术分享技术分享技术分享技术分享

实现代码:

技术分享技术分享技术分享

技术分享

技术分享如果是要求出最长递增序列的,可将原序列排序后求两个序列的最长公共子序列。


字符串算法之最长公共子序列

标签:

原文地址:http://blog.csdn.net/lj_2_0_2/article/details/51330640

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!