一,算法介绍 在CS124课程的第一周提到 求解两个字符串相似度的算法 Minimum Edit Distance(最短编辑距离)算法。该算法在NLP(自然语言处理)中也会用到。 如何定义相似度呢?任给两个字符串X 和Y,使用以下三种操作将 字符串X 变到 字符串Y :①插入(Insert)操作;② ...
分类:
编程语言 时间:
2017-09-02 18:05:35
阅读次数:
228
一、编辑距离
1、从字符串a变为字符串b所需要的元操作有3种:
增加一个字符删除一个字符变化一个字符
2、编辑距离:从字符串a变为b所需要的最少操作步骤。
二、最短编辑距离(动态规划)
首先定义一个函数——step(i, j),它表示第一个字符串的长度为i的子串到第二个字符串的长度为j的子串的编辑距离。
显然可以有如下动态规划公式:
if i == 0 且 j =...
分类:
编程语言 时间:
2015-06-09 13:47:36
阅读次数:
227