优化后的Levensthein distance算法实现

时间：2014-08-20 12:38:02 阅读：187 评论：0 收藏：0 [点我收藏+]

在上一篇文章Levenshtein distance算法实现中，笔者已经讲解了一般最小编辑距离的算法。该算法采用动态规划，时间复杂度是O（m*n），m，n分别为两个字符串的长度，而空间复杂度也是O（m*n），如果使用int作为矩阵元素的类型，则矩阵的占用空间大小为sizeof（int）*m*n，假如两个字符串的长度均为10000个字符，则矩阵大小为400MB，相当可观。参考一个快速、高效的Levenshtein算法实现，笔者重新实现了一遍Levenshtein distance算法，其主要思想就是利用两个列向量来代替矩阵，每次只保存当前状态和上一次运算状态，算法结束后并不能获得该两个字符串任意子序列之间的最小编辑距离。算法采用Python实现，代码如下：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
__author__ = 'xanxus'
s1, s2 = raw_input('String 1:'), raw_input('String 2:')
m, n = len(s1), len(s2)
colsize, v1, v2 = m + 1, [], []
for i in range((n + 1)):
    v1.append(i)
    v2.append(i)
for i in range(m + 1)[1:m + 1]:
    for j in range(n + 1)[1:n + 1]:
        cost = 0
        if s1[i - 1] == s2[j - 1]:
            cost = 0
        else:
            cost = 1
        minValue = v1[j] + 1
        if minValue > v2[j - 1] + 1:
            minValue = v2[j - 1] + 1
        if minValue > v1[j - 1] + cost:
            minValue = v1[j - 1] + cost
        v2[j] = minValue
    for j in range(n + 1):
        v1[j] = v2[j]
print v2[n]

由于内存分配减少了，所以算法的效率也能提高一点，即使时间复杂度没有改变。

优化后的Levensthein distance算法实现,布布扣,bubuko.com

优化后的Levensthein distance算法实现

标签：算法优化动态规划 python

原文地址：http://blog.csdn.net/xanxus46/article/details/38701765

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行