http://poj.org/problem?id=3356题意:给两个长度不大于1000的串,修改其中一个串使得两串相同,问最少修改次数。修改有三种,插入一个字符,删除一个字符,改变一个字符。分析:直接给方程。dp[i][j]表示第一个串前i位和第二串前j位匹配的最小修改次数。dp[0][0] =...
分类:
其他好文 时间:
2014-08-04 23:57:08
阅读次数:
474
题目链接:点击打开链接
编辑距离,,== 一边dp一边记录前驱太累,,还是dp后找路径大法好
#include
#include
#include
#include
using namespace std;
#define ll int
#define N 1010
char s[N], t[N];
int dp[N][N], n, m;
// 0为插入 1为删除 2 3为替换
struct ...
分类:
其他好文 时间:
2014-08-04 17:49:47
阅读次数:
275
机器学习问题方法总结大类名称关键词有监督分类决策树信息增益分类回归树Gini指数,Χ2统计量,剪枝朴素贝叶斯非参数估计,贝叶斯估计线性判别分析Fishre判别,特征向量求解K最邻近相似度度量:欧氏距离、街区距离、编辑距离、向量夹角、Pearson相关系数逻辑斯谛回归(二值分类)参数估计(极大似然估计...
分类:
其他好文 时间:
2014-08-03 23:05:56
阅读次数:
416
编辑距离概念描述:编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。例如将kitten一字转成sitting:sitten (k→s)sittin (e→i)sitting (...
分类:
其他好文 时间:
2014-07-31 20:12:47
阅读次数:
226
题目:编辑距离,给你两个串,将已知串转化成目标串,可以增、删、改字母,求最小操作次数。
分析:dp,编辑距离。同最大公共子序列。注意操作位置是实时变化的。(前面都已经处理好了)
f[i][j] = f[i-1][j] 这时删掉 str1[j+1];
f[i][j] = f[i][j-1]...
分类:
其他好文 时间:
2014-07-31 00:02:25
阅读次数:
282
编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。例如将kitten一字转成sitting:sit...
分类:
其他好文 时间:
2014-07-28 21:27:24
阅读次数:
329
问题: 对于长度相同的2个字符串A和B,其距离定义为相应位置字符距离之和。2个非空格字符的距离是它们的ASCII码之差的绝对值;空格与空格的距离为0,空格与其他字符的距离为一个定值k。在一般情况下,字符串A和B...
分类:
其他好文 时间:
2014-07-25 11:44:22
阅读次数:
393
1 /* 2 字符串编辑问题,给定一个源字符串和目的字符串,源字符串可以insert,delete,replace,求最少操作使其变成目标字符串,有两种方法,方法一采用 3 动态规划方法,f[i][j]=min{f[i-1][j]+1,f[i+1][j]+1,f[i-1][j-1]+(s[i...
分类:
其他好文 时间:
2014-07-25 02:22:44
阅读次数:
262
对语音识别来讲,同一个单词被同一个人每次说的情况都不同,给识别带来苦难。本章讨论的就是对不同的情形如何定义适应不同特性的度量。
1,基于最优路径搜索的度量:①贝尔曼最优性原则和动态编程②编辑距离(The Edit Distance)③在语音识别动态时间扭曲(DTW), speaker-dependentrecognition. speaker-independentrecognition.
2...
分类:
其他好文 时间:
2014-07-24 10:27:44
阅读次数:
254
相似度计算的任务是根据两段输入文本的相似度返回从0到1之间的相似度值:完全不相似,则返回0,;完全相同,返回1.衡量两端文字距离的常用方法有:海明距离(Hamming distance),编辑距离,欧氏距离,文档向量的夹角余弦距离,最长公共字串。1. 余弦相似度把两篇文档看作是词的向量,如果x,y为...
分类:
其他好文 时间:
2014-07-22 22:53:35
阅读次数:
186