在数据采集及大数据处理的时候,数据排重、相似度计算是很重要的一个环节,由此引入相似度计算算法。常用的方法有几种:最长公共子串(基于词条空间)、最长公共子序列(基于权值空间、词条空间)、最少编辑距离法(基于词条空间)、汉明距离(基于权值空间)、余弦值(基于权值空间)等,今天我们着重介绍最后两种方式。余...
分类:
编程语言 时间:
2014-12-25 01:23:26
阅读次数:
506
这道是求长度不小于 k 的公共子串的个数...很不幸,我又TLE了...解法参考论文以及下面的链接http://www.cnblogs.com/vongang/archive/2012/11/20/2778481.htmlhttp://hi.baidu.com/fpkelejggfbfimd/ite...
分类:
其他好文 时间:
2014-12-19 20:44:05
阅读次数:
129
最长公共子串...两个字符串连在一起,中间放一个特殊字符隔开。求出height之后,枚举height,看两个后缀是不是分布于两段字符串..如果是,这个值就可以作为答案。取最大值即可。 1 const maxn=200419; 2 var 3 c,h,rank,sa,x,y:array[0.....
分类:
其他好文 时间:
2014-12-19 18:45:03
阅读次数:
188
Description
Beside other services, ACM helps companies to clearly state their “corporate identity”, which includes company logo but also other signs, like trademarks. One of such companies is Inter...
分类:
其他好文 时间:
2014-12-19 14:29:15
阅读次数:
228
2946: [Poi2000]公共串Time Limit: 3 SecMemory Limit: 128 MBSubmit: 55Solved: 33[Submit][Status]Description 给出几个由小写字母构成的单词,求它们最长的公共子串的长度。任务:l 读入单词l 计算最长公共子...
分类:
其他好文 时间:
2014-12-13 19:18:04
阅读次数:
182
最长公共子序列
时间限制:3000 ms | 内存限制:65535 KB
难度:3
描述咱们就不拐弯抹角了,如题,需要你做的就是写一个程序,得出最长公共子序列。
tip:最长公共子序列也称作最长公共子串(不要求连续),英文缩写为LCS(Longest Common Subsequence)。其定义是,一个序列 S ,如果分别是两个或多个已知序列的子序列,且是所有符合...
分类:
其他好文 时间:
2014-12-08 17:56:00
阅读次数:
183
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1503题意:由两个字符串构造出另一个字符串,该字符串包含前两个字符串(按字符顺序,但不一定连续),使该字符串长度最小分析:dp[i][j]表示s1[0-i]与s2[0-j]的最长公共子串.用数字flag随...
分类:
其他好文 时间:
2014-12-07 06:30:24
阅读次数:
264
题目链接http://acm.hdu.edu.cn/showproblem.php?pid=1238题意:给你n个字符串,找出最长公共子串。解法: 找到长度最小的字符串,枚举所有子串,这题我又学到了一个C语言strstr()函数:返回字符串中首次出现子串的地址头文件:#include strstr(...
分类:
其他好文 时间:
2014-12-06 11:16:18
阅读次数:
166
importjava.util.Scanner;
/*求两个字符串的最长公共子串*/
publicclassstringDemo{
publicstaticvoidmain(String[]args){
Scannerscanner=newScanner(System.in);
System.out.println("请输入第一个字符串:");
Stringstr1=scanner.nextLine();
System.out.println("请输..
分类:
其他好文 时间:
2014-12-05 19:31:50
阅读次数:
131
http://codevs.cn/problem/3160/sam的裸题。。。(之前写了spoj上另一题sam的题目,但是spoj被卡评测现在还没评测完QAQ打算写那题题解时再来详细介绍sam的。。。。那就再等等吧。求两个串的lcs话,就是先建立a串的sam,然后用b的字串去匹配a中。因为sam中每...
分类:
其他好文 时间:
2014-12-03 23:14:17
阅读次数:
276