单词统计的题目,给出一些单词,统计有多少单词在一个文本中出现,最经典的入门题了。
AC自动机的基础:
1 Trie, 以这个数据结构为基础的,不过增加一个fail指针和构造fail的函数
2 KMP,不是直接运用KMP,而是需要KMP的思想,KMP思想都没有的话,理解这个算法会更加吃力的。
注意本题的单词会有重复出现的,一个单词只能统计一次。
搜索了一下网上的题解,发现好多代码都...
分类:
其他好文 时间:
2014-08-07 13:20:40
阅读次数:
300
KMP,在有循环节的前提下: 循环节 t = len-next[len], 个数num = len/(len-next[len]);个人理解,如果有循环节,循环节长度必定小于等于len/2, 换句话说next[len]>=len/2;对于len%(len-next)!=0的这种情况不讨论,循环节不存...
分类:
其他好文 时间:
2014-08-07 12:14:29
阅读次数:
290
本题要求求一组字符串的最长公共子串,其实是灵活运用KMP快速求最长前缀。
注意肯爹的题意:要求按照字典顺序输出。
还有要提醒的就是:有人也是用KMP来解这道题,但是很多人都把KMP当成暴力法来用了,没有真正处理好细节,发挥KMP的作用。而通常这些人都大喊什么暴力法可以解决本题,没错,的确暴力法是可以解决本题的,本题的数据不大,但是请不要把KMP挂上去,然后写成暴力法了,那样会误导多少后来人啊。...
分类:
其他好文 时间:
2014-08-06 23:12:42
阅读次数:
375
很好,讲得很清晰,值得学习。作者:July时间:最初写于2011年12月,2014年7月21日晚10点 全部删除重写成此文,随后的半个月从早到晚不断改进。1. 引言 本KMP原文最初写于2年多前的2011年12月,因当时初次接触KMP,思路混乱导致写也写得非常混乱,如此,留言也是“骂声”一片。所以....
分类:
其他好文 时间:
2014-08-06 18:26:11
阅读次数:
235
题目链接:http://poj.org/problem?id=2406题目大意:如果n%(n-next[n])==0,则存在重复连续子串,长度为n-next[n]。例如: a b a b a bnext:-1 0 0 1 2 3 4next[n]==4,代表着,前缀abab与后缀abab相等的最.....
分类:
其他好文 时间:
2014-08-06 17:59:31
阅读次数:
186
这道题对更加深入地理解next数组有很大帮助。
基本思路:
字符编号从0开始,那么if(i%(i-next[i])==0),则i前面的串为一个轮回串,其中轮回子串出现i/(i-next[i])次。
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1358...
分类:
其他好文 时间:
2014-08-06 15:01:01
阅读次数:
190
这题跟HDU 1358 Period (KMP)
差不多,稍微修改代码就行了。
关于KMP的更多知识,请关注从头到尾彻底理解KMP(2014年8月4日版)
。
#include
#include
int n,next[1000000];
char p[1000000];
void getnext()
{
int k=0,j=1;
next[0]=-1;next[1]=0;
...
分类:
其他好文 时间:
2014-08-06 14:48:01
阅读次数:
204
给出两个字符串,寻找一个字符串在另外一个字符串出现的频率。
原来kmp还有一个陷阱,下面注释出了,下标没步进好,就有一定几率出现超时的,也有一定几率出现错误,视具体的串而定。
修改一下就好了,kmp速度是很快的。
#include
#include
const int MAX_TXT = 1000001;
const int MAX_WORD = 10001;
int ...
分类:
其他好文 时间:
2014-08-06 01:59:00
阅读次数:
195
KMP查找整数数列,不是查找字符串。
原理是一样的,不过把字符串转换为数列,其他基本上是一样的。
#include
#include
const int MAX_N = 1000001;
const int MAX_M = 10001;
int strN[MAX_N], strM[MAX_M], next[MAX_M], N, M;
void getNext()
{
mems...
分类:
其他好文 时间:
2014-08-05 22:37:10
阅读次数:
194