注意:这道题的解法和最短摘要一样,都是采用尺取法解决问题,注意这儿题目要求恰好包含,也就是说这个hiho字符串必须包含2个'h'、1个'i'和1个'o'。一个不能多,一个也不能少。 结果: 尺取法的模型:根据区间的特征交替推进左右端点求解问题,其高效的原因在于避免了大量的无效枚举,其区间枚举都是根据 ...
分类:
其他好文 时间:
2019-01-26 18:49:51
阅读次数:
207
题目:Alibaba笔试题,给定一段产品的英文描述,包含M个英文单词,每个英文单词以空格分隔,无其他标点符号;再给定N个英文单词关键字,请说明思路并编程实现方法。String extractSummary(String description,String[] key words)目标是找出此产品描 ...
分类:
其他好文 时间:
2019-01-23 00:15:57
阅读次数:
230
题意:假设给定的已经是经过网页分词之后的结果,词语序列数组为W。其中W[0], W[1], ... , W[N]为一些已经分好的词语。假设用户输入的搜索关键词为数组Q。其中Q[0], Q[1], ... Q[m]为所有输入的搜索关键词。 例如,我们可以看到这样一个序列: w0, w1, w2, w3 ...
分类:
其他好文 时间:
2018-08-30 00:16:52
阅读次数:
167
题目:
Alibaba笔试题:给定一段产品的英文描述,包含M个英文字母,每个英文单词以空格分隔,无其他标点符号;再给定N个英文单词关键字,请说明思路并编程实现方法String
extractSummary(String description,String[] key words),目标是找出此产品描述中包含N个关键字(每个关键词至少出现一次)的长度最短的子串,作为产品简介输出。(不限编程语...
分类:
其他好文 时间:
2015-05-05 12:38:54
阅读次数:
106
题目:有搜索后的网页分词序列 数组W 其中W[0]、W[1]、...W[N]为分好的词。用户输入的关键词为数组 Q 其中Q[0]、Q[1]...Q[M]为搜索的关键词。找到W中最小的范围W[i]~W[j]让其包括所有的Q。思路:最想当然的思路就是从W[0]开始,对每个Q遍历判断有没有一样的,截取出第...
分类:
其他好文 时间:
2014-11-08 23:33:38
阅读次数:
251
这个主要注意几点:首先,str[i]-str[j]包含keyword里面的所有词语,但是不要求顺序相同,然后,str[i]-str[j]是所有满足这样要求的最短子串。主要方法是:dequestore:记录当前摘要的所有单词在str中的下标,maprecord记录所有当前摘要中出现的次数。min_le...
分类:
其他好文 时间:
2014-09-06 23:43:34
阅读次数:
211
书上给出了最短摘要的描述即算法,简单来说就是:
扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的range里包含所有关键字 。然后每次迭代,尝试调整pBegin和pEnd:
1.pBegin递增,直到range无法包含所有关键字
2.pEnd递增,直到range重新包含所有关键字
计算新的range,与旧的range相比,看是否缩短了...
分类:
其他好文 时间:
2014-08-15 14:39:38
阅读次数:
306
/*最短摘要问题,给一定字符串序列 wo,w1,w2,w3,op1,w4,op2,w5,op1,w6,w7,op1,op2,指定关键字符串为op1,op2,求包含关键字的最小字符串序列。常见于搜索引擎的分词,op1,op2这里没有顺序,否则就更复杂了,最短序列为op1,op2。思路:(1)第一次扫描...
分类:
其他好文 时间:
2014-07-25 02:21:34
阅读次数:
351
题目:
Alibaba笔试题:给定一段产品的英文描述,包含M个英文字母,每个英文单词以空格分隔,无其他标点符号;
再给定N个英文单词关键 字,请说明思路并编程实现方法String extractSummary(String description,String[] key words),
目标是找出此产品描述中包含N个关键字(每个关键词至少出现一次)的长度最短的子串,作为产品简介输出。(不限...
分类:
其他好文 时间:
2014-05-22 22:37:55
阅读次数:
405