谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-IDF效果一般,不如TextRank好。TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,让每一个单词给它的邻居(术语称窗口)投赞成票,票的权重取决于..
分类:
编程语言 时间:
2016-04-29 20:18:40
阅读次数:
211
最近需要写几个的算法,做预研,深度学习压力太大了,自己一个人写还是有困难,要是用别人的开源的库,肯定很快,但是,要是出了问题,老师肯定也不会给我顶着。所以选择一个相对尺度小一点的机器学习算法写着玩吧。 其中权重的算法textrank,但是首先要看一下bm25.做相似度计算的。BM25算法,...
分类:
编程语言 时间:
2015-10-24 06:39:25
阅读次数:
549
前不久做了有关自动文摘的学习,采用方法是TextRank算法,整理和大家分享。一. 关于自动文摘 利用计算机将大量的文本进行处理,产生简洁、精炼内容的过程就是文本摘要,人们可通过阅读摘要来把握文本主要内容,这不仅大大节省时间,更提高阅读效率。但人工摘要耗时又耗力,已不能满足日益增长的信息需求,...
分类:
其他好文 时间:
2015-06-25 20:49:59
阅读次数:
4755
TextRank算法基于PageRank,用于为文本生成关键字和摘要。其论文是: Mihalcea R, Tarau P. TextRank: Bringing order into texts[C]. Association for Computational Linguistics, 2004. 先从PageRank讲起。 Pa...
分类:
编程语言 时间:
2014-12-01 22:40:55
阅读次数:
586
谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-IDF效果一般,不如TextRank好。TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,让每一个单词给它的邻居(术语称窗口)投赞成票,票的权重取决于自...
分类:
编程语言 时间:
2014-10-14 13:31:48
阅读次数:
189
转载:码农场 » TextRank算法提取关键词的Java实现谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-IDF效果一般,不如TextRank好。TextRank是在 Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理...
分类:
编程语言 时间:
2014-09-25 18:31:07
阅读次数:
3995