码迷,mamicode.com
首页 > 编程语言 > 详细

TextRank算法提取关键词的Java实现

时间:2014-10-14 13:31:48      阅读:189      评论:0      收藏:0      [点我收藏+]

标签:style   http   color   ar   java   strong   sp   on   html   

bubuko.com,布布扣
谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-IDF效果一般,不如TextRank好。TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,让每一个单词给它的邻居(术语称窗口)投赞成票,票的权重取决于自己的票数。这是一个“先有鸡还是先有蛋”的悖论,PageRank采用矩阵迭代收敛的方式解决了这个悖论。TextRank也不例外:PageRank的计算公式:正规的TextRank公式正规的TextRank公式在Pa...

继续阅读码农场 » TextRank算法提取关键词的Java实现

原文链接http://www.hankcs.com/nlp/textrank%e7%ae%97%e6%b3%95%e6%8f%90%e5%8f%96%e5%85%b3%e9%94%ae%e8%af%8d%e7%9a%84java%e5%ae%9e%e7%8e%b0.html

TextRank算法提取关键词的Java实现

标签:style   http   color   ar   java   strong   sp   on   html   

原文地址:http://www.cnblogs.com/hankcs/p/4023935.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!