码迷,mamicode.com
首页 > 编程语言 > 详细

自动摘要算法

时间:2014-11-16 22:51:09      阅读:225      评论:0      收藏:0      [点我收藏+]

标签:sp   bs   算法   nbsp   text   信息   关系   网站   文章   

算法主要考虑四方面:

  1. 标题中词语与正文中其他词的关系;
  2. 句子的长度;
  3. 句子的位置(一般文章的第二句比第一句要重要,作者往往在这里引入关键要点);
  4. 如果文章所在网站某些词出现更频繁,这些词要加权重。

一般自动摘要比较常用的一个是摘取文章中的关键词,另一个则是摘取文章中的关键的句子

extrank算法-句子的摘取

textrank其实就是pagerank算法扩展到句子上,来的到一些全局的信息。

 

自动摘要算法

标签:sp   bs   算法   nbsp   text   信息   关系   网站   文章   

原文地址:http://www.cnblogs.com/zzzsun/p/4102473.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!