标签:组织 abs 第三方 自然语言处理 技术 设计 主题 入门 pagerank
之前写过一篇关于论文降重的技术爽文,收到了不错的反响。
毕业生的法宝,论文一键降重~!
最近对毕业论文方面的问答做了一个统计,发现除了降重,“摘要”的准备以及撰写也是莘莘学子们重点关心的一个话题,那摘要有没有可能用代码实现的捷径呢?
确实是有的,老K在这里就给大家介绍一下:
# encoding:utf-8
from gensim.summarization import summarize
import re
“gensim是一个用于自然语言处理的库,最早是用来生成给定文章相似内容的工具,gensim本身就是“generate similar”的合成词。
text = re.sub(r‘。|?|!‘, ‘. ‘, text)
abstract = summarize(text)
# encoding:utf-8
from gensim.summarization import summarize
import re
def do_abstract(text):
text = re.sub(r‘。|?|!‘, ‘. ‘, text)
abstract = summarize(text)
return abstratc
以上代码可以帮助你以最快的速度获取论文的核心内容,你可以用于:
“textrank是源于google的pagerank算法启发,应用到自然语言处理领域的结果。
往期精彩推荐:
数据可视化有什么好的Python项目?
【热荐】大佬们推荐的Python入门书综述
深度学习,大家都看哪些社区论坛?
[推荐]10个免费python机器学习项目
手把手教新手安装Anaconda配置开发环境
标签:组织 abs 第三方 自然语言处理 技术 设计 主题 入门 pagerank
原文地址:https://blog.51cto.com/15069443/2576231