码迷,mamicode.com
首页 > 其他好文 > 详细

统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数

时间:2018-08-20 10:39:02      阅读:417      评论:0      收藏:0      [点我收藏+]

标签:div   com   pen   enc   nbsp   with open   单词   txt   from   

统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数
from collections import Counter
import re

with open(a.txt, r, encoding=utf-8) as f:
    txt = f.read()
c = Counter(re.split(\W+,txt))  #取出每个单词出现的个数
print(c)
ret = c.most_common(10)   #取出频率最高的前10个
print(ret)

 

统计一篇英文文章内每个单词出现频率,并返回出现频率最高的前10个单词及其出现次数

标签:div   com   pen   enc   nbsp   with open   单词   txt   from   

原文地址:https://www.cnblogs.com/jiangshanduojiao/p/9381306.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!