码迷,mamicode.com
首页 > 编程语言 > 详细

Python语音实现词频统计

时间:2016-11-14 11:56:15      阅读:362      评论:0      收藏:0      [点我收藏+]

标签:alt   频率   利用   格式   部分   read   统计   log   image   

需求:

1.设计一个词频统计的程序。

2.英语文章中包含的英语标点符号不计入统计。

3.将统计结果按照单词的出现频率由大到小进行排序。

 

设计:

1.基本功能和用法会在程序中进行提示。

2.原理是利用分隔符分词存入列表,然后从列表读出存入字典,键为词,值存放词的数量。

 

代码如图所示:

1.导入程序所需模块。

技术分享

2.定义readfile类,实现去除文章中标点符号的功能。

技术分享

技术分享

3.定义一个getstr类,对结果输出格式进行定义。

技术分享

4.构造程序主函数。

技术分享

 

测试用例:

测试用例我选择了马丁.路德.金的演讲稿。

技术分享

 

部分测试结果如图所示:

技术分享

 

我也看了杨老师对其他同学提出的要求,例如试着跑一跑《战争与和平》这本英语书籍,可能是由于字码数过大,没有运行处结果。

技术分享

以上是我的程序的展示,不足之处请老师给予批注,谢谢老师。

Python语音实现词频统计

标签:alt   频率   利用   格式   部分   read   统计   log   image   

原文地址:http://www.cnblogs.com/yangyuning/p/6061090.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!