码迷,mamicode.com
首页 > 编程语言 > 详细

python 统计单词个数---从文件读取版本---不去重

时间:2016-06-19 18:35:45      阅读:189      评论:0      收藏:0      [点我收藏+]

标签:python 正则表达式 单词统计

#/usr//bin/env  pytnon
#coding:utf-8

import re

‘‘‘
words = ‘hello word  a@r3143#  ####   ##$dfabpple# apple##%#$  3423421apple        apple323423 432422324##apple@@#  @@@@@  $$!!#!#‘
‘‘‘

#编译生成正则表达式对象
regexp = re.compile(r‘[a-zA-Z]{2,}‘)

#with open(‘./aa.txt‘)  as f:
f = open(‘./aa.txt‘)
line = f.readlines()
print len(line)

j = 0
sum = 0
for i in range(len(line)):
     j = len(regexp.findall(line[i]))
     sum = sum + j
print sum


本文出自 “linux与网络那些事” 博客,请务必保留此出处http://khaozi.blog.51cto.com/952782/1790792

python 统计单词个数---从文件读取版本---不去重

标签:python 正则表达式 单词统计

原文地址:http://khaozi.blog.51cto.com/952782/1790792

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!