码迷,mamicode.com
首页 > 编程语言 > 详细

python词频统计

时间:2018-06-02 15:47:47      阅读:184      评论:0      收藏:0      [点我收藏+]

标签:中文   cut   str   --   pytho   word   词库   get   列表   

1.jieba 库 -中文分词库

words = jieba.lcut(str)  --->列表,词语

count = {}

for word in words:

  if len(word)==1:

    continue

  else:

    count[word] = count.get(word,0)+1

 

 

函数

jieba.lcut()   分词,中文

 

 

2. 英文分词库

str = "ab sld dd"

str.split()

 

python词频统计

标签:中文   cut   str   --   pytho   word   词库   get   列表   

原文地址:https://www.cnblogs.com/zhuxiang1633/p/9125560.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!