码迷,mamicode.com
首页 > 其他好文 > 详细

wordcloud词云

时间:2018-03-15 13:25:39      阅读:655      评论:0      收藏:0      [点我收藏+]

标签:代码   支持   三维   height   stop   path   交集   cee   pen   

借鉴别人的一个小例子,快速生成词云的代码:

 1 from wordcloud import WordCloud
 2 
 3 f = open(utxt/AliceEN.txt,r).read()
 4 wordcloud = WordCloud(background_color="white",width=1000, height=860, margin=2).generate(f)
 5 
 6 # width,height,margin可以设置图片属性
 7 
 8 # generate 可以对全部文本进行自动分词,但是他对中文支持不好,对中文的分词处理请看我的下一篇文章
 9 #wordcloud = WordCloud(font_path = r‘D:\Fonts\simkai.ttf‘).generate(f)
10 # 你可以通过font_path参数来设置字体集
11 
12 #background_color参数为设置背景颜色,默认颜色为黑色
13 
14 import matplotlib.pyplot as plt
15 plt.imshow(wordcloud)
16 plt.axis("off")
17 plt.show()
18 
19 wordcloud.to_file(test.png)
20 # 保存图片,但是在第三模块的例子中 图片大小将会按照 mask 保存

 

解释一下WordCloud各参数的含义:

font_path: string  #"仿宋.ttf"

width,height 画布宽高

max_words: 显示词的最大个数 default = 200

mask : 图片形状,接受一个ndarray参数(三维数组)

backgroud_color: 背景颜色

stopwords :屏蔽的词 (from wordcloud import STOPWORDS)

关于集合的操作:add,remove,&,|,-  增,删,交集,并集,差集

 

wordcloud词云

标签:代码   支持   三维   height   stop   path   交集   cee   pen   

原文地址:https://www.cnblogs.com/zenan/p/8572804.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!