码迷,mamicode.com
首页 > 编程语言 > 详细

有txt文本和图片,就能用python生成词云图

时间:2020-05-18 20:33:48      阅读:105      评论:0      收藏:0      [点我收藏+]

标签:join   颜色   ima   lis   ack   pre   代码   gen   import   

使用现有的txt文本和图片,就可以用wordcloud包生成词云图。大致步骤是:

1、读取txt文本并简单处理;

2、读取图片,以用作背景;

3、生成词云对象,保存为文件。

需要用到3个库:jieba(用于分割文本为词语)、imageio(用于读取图片)、wordcloud(功能核心,用于生成词云)。

我用简历和我的照片,生成了一个词云图:

技术图片

 

代码如下:

import jieba
import imageio
import wordcloud


# 读取txt文本
with open(resume.txt,r,encoding=utf-8) as f:
    text = f.read()

# 简单处理文本,删除空格等多余字符
text = text.replace( ,‘‘).replace(\t,‘‘).replace(\n,‘‘)
# 使用jieba分隔词语
wordlist = jieba.lcut(text)   # [‘aa‘,‘bb‘,‘cc‘...]
# print(wordlist)
# 用空格连接各个词语,又形成一个大字符串
string =  .join(wordlist)   # ‘aa bb cc‘

# 读取图片
image = imageio.imread(ding.jpg)


# 生成词云图片
# 先实例化一个词云对象
wc = wordcloud.WordCloud(width=image.shape[0],  # 词云图宽度同原图片宽度
                        height=image.shape[1],
                        background_color=white,  # 背景颜色白色
                        font_path=msyh.ttc,  # 指定字体路径,微软雅黑,可从win自带的字体库中找
                        mask=image,   # mask 指定词云形状图片,默认为矩形
                        scale=3)   # 默认为1,越大越清晰
# 再给词云输入文字
wc.generate(string)
# 保存成文件
wc.to_file(wordcloud21.png)

 

有txt文本和图片,就能用python生成词云图

标签:join   颜色   ima   lis   ack   pre   代码   gen   import   

原文地址:https://www.cnblogs.com/djlbolgs/p/12912625.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!