码迷,mamicode.com
首页 > 其他好文 > 详细

使用jieba库与wordcloud库第三方库进行词频统计

时间:2019-04-04 00:04:50      阅读:376      评论:0      收藏:0      [点我收藏+]

标签:height   中文   优秀   enc   设置   gen   利用   win   词语   

一、jieba库与wordcloud库的使用

1.jieba库与wordcloud库的介绍

  jieba 库的分词原理是利用一个中文词库,将待分词的内容与分词词库进行比对,通过图结构和动态规划方法找到最大概率的词组;除此之外,jieba 库还提供了增加自定义中文单词的功能。

  wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本。

2.安装jieba库与wordcloud库

  在运行里输入 pip install wordcloud和pip install jieba,等待安装完成。

二、jieba函数介绍

技术图片

三、调用库函数

from wordcloud import WordCloud
with open("斗破苍穹.txt" ,encoding="utf-8")as file:
    #1.读取文本内容
    text=file.read()
    #2.设置词云的背景颜色、宽高、字数
    wordcloud=WordCloud(font_path="C:/Windows/Fonts/simfang.ttf",
    background_color="black",width=600,
    height=300,max_words=50).generate(text)
    #3.生成图片
    image=wordcloud.to_image()
    #4.显示图片
    image.show()

 

使用jieba库与wordcloud库第三方库进行词频统计

标签:height   中文   优秀   enc   设置   gen   利用   win   词语   

原文地址:https://www.cnblogs.com/loverboy88/p/10652357.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!