import jieba path = 'C:\\Users\\Administrator\\Desktop\\3国演义.txt' text = open(path,'r',encoding='utf-8').read() words = jieba.lcut(text) excludes = [' ...
分类:
其他好文 时间:
2020-04-07 09:31:11
阅读次数:
75
《决胜全面建成小康社会 夺取新时代中国特色社会主义伟大胜利》 1 import jieba 2 import wordcloud 3 f=open("C:\\Users\\Administrator\\Downloads\\python\\新建文本文档.txt","r",encoding="UTF- ...
分类:
其他好文 时间:
2020-04-06 23:59:52
阅读次数:
134
Python第三方库jieba(中文分词) 一、概述 jieba是优秀的中文分词第三方库- 中文文本需要通过分词获得单个的词语- jieba是优秀的中文分词第三方库,需要额外安装- jieba库提供三种分词模式,最简单只需掌握一个函数 二、安装说明 全自动安装:(cmd命令行) pip instal ...
分类:
其他好文 时间:
2020-04-06 09:53:55
阅读次数:
368
1 import jieba 2 txt=open("D://python_common_exercise//west_journey.txt",'r',encoding="utf-8").read() 3 words=jieba.lcut(txt) #jieba库函数 4 count={} #创建 ...
分类:
其他好文 时间:
2020-04-05 18:29:41
阅读次数:
148
from PIL import Image from wordcloud import WordCloud, ImageColorGenerator import matplotlib.pyplot as plt import numpy as np import jieba def GetWord ...
分类:
编程语言 时间:
2020-04-03 18:22:11
阅读次数:
71
2.1 jieba 2.1.1 jieba简介 Jieba中文含义结巴,jieba库是目前做的最好的python分词组件。首先它的安装十分便捷,只需要使用pip安装;其次,它不需要另外下载其它的数据包,在这一点上它比其余五款分词工具都要便捷。另外,jieba库支持的文本编码方式为utf-8。 Jie ...
分类:
其他好文 时间:
2020-03-31 14:23:24
阅读次数:
282
wordcloud是Python扩展库中一种将词语用图片表达出来的一种形式,通过词云生成的图片,我们可以更加直观的看出某篇文章的故事梗概。 首先贴出一张词云图(以哈利波特小说为例): 在生成词云图之前,首先要做一些准备工作 1.安装结巴分词库 pip install jieba Python中的分词 ...
分类:
编程语言 时间:
2020-03-30 16:11:09
阅读次数:
85
大家可能会问:一上来就讲Wordcloud,会很难学习的! 不用怕,我们就通过这个案例来告诉大家Python的知识,准备好了吗?开车喽! 先贴代码: import wordcloud,jieba with open('datas/1.txt') as rt:#,encoding='utf-8' co ...
分类:
编程语言 时间:
2020-03-30 12:40:17
阅读次数:
96
热词图很酷炫,也非常适合热点事件,抓住重点,以图文结合的方式表现出来,很有冲击力。下面这段代码是制作热词图的,用到了以下技术:jieba,把文本分词wordcloud,制作热图chardet,辨别文件的编码格式,其中中文统一为GB18030,更加的兼容imageio,提取图片的形状其他:自动识别文件 ...
分类:
编程语言 时间:
2020-03-30 00:01:50
阅读次数:
476
安装: cmd模式下输入 pip install jieba anaconda对应环境 conda install jieba 分词原理: Jieba分词依靠中文词库 -利用一个中文词库,确定汉字之间的关联概率 -汉字间概率大的组成词组,形成分词结果 -除了分词,用户还可以添加自定义的词组 jieb ...
分类:
其他好文 时间:
2020-03-28 18:10:53
阅读次数:
563