码迷,mamicode.com
首页 >  
搜索关键字:jieba    ( 462个结果
Jieba分词——三国演义上卷节选
import jieba path = 'C:\\Users\\Administrator\\Desktop\\3国演义.txt' text = open(path,'r',encoding='utf-8').read() words = jieba.lcut(text) excludes = [' ...
分类:其他好文   时间:2020-04-07 09:31:11    阅读次数:75
jieba库使用和好玩的词云
《决胜全面建成小康社会 夺取新时代中国特色社会主义伟大胜利》 1 import jieba 2 import wordcloud 3 f=open("C:\\Users\\Administrator\\Downloads\\python\\新建文本文档.txt","r",encoding="UTF- ...
分类:其他好文   时间:2020-04-06 23:59:52    阅读次数:134
运用jieba库进行词频统计
Python第三方库jieba(中文分词) 一、概述 jieba是优秀的中文分词第三方库- 中文文本需要通过分词获得单个的词语- jieba是优秀的中文分词第三方库,需要额外安装- jieba库提供三种分词模式,最简单只需掌握一个函数 二、安装说明 全自动安装:(cmd命令行) pip instal ...
分类:其他好文   时间:2020-04-06 09:53:55    阅读次数:368
西游记 词频统计
1 import jieba 2 txt=open("D://python_common_exercise//west_journey.txt",'r',encoding="utf-8").read() 3 words=jieba.lcut(txt) #jieba库函数 4 count={} #创建 ...
分类:其他好文   时间:2020-04-05 18:29:41    阅读次数:148
Python词云
from PIL import Image from wordcloud import WordCloud, ImageColorGenerator import matplotlib.pyplot as plt import numpy as np import jieba def GetWord ...
分类:编程语言   时间:2020-04-03 18:22:11    阅读次数:71
中文分词工具简介与安装教程(jieba、nlpir、hanlp、pkuseg、foolnltk、snownlp、thulac)
2.1 jieba 2.1.1 jieba简介 Jieba中文含义结巴,jieba库是目前做的最好的python分词组件。首先它的安装十分便捷,只需要使用pip安装;其次,它不需要另外下载其它的数据包,在这一点上它比其余五款分词工具都要便捷。另外,jieba库支持的文本编码方式为utf-8。 Jie ...
分类:其他好文   时间:2020-03-31 14:23:24    阅读次数:282
Python实现Wordcloud生成词云图的示例
wordcloud是Python扩展库中一种将词语用图片表达出来的一种形式,通过词云生成的图片,我们可以更加直观的看出某篇文章的故事梗概。 首先贴出一张词云图(以哈利波特小说为例): 在生成词云图之前,首先要做一些准备工作 1.安装结巴分词库 pip install jieba Python中的分词 ...
分类:编程语言   时间:2020-03-30 16:11:09    阅读次数:85
【PythonCoach】WordCloud教程(上)
大家可能会问:一上来就讲Wordcloud,会很难学习的! 不用怕,我们就通过这个案例来告诉大家Python的知识,准备好了吗?开车喽! 先贴代码: import wordcloud,jieba with open('datas/1.txt') as rt:#,encoding='utf-8' co ...
分类:编程语言   时间:2020-03-30 12:40:17    阅读次数:96
Python - 利用词云wordcloud,jieba和中国地图制作四大名著的热词图
热词图很酷炫,也非常适合热点事件,抓住重点,以图文结合的方式表现出来,很有冲击力。下面这段代码是制作热词图的,用到了以下技术:jieba,把文本分词wordcloud,制作热图chardet,辨别文件的编码格式,其中中文统一为GB18030,更加的兼容imageio,提取图片的形状其他:自动识别文件 ...
分类:编程语言   时间:2020-03-30 00:01:50    阅读次数:476
jieba库的使用及实例
安装: cmd模式下输入 pip install jieba anaconda对应环境 conda install jieba 分词原理: Jieba分词依靠中文词库 -利用一个中文词库,确定汉字之间的关联概率 -汉字间概率大的组成词组,形成分词结果 -除了分词,用户还可以添加自定义的词组 jieb ...
分类:其他好文   时间:2020-03-28 18:10:53    阅读次数:563
462条   上一页 1 ... 5 6 7 8 9 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!