码迷,mamicode.com
首页 >  
搜索关键字:jieba    ( 462个结果
有txt文本和图片,就能用python生成词云图
使用现有的txt文本和图片,就可以用wordcloud包生成词云图。大致步骤是: 1、读取txt文本并简单处理; 2、读取图片,以用作背景; 3、生成词云对象,保存为文件。 需要用到3个库:jieba(用于分割文本为词语)、imageio(用于读取图片)、wordcloud(功能核心,用于生成词云) ...
分类:编程语言   时间:2020-05-18 20:33:48    阅读次数:105
Python——jieba库初使用
“从来不是让你把一次考试当成人生成败的赌注,只是想让你在足够年轻的时候体会一次全力以赴。”——《请回答1988》 ...
分类:编程语言   时间:2020-05-09 17:21:54    阅读次数:166
jieba库的分词和词云
1.分词 #DreaminRedMansions.py import jieba #调用jieba库 txt = open("D:\Download\lianxii\passageone.txt","r",encoding="UTF-8").read() #打开txt文件阅读 words = jie ...
分类:其他好文   时间:2020-05-06 19:52:48    阅读次数:55
python jieba
分词 关键词提取 停用词 stop_word.csv ...
分类:编程语言   时间:2020-05-06 01:37:38    阅读次数:74
NLP gensim 相似度计算
```python from collections import defaultdict from gensim import corpora import jieba from gensim import similarities import re class Similarity: def ... ...
分类:其他好文   时间:2020-05-06 01:08:10    阅读次数:52
DJANGO-天天生鲜项目从0到1-009-搜索功能实现(django-haystack+whoosh+jieba)
一般搜索功能架构为:搜索框架+搜索引擎(包括分词方式) 这里搜索框架选择: django-haystack:是django的开源搜索框架,该框架支持Solr,Elasticsearch,Whoosh, *Xapian*搜索引擎,不用更改代码,直接切换引擎,减少代码量。 搜索引擎使用: Whoosh: ...
分类:其他好文   时间:2020-05-03 16:23:11    阅读次数:57
【Python】政府工作报告词云
2019政府工作报告.txt https://www.lanzous.com/iby44eh 栗子1: import wordcloud import jieba f=open("2019政府工作报告.txt","r",encoding="utf-8") t=f.read() f.close() l ...
分类:编程语言   时间:2020-04-26 13:52:07    阅读次数:478
jieba库的使用和好玩的词云
jieba库的使用和好玩的词云 一、jieba库使用 (1)安装: 输入命令:pip install jieba(如图:在后面加上所示网址超级快) (2)jieba库常用函数 jieba库分词的三种模式: 1、精准模式:把文本精准地分开,不存在冗余 2、全模式:把文中所有可能的词语都扫描出来,存在冗 ...
分类:其他好文   时间:2020-04-19 01:08:27    阅读次数:123
我的紫川词云
源代码 import jiebaimport wordcloudfc=open('紫川.txt','r',encoding='utf-8')q=fc.read()fc.close()words=jieba.lcut(q)txt=' '.join(words)w=wordcloud.WordCloud ...
分类:其他好文   时间:2020-04-13 19:52:18    阅读次数:54
运用结巴库分析三国演义的人物出场次数
import jieba txt = open("D:\\三国演义.txt", "r", encoding='ANSI').read() words = jieba.lcut(txt) # 使用精确模式对文本进行分词 counts = {} # 通过键值对的形式存储词语及其出现的次数 for wor ...
分类:其他好文   时间:2020-04-13 16:43:10    阅读次数:204
462条   上一页 1 ... 3 4 5 6 7 ... 47 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!