1.jieba的基本使用 1 import jieba 2 3 4 s1 = '我喜欢广州小蛮腰' 5 s2 = "我喜欢上海东方明珠" 6 #jieba,cut()#默认精准模式 7 print(10*'-','全模式',10*'-') 8 r1 = jieba.cut(s1,cut_all=Tr ...
分类:
其他好文 时间:
2018-07-27 14:46:26
阅读次数:
209
Python在数据分析中越来越受欢迎,已经达到了统计学家对R的喜爱程度,Python的拥护者们当然不会落后于R,开发了一个个好玩的数据分析工具,下面我们来看看如何使用Python,来读红楼梦,绘制小说中的词云。 首先当然要导入我们需要用到的包,下面import进来的包,都是我们将在接下来的程序中使用 ...
分类:
编程语言 时间:
2018-07-23 00:57:11
阅读次数:
302
词云,又称文字云、标签云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。常见于博客、微博、文章分析。 除了网上现成的Wordle、Tagxedo、Tagul、Tagcrowd等词云制作工具,在python ...
分类:
编程语言 时间:
2018-07-22 18:07:03
阅读次数:
4703
读取 Mongo 中的短评数据,进行中文分词 对分词结果取 Top50 生成词云 生成词云效果 看来网上关于 我不是药神 vs 达拉斯 的争论很热啊。关于词频统计就这些,代码中也会完成一些其它的分析任务(其实都是一些很简单的任务,纯练手用),后续会持续更新。 其它分析任务 点赞数 Top10 aut ...
分类:
编程语言 时间:
2018-07-20 01:11:04
阅读次数:
180
强哥: 50行代码实现人脸检测 基于face_recognition实现人脸识别 Python 2与Python 3的区别 Python也能聊微信 射命丸咲: Python · 神经网络(零)· 简介 第一个机器学习样例 Python:numba 的基本应用 Kenny: 挑战年薪百万-自然语言处理 ...
分类:
其他好文 时间:
2018-07-18 01:15:10
阅读次数:
278
外部环境:ubuntu16.04, 64bits, 全局环境python2.7 在虚拟环境(python3.5)中执行 pip install wordcloud 时安装失败,报错: 解决方案:在外部环境执行 sudo apt-get install python3-dev ,再在虚拟环境中重新 p ...
分类:
系统相关 时间:
2018-07-13 16:15:02
阅读次数:
1867
# 这是一个处理图像的函数from scipy.misc import imreadfrom wordcloud import WordCloud,STOPWORDS,ImageColorGeneratorimport matplotlib.pylab as plt# 解析图片back_color ...
分类:
编程语言 时间:
2018-07-12 18:03:21
阅读次数:
199
def getText(): #赋予txt哈姆雷特小说-全英文小写-全符号变空格-返回txt txt = open('hamlet.txt','r').read()#注意文本的路径 txt = txt.lower()#文本字符全部转变为小写字母 for ch in '!"#$%&()*+,-./:;... ...
分类:
编程语言 时间:
2018-07-03 21:37:19
阅读次数:
1118
很简单: 控制台输出: 耗时7.4s 文件输出: ...
分类:
编程语言 时间:
2018-06-24 11:35:15
阅读次数:
172