环境及模块: Win7 64位 Python 3.6.4 WordCloud 1.5.0 Pillow 5.0.0 Jieba 0.39 目标: 绘制安徽省2018年某些科技项目的词云,直观展示热点。 思路: 先提取项目的名称,再用Jieba分词后提取词汇;过滤掉“研发”、“系列”等无意义的词;最后 ...
分类:
编程语言 时间:
2019-01-08 15:32:26
阅读次数:
254
本文旨在提供爬取豆瓣电影《我不是药神》评论和词云展示的代码样例 1、分析URL 2、爬取前10页评论 3、进行词云展示 1、分析URL 我不是药神 短评 第一页url https://movie.douban.com/subject/26752088/comments?start=0&limit=2 ...
分类:
编程语言 时间:
2019-01-07 01:37:06
阅读次数:
537
1、引入 npm 安装: npm install js2wordcloud --save 通过script引入: <script src="dist/js2wordcloud.min.js"></script> 2、用法类似如下 html: <div id="friendsWordCloud" cl ...
分类:
Web程序 时间:
2019-01-03 16:39:24
阅读次数:
1057
wordcloud参数简单介绍 font_path : string //字体路径,需要展现什么字体就把该字体路径+后缀名写上,如:font_path = '黑体.ttf' width : int (default=400) //输出的画布宽度,默认为400像素 height : int (defa ...
分类:
其他好文 时间:
2018-12-28 13:29:32
阅读次数:
1173
中文分词的优秀库。 安装:pip install jieba 主要有三种模式,但是最主要有一个函数 模式:精确模式:把文本精确的切分开,不存在冗余单词 全模式:把文本中所有可能的词语都扫描出来,有冗余 搜索引擎模式:在精确模式上,对长词再次切分 函数:jieba.lcut(str):精确模式,返回一 ...
分类:
其他好文 时间:
2018-12-25 23:42:29
阅读次数:
260
from pyecharts import WordCloud import jieba import re import nltk with open(r'F:\算法\others\merry.txt', 'r', encoding='utf-8') as f: text = f.readline... ...
分类:
其他好文 时间:
2018-12-25 18:14:43
阅读次数:
398
see also: https://www.jianshu.com/p/a60b6ef1e6f6 ...
分类:
微信 时间:
2018-12-11 13:50:43
阅读次数:
424
01 前言+展示 各位小伙伴我又来啦。今天带大家玩点好玩的东西,用Python抓取我们的微信好友个性签名,然后制作词云。怎样,有趣吧~好了,下面开始干活。我知道你们还是想先看看效果的。 后台登录: 词云: 02 环境准备 Python版本:3.6.0系统平台:Windows 10 X64IDE:py ...
分类:
微信 时间:
2018-11-27 22:51:48
阅读次数:
252
使用抓包工具 charles 抓取qq音乐客户端 爬虫代码: 数据样例 ...
分类:
其他好文 时间:
2018-11-26 02:11:30
阅读次数:
284