码迷,mamicode.com
首页 > 其他好文 > 详细

对采集的游记进行数据分析

时间:2020-01-29 14:17:43      阅读:104      评论:0      收藏:0      [点我收藏+]

标签:path   cab   win   cloud   rac   idf   pre   from   分析   

使用jieba模块对内容进行处理,在tfidf.py源码中加入一些自定义的停用词,然后将生成的列表词组使用WordCloud展示出来

 

from jieba import analyse
# 引入TF-IDF关键词抽取接口
tfidf = analyse.extract_tags

import matplotlib.pyplot as plt
from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator
import jieba
from scipy.misc import imread
d = os.path.dirname(__file__)
font = r‘C:\Windows\Fonts\00CAB71B.007.ttf‘

技术图片 

对游记中出现的地名统计发现:

技术图片

 

 在地图中的位置如下:

技术图片

对采集的游记进行数据分析

标签:path   cab   win   cloud   rac   idf   pre   from   分析   

原文地址:https://www.cnblogs.com/qqzj/p/7726711.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!