只有想不到,没有做不到,用python可以做哪一些有趣的事情呢?一起来看看吧!1.词云用Python读取极品家丁小说,分词后展示词云。2.分析了70多万场绝地求生的比赛数据,总结出独家吃鸡攻略分析了总共20多G、70多万场的绝地求生比赛数据,总结出各种地图哪里跳的人最多、近战最佳武器、狙击最佳武器等,程序员嘛,靠技术吃鸡也很重要。海岛地图中,跳机场跟学校是死得最快的。沙漠地图中,跳Pecado、S
分类:
编程语言 时间:
2019-10-26 22:35:41
阅读次数:
135
在前段时间看了杰昆菲尼克斯的小丑电影,心里很好奇大部分观众看完这部电影之后对此有什么评价,然后看了看豆瓣短评之后,觉得通过python把短评中出现最多的单词提取出来,做成一张词云,看看这部电影给观众们留下的关键词是什么。
分类:
其他好文 时间:
2019-10-24 00:27:01
阅读次数:
116
1.1 Solr是什么 Solr是一个基于全文检索的企业级应用服务器。可以输入一段文字,通过分词检索数据。它是单独的服务,部署在 tomcat。 1.2 为什么需要Solr 问题:我们已经学过Lucene,为什么还要学习solr? Lucene是一个工具包,不能单独运行,需要导入到java代码中。S ...
分类:
其他好文 时间:
2019-10-23 18:24:48
阅读次数:
83
词频分析,分析一段文字或者一段话每个单词出现的频率。对于英文文章,我们可以使用split()函数进行文章段落的切割,对于中文,我们可以使用jieba库进行文章段落的分割。 上面的代码就是对txt这个文本,使用jieba提供的三种分词模式进行分词,得到的结果为。 三种分词模式分别是精确模式、全模式和搜 ...
分类:
其他好文 时间:
2019-10-19 14:39:43
阅读次数:
79
附加:另一种jieba分词写法: 参考jieba中文分词:https://github.com/fxsjy/jieba ##欢迎讨论 ...
分类:
编程语言 时间:
2019-10-17 01:20:29
阅读次数:
123
1. 统计字符(可以在jieba分词之后使用) 2. 多次覆盖,循环写入文件 比如,循环两次的结果是: 3. 一次性写入文件,中间不会覆盖和多次写入;但是如果重复运行代码,则会覆盖之前的全部内容,一次性重新写入所有新内容 ...
分类:
编程语言 时间:
2019-10-16 23:20:47
阅读次数:
109
前两篇讲了solr安装和导入数据,这篇讲如何整合到SSM中。 一、整合SSM 1.1 引入依赖 1.2 初始化solr 1.3 写service 1.4 写控制层 1.5 查询 二、IK分词器 2.1.添加jar包 下载地址:https://search.maven.org/search?q=com ...
分类:
其他好文 时间:
2019-10-16 17:35:46
阅读次数:
116
本人工程实践的内容是《基于情感词典的大数据分析》,用情感词典进行情感分析的思路是:对文档分词,找出文档中的情感词、否定词以及程度副词,然后判断每个情感词之前是否有否定词及程度副词,将它之前的否定词和程度副词划分为一个组,如果有否定词将情感词的情感权值乘以-1,如果有程度副词就乘以程度副词的程度值,最 ...
分类:
其他好文 时间:
2019-10-13 15:27:52
阅读次数:
77
Solr是一个基于Lucene的Java搜索引擎服务器。Solr 提供了层面搜索、命中醒目显示并且支持多种输出格式(包括 XML/XSLT 和 JSON 格式)。它易于安装和配置,而且附带了一个基于HTTP 的管理界面。Solr已经在众多大型的网站中使用,较为成熟和稳定。Solr 包装并扩展了Luc ...
分类:
其他好文 时间:
2019-10-12 22:23:57
阅读次数:
131
一、安装IK分词器 Elasticsearch也需要安装IK分析器以实现对中文更好的分词支持。 去Github下载最新版elasticsearch-ik https://github.com/medcl/elasticsearch-analysis-ik/releases 将ik文件夹放在elast ...
分类:
其他好文 时间:
2019-10-10 19:54:03
阅读次数:
471