英文词频检测程序 本软件具有以下功能:1.检测一个文档中出现过的所有单词及词频数2.检测一个文档中停用部分词后所有的单词数及词频数3.检测一个文档中和另外一个词表对比之后超纲的词及词频数,本功能可用于英语试卷的智能分析4.检测一个文档中各种词的变化形式,包括复数、不规则、过去分词、现在分词、比较级和 ...
分类:
其他好文 时间:
2017-09-08 21:38:14
阅读次数:
146
英文词频检测程序 本软件具有以下功能:1.检测一个文档中出现过的所有单词及词频数2.检测一个文档中停用部分词后所有的单词数及词频数3.检测一个文档中和另外一个词表对比之后超纲的词及词频数,本功能可用于英语试卷的智能分析4.检测一个文档中各种词的变化形式,包括复数、不规则、过去分词、现在分词、比较级和 ...
分类:
其他好文 时间:
2017-09-08 20:34:18
阅读次数:
102
最近很想看的一个电影,去知乎上看一下评论,刚好在学Python爬虫,就做个小实例。 代码基于第三方修改 原文链接 http://python.jobbole.com/88325/#comment-94754 ...
分类:
编程语言 时间:
2017-09-05 19:00:42
阅读次数:
138
原因在于在function.php函数中加入了下面的代码导致了缓慢: //停用版本更新通知remove_action('load-update-core.php', 'wp_update_themes'); add_filter('pre_site_transient_update_themes', ...
分类:
其他好文 时间:
2017-09-03 14:16:20
阅读次数:
181
Linux默认允许任何人按下Ctrl+Alt+Del来重启系统。但是在生产环境中,应该停用按下Ctrl-Alt-Del 重启系统的功能。前面的centos版本都是在/etc/inittab中配置,而centos7/RHEL7查看/etc/inittab文件,“Ctrl-Alt-Delete is h ...
分类:
系统相关 时间:
2017-08-30 13:08:07
阅读次数:
576
最近不知道安装了什么插件导致没有chrome浏览器打开时都会提示“请停用以开发者模式运行的扩展程序”的提示,只有每次点击取消之后才能正常使用扩展。如下图所示每次都要去手动把这个关掉,我都快要吐了。。。在http://www.cnplugins.com/tool/stop-developer-mode ...
分类:
其他好文 时间:
2017-08-16 17:28:54
阅读次数:
682
概念 1、语料库-Corpus 语料库是我们要分析的所有文档的集合,就是需要为哪些文档来做词频 2、中文分词-Chinese Word Segmentation 指的是将一个汉字序列切分成一个一个单独的词语。 3、停用词-Stop Words 数据处理的时候,自动过滤掉某些字或词,包括泛滥的词如We ...
分类:
编程语言 时间:
2017-08-15 23:32:31
阅读次数:
975
接着上篇的说的,爬取了大数据相关的职位信息,http://www.17bigdata.com/jobs/。 词云如图所示: 可以看出有些噪声词没能被去除,比如相关、以上学历等无效词汇。本想通过DF判断停用词,但是我爬的时候没顾及到这个问题,外加本身记录数也不高,就没再找职位信息的停用词。当然也可看出 ...
分类:
编程语言 时间:
2017-08-10 13:41:19
阅读次数:
165
Lucene 是apache下的一个开源的全文检索引擎工具包(类库)。它的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能。 它只是一个工具包,并不是一个完整的搜索引擎 全文检索 全文检索首先将要查询的目标文档中的词提取出来,组成索引,通过查询索引达到搜索目标文档 ...
分类:
Web程序 时间:
2017-08-06 00:50:30
阅读次数:
316
在linux的世界里。给主机设置固定ip是这么做的(使用root用户): 1.查看要配的网络接口 用ifconfig查看查看在用的网卡接口,一般都用第一个如:eth0,en1,em1等 2.停用网络自己主动配置(假设有的话) systemctl stop NetworkManager.service ...
分类:
其他好文 时间:
2017-07-28 13:32:50
阅读次数:
141