TF IDF介绍 TF IDF是NLP中一种常用的统计方法,用以评估一个字词对于一个文件集或一个语料库中的其中一份文件的重要程度,通常用于提取文本的特征,即关键词。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 &e ...
分类:
其他好文 时间:
2018-11-02 12:56:40
阅读次数:
275
Style:Mac Series:Java Since:2018-09-10 End:2018-09-10 Total Hours:1 Degree Of Diffculty:5 Degree Of Mastery:5 Practical Level:5 Desired Goal:5 Archiev ...
分类:
其他好文 时间:
2018-10-30 00:20:34
阅读次数:
204
pom文件中添加插件如下 settings.xml文件添加如下内容 clean deploy -Dmaven.test.skip=true ...
分类:
Web程序 时间:
2018-10-23 14:42:48
阅读次数:
229
Style:Mac Series:Java Since:2018-09-10 End:2018-09-10 Total Hours:1 Degree Of Diffculty:5 Degree Of Mastery:5 Practical Level:5 Desired Goal:5 Archiev ...
分类:
其他好文 时间:
2018-10-22 15:44:48
阅读次数:
159
#include #include #include #include using namespace std; const int maxn = 1e5 + 10; int n, m; int cnt; struct node{ int L, R;//分别指向左右子树 int sum;//该节点所... ...
分类:
其他好文 时间:
2018-10-13 22:42:50
阅读次数:
169
机器学习很多时候是在跟数学打交道,所以看书看论文肯定是必不可少的。下面是自己读过并觉得很有帮助的一些书,希望对大伙有所帮助。(请忽略糟糕的排版,这个排版功能太难用了。。) 拓扑学: Munkres J R. 《Topology》拓扑学就只看了这一本,只能说不愧是大师之作。分析学: Rudin三件套这 ...
分类:
其他好文 时间:
2018-10-08 22:18:48
阅读次数:
277
一、模块(modue) 简单理解一个.py文件就称之为一个模块。 1.1 模块种类: python标准库 第三方模板 应用程序自定义模块(尽量不要与内置函数重名) 1.2 模块导入方法 # import cul #第一种写法 from pkage11.cul import add #第二种写法 if ...
分类:
编程语言 时间:
2018-10-05 12:11:01
阅读次数:
182
对于桌面和移动平台应用 官方说明如下 Lincense 种类和费用 各种 License 的权利和服务 (这里关心的是 LGPL 下,可以动态链接 Qt 库保持软件私有) 不幸的是,有一些 Qt 库是以 GPL 的方式发布(鉴于 GPL 的传染性,就不能在私有软件中以任何方式使用这些库了,shit! ...
分类:
其他好文 时间:
2018-10-04 10:15:30
阅读次数:
221
数据预处理1、数据审核:检查数据中是否有错误 原始数据->完整性:所调查的对象是否有遗漏。 准确性:数据是否有错误、存在异常值 ->异常值 :记录错误,予以纠正;正确地值,予以保留。 二手数据->适用性:明确数据的来源、口径、背景材料,以便确定数据是否符合分析研究的需要。 时效性:对于时效性较强的问 ...
分类:
其他好文 时间:
2018-10-02 17:42:19
阅读次数:
346
转自:https://blog.csdn.net/luyllyl/article/details/79553979 ...
分类:
其他好文 时间:
2018-09-29 11:19:19
阅读次数:
1610