用户使用手册在 https://www.cnblogs.com/yiduobaozhiblog1/p/9180444.html 以下为测试报告 一、总体测试计划 总体的测试计划围绕黑盒测试以及使用测试工具进行,将项目分享给朋友进行相关功能的测试并搜集相关反馈,然后根据用户提供的建议进行项目的完善。 ...
分类:
其他好文 时间:
2018-06-13 23:37:03
阅读次数:
217
一、总体测试计划 总体的测试计划围绕黑盒测试以及使用测试工具进行,将项目分享给朋友进行相关功能的测试并搜集相关反馈,然后根据用户提供的建议进行项目的完善。 二、bug记录 以下是还在解决的bug (1)当网站在不同屏幕大小时,界面会乱,没有随窗口大小改变页面内容大小 (2)移动端登录页面看不到用户账 ...
分类:
其他好文 时间:
2018-06-13 22:20:42
阅读次数:
223
1. 问题描述 给你若干篇文档,找出这些文档中最相似的两篇文档? 相似性,可以用距离来衡量。而在数学上,可使用余弦来计算两个向量的距离。 $$cos(\vec a, \vec b)=\frac {\vec a \vec b}{||\vec a|| ||\vec b||}$$ 因此,用向量来表示文档, ...
分类:
其他好文 时间:
2018-04-01 21:51:56
阅读次数:
220
主要知识点: boolean model IF/IDF vector space model 一、boolean model 在es做各种搜索进行打分排序时,会先用boolean model 进行初步的筛选,boolean model类似and这种逻辑操作符,先过滤出包含指定term的doc。mus... ...
分类:
编程语言 时间:
2018-03-08 13:52:33
阅读次数:
159
对标题党新闻识别技术的相关知识进行研究和总结,包括网页去噪工作原理、向量空间模型和矩阵的奇异值分解的相关知识。了解基于潜在语义分析的标题党识别系统,学习其相关技术,包括向量空间模型的构建、基于SVD的塌陷矩阵构建模块和基于LSA算法的标题党新闻判定模块。 主要工作内容:数据集特征分析及模型训练大神给 ...
分类:
其他好文 时间:
2018-02-23 12:06:59
阅读次数:
184
Solr 4及之前的版本默认采用VSM(向量空间模型)进行相似度的计算(或打分)。之后的版本,则采用Okapi BM25(一种二元独立模型的扩展),属于概率模型。 ...
分类:
编程语言 时间:
2018-02-02 18:39:23
阅读次数:
430
版权声明:本文为博主原创文章,地址:http://blog.csdn.net/napoay,转载请留言。 总结Jackcard类似度和余弦类似度。 一、集合的Jackcard类似度 1.1Jackcard类似度 Jaccard类似指数用来度量两个集合之间的类似性,它被定义为两个集合交集的元素个数除以 ...
分类:
编程语言 时间:
2017-08-19 21:14:29
阅读次数:
200
版权声明:本文为博主原创文章,地址:http://blog.csdn.net/napoay,转载请留言。 总结Jackcard类似度和余弦类似度。 一、集合的Jackcard类似度 1.1Jackcard类似度 Jaccard类似指数用来度量两个集合之间的类似性,它被定义为两个集合交集的元素个数除以 ...
分类:
编程语言 时间:
2017-08-13 14:20:12
阅读次数:
292
建立文本数据数学描写叙述的过程分为三个步骤:文本预处理、建立向量空间模型和优化文本向量。文本预处理主要採用分词、停用词过滤等技术将原始的文本字符串转化为词条串或者特点的符号串。文本预处理之后,每个文本的词条串被进一步转换为一个文本向量,向量的每一维相应一个词条,其值反映的是这个词条与这个文本之间的类 ...
分类:
其他好文 时间:
2017-07-15 15:57:24
阅读次数:
182
理论參考文献:但此文没有代码实现。这里自己实现一下,让理解更为深刻 问题:如果在IR中我们建立的文档-词项矩阵中,有两个词项为“learn”和“study”,在传统的向量空间模型中,觉得两者独立。然而从语义的角度来讲。两者是相似的。并且两者出现频率也类似,是不是能够合成为一个特征呢? 《模型选择和规 ...
分类:
编程语言 时间:
2017-06-03 21:42:24
阅读次数:
518