在数据采集及大数据处理的时候,数据排重、相似度计算是很重要的一个环节,由此引入相似度计算算法。常用的方法有几种:最长公共子串(基于词条空间)、最长公共子序列(基于权值空间、词条空间)、最少编辑距离法(基于词条空间)、汉明距离(基于权值空间)、余弦值(基于权值空间)等,今天我们着重介绍最后两种方式。余...
分类:
编程语言 时间:
2014-12-25 01:23:26
阅读次数:
506
转载请注明原地址:http://www.cnblogs.com/connorzx/p/4170043.html基本思想建立一个字典向量,字典里包含这种语言的所有词组;统计各个词组的出现次数,填充到对应词组的位置,构成文本的特征向量;两个特征向量之间用余弦定理求夹角。这个值表明向量之间的相关程度。之所...
分类:
其他好文 时间:
2014-12-17 20:36:01
阅读次数:
114
转载请注明原地址:http://www.cnblogs.com/connorzx/p/4170047.html提出原因基于余弦定理对文本和词汇的处理需要迭代的次数太多(具体见14章笔记),为了找到一个一步到位的办法,可以使用奇异值分解(SVD分解)算法实现建立一个M-by-N的矩阵A,其中行表示M篇...
分类:
其他好文 时间:
2014-12-17 20:22:05
阅读次数:
154
向量P = (Px Py Pz), Q = (Qx Qy Qz);规定向量的点乘 PQ = (PxQx PyQy PzQz);那么点乘的值等于什么呢, 是怎么推导出来的呢, 下面我们看一下:
1: 首先回顾下中学学习的余弦定理, 对于一个三角形有三条边a, b, c; 并且a, b之间夹角为@, 则有:
c^2 = a^2 + b^2 - 2...
分类:
其他好文 时间:
2014-11-25 23:33:00
阅读次数:
309
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=4082题目大意:给你n个点,问能最多构成多少个相似三角形。用余弦定理,计算三个角度,然后暴力数有多少个,更新答案。代码: 1 #include 2 #include 3 #include 4...
分类:
其他好文 时间:
2014-11-08 23:28:31
阅读次数:
316
题目大意:n个圆盘依次下落,求最终能看到的轮廓线面积
円盘反对!让我们一起团结起来!赶走円盘!
咳咳。很神的一道题 今天去看了题解和白书才搞出来……
首先我们倒着做 对于每个圆盘处理出在它之后落下的圆盘和它的覆盖区间 然后求一个区间并就能算出这个圆盘的可见弧长
然后就是相交部分怎么求的问题了
首先两个圆必须相交 然后作圆心1到圆心2的向量 用atan2求出极角 然后利用余弦定理求出两个交...
分类:
其他好文 时间:
2014-10-29 09:17:04
阅读次数:
160
题目大意:给出一些圆盘,他们按照时间顺序相互覆盖,问最后的到的图形的可见圆周的周长是多少。
前言:円盘反对!让我们一起团结起来!赶走円盘!
思路:对于每一个圆盘,只要扫描在它后面出现的圆与它交的部分的并,总周长-相交的并就是剩下能看见的圆周的长度,然后累加到答案中。
对于两个圆的交,我们可以用一个有序数对(x,y)以弧度为单位来表示,这样所有的xy都在0~2π区间之内。求角度就利用余...
分类:
其他好文 时间:
2014-10-29 09:16:54
阅读次数:
236
Regular PolygonTime Limit: 2000/1000 MS (Java/Others)Memory Limit: 65768/65768 K (Java/Others)Total Submission(s): 3274Accepted Submission(s): 996Prob...
分类:
其他好文 时间:
2014-10-20 09:51:22
阅读次数:
223
TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。权重计算方法经常会和余弦相似度(cosine similarity)一同使用于向量空间模型中,用以判断两份文件之间的相似性。应用到余弦定理到新闻分类的算法模拟程序...
分类:
Web程序 时间:
2014-09-20 01:12:26
阅读次数:
370
1 //Accepted 0 KB 60 ms 2 //给出正多变形上的三个点,求正多形的最小面积 3 //记三个点之间的距离a,b,c; 4 //由余弦定理得cosA 5 //从而可求出sinA,和正多边形所在外接圆的半径r 6 //设三条边所对的圆心角为:theta1,theta2...
分类:
其他好文 时间:
2014-09-13 21:25:15
阅读次数:
267