码迷,mamicode.com
首页 >  
搜索关键字:相似度    ( 854个结果
最长公共子序列---动态规划
一: 作用 最长公共子序列的问题常用于解决字符串的相似度,是一个非常实用的算法,作为码农,此算法是我们的必备基本功。二:概念 举个例子,cnblogs这个字符串中子序列有多少个呢?很显然有27个,比如其中的cb,cgs等等都是其子序列,我们可以看出子序列不见得一定是连续的,连续的那是子串。 ...
分类:其他好文   时间:2014-06-17 00:37:40    阅读次数:258
POJ 2485 Highways && HDU1102(20/200)
题目链接:Highways 没看题,看了输入输出,就有种似曾相识的感觉,果然和HDU1102 题相似度99%,但是也遇到一坑 cin输入竟然TLE,cin的缓存不至于这么狠吧,题目很水,矩阵已经告诉你了,就敲个模板就是了,5分钟,1A 题意就是打印,最小生成树的最大边权,改了改输入,水过 这个题完了,我的个人POJ计划进度以完成 20/200,这其中主要是图论的题,等下周把...
分类:其他好文   时间:2014-06-16 20:15:56    阅读次数:221
Mahout协同过滤框架Taste的源码分析
推荐过程主要分成了如下几步来完成推荐1. 输入数据预处理2. 获取评分矩阵3. 计算物品相似度4. 矩阵乘法5. 数据过滤6. 计算推荐 测试数据user&item12345 133320 244400 355503 444414 继...
分类:其他好文   时间:2014-06-13 20:16:26    阅读次数:226
php-数据分析 余弦相似度实现
php-数据分析 余弦相似度实现 <?php /** * 数据分析引擎 * 分析向量的元素 必须和基准向量的元素一致,取最大个数,分析向量不足元素以0填补。 * 求出分析向量与基准向量的余弦值 * @author yu.guo@okhqb.com */...
分类:Web程序   时间:2014-06-08 17:33:51    阅读次数:210
Tanimoto相似度与Bregman距离
之前写过一篇距离与相似性度量的blog,这里添加两个少见的相似性度量方法,并且再扩展一些东西。 Tanimoto系数由Jaccard系数扩展而来。用来计算稀疏非二值不平衡向量的相似性,类似cosine距离 Bregman距离是一个数学通式,许多的距离,如欧式距离,KL距离等等都可以有Bregman公式推导而来。...
分类:其他好文   时间:2014-06-08 15:34:45    阅读次数:457
视频质量诊断----画面冻结检测
画面冻结是由于画面场景没有变化,而仅仅是画面中的时间有变化的情况。此现象需要多帧图像才能检测出来。原理每隔T帧从视频中取一帧(防止相邻帧太相似引起误检)。对所取的每帧求直方图。求相邻2帧直方图的相似度。当相似度大于A时认为二帧一致,当一致的帧达到B时认为画面发生冻结。三、结果演示Demo演示下载地址...
分类:其他好文   时间:2014-06-05 15:17:13    阅读次数:296
视频质量诊断----PTZ云台运动检测
PTZ云台运动检测是通过配合云台运动的功能检测云台运动是否正常。 原理 取云台运动前N帧图像,进行背景建模,得到运动前背景A。 设备发送云台运动指令,让云台进行运动,改变场景。 取云台运动后N帧图像,进行背景建模,得到运动后背景B。 对比A,B颜色直方图的相似度,大于K时认为PTZ云台运动有故障。 ...
分类:其他好文   时间:2014-06-05 15:12:40    阅读次数:371
OpenCV2马拉松第12圈——直方图比較
收入囊中使用4种不同的方法进行直方图比較葵花宝典要比較两个直方图, 首先必需要选择一个衡量直方图相似度的对照标准。也就是先说明要在哪个方面做对照。我们能够想出非常多办法,OpenCV採用了下面4种公式也都不难,我们自己就能实现。d越小,表示差异越低,两幅图像越接近,越相似初识APIC++:doubl...
分类:其他好文   时间:2014-06-02 19:22:14    阅读次数:194
浅谈文本的相似度问题
今天要研究的问题是如何计算两个文本的相似度。正如上篇文章描述,计算文本的相似度在工程中有着重要的应用, 比如文本去重,搜索引擎网页判重,论文的反抄袭,ACM竞赛中反作弊等等。   上篇文章介绍的SimHash算法是比较优秀的文档判重算法,它能处理海量文本的判重,Google搜索引擎也正是用这 个算法来处理网页的重复问题。实际上,仅拿文本的相似度计算来说,有很多算法都能解决这个问题,并且都达...
分类:其他好文   时间:2014-06-02 15:15:39    阅读次数:200
SimHash算法
首先,SimHash算法主要是用于文本去重的。文本去重的第一步就是判断文本的相似度,如果两个文本的相似度很 高,那么我们可以认为它们是相同的文本。   对于文本相似度的计算,传统的方法是使用向量空间模型,即Vector Space Model,即VSM,VSM计算文本相似度 的方法是这样的:先对文本进行分词,提取出特征词,然后建立文本向量,把相似度的计算转化成某种特征向量距离 的计算,比...
分类:其他好文   时间:2014-06-02 05:02:30    阅读次数:500
854条   上一页 1 ... 82 83 84 85 86 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!