码迷,mamicode.com
首页 >  
搜索关键字:高维数据    ( 99个结果
【Similarity Search】多探头LSH——构建高维相似性搜索的高效索引
摘要 针对高维数据的相似性索引非常适于构建内容相关的检索系统,尤其对于音频、图像、视频等内容丰富的数据。近年来,位置敏感哈希及其变种算法以近似相似性搜索的索引技术被提出,这些方法的一个显著缺点是需要很多的哈希表来保证良好的搜索效果。该文章提出了一个新的索引策略来克服上述缺点,称作多探头LSH。 多探头LSH建立在LSH技术基础上,它可以智能地探测哈希表中可能包含查询结果的多个桶(bucke...
分类:其他好文   时间:2015-03-05 12:57:26    阅读次数:217
高维数据的重要属性
高维数据的重要属性:数据集的大小随着维数呈指数级增长。在高维样本空间中,需要一个更大的数据才能把小部分的数据放入。在高维度空间中,几乎每一个点都比其他样本点更接近于某一边界。几乎每一个点都是异常点。随着维数的增加,数据密度会越来越小,稀疏。如果样本没增加,只是增加维数,就会导致最终任意两个样本点的距...
分类:其他好文   时间:2015-02-09 18:07:39    阅读次数:113
[转]LLE
原始特征的数量可能很大,或者说样本是处于一个高维空间中,通过映射或变换的方法,降高维数据降低到低维空间中的数据,这个过程叫特征提取,也称降维。 特征提取得基本任务研究从众多特征中求出那些对分类最有效的特征,从而实现特征空间维数的压缩。传统的降维技术可以分为线性和非线性两类。(1)线性降维算法主要有P...
分类:其他好文   时间:2014-12-06 20:14:58    阅读次数:234
Kd-Tree算法原理和开源实现代码
本文介绍一种用于高维空间中的快速最近邻和近似最近邻查找技术——Kd-Tree(Kd树)。Kd-Tree,即K-dimensional tree,是一种高维索引树形数据结构,常用于在大规模的高维数据空间进行最近邻查找(Nearest Neighbor)和近似最近邻查找(Approximate Nearest Neighbor),例如图像检索和识别中的高维图像特征向量的K近邻查找与匹配。本文首先介...
分类:编程语言   时间:2014-10-22 11:03:01    阅读次数:368
降维中的特征选择(转)
在数据挖掘过程中,高维数据是非常棘手的研究对象。特别是在文本挖掘、图像处理和基因数据分析中,维度过高使很多学习器无法工作或效率降低,所以降维也是数据预处理过程的一项必要任务。降维大致有两大类别,一类是从原始维度中提取新的维度,例如主成分分析或因子分析,再或者是奇异值分解或是多维标度分析。另一类是从原...
分类:其他好文   时间:2014-09-17 11:52:32    阅读次数:928
VQ结合SVM分类方法
今天整理资料时,发现了在学校时做的这个实验,当时整个过程过重偏向依赖分类器方面,而又很难对分类器本身性能进行一定程度的改良,所以最后没有选用这个方案,估计以后也不会接触这类机器学习的东西了,希望它对刚入门的人有点用。          SVM比较适合高维数据的二分类,本来准备对语音特征直接用SVM进行二分类,但是发现样本数据比较多,训练的2天都没有出收敛,最后想用VQ聚类的方法先抽取出具有代...
分类:其他好文   时间:2014-08-12 13:35:54    阅读次数:306
VQ结合SVM分类方法
今天整理资料时,发现了在学校时做的这个实验,当时整个过程过重偏向依赖分类器方面,而自己又很难对分类器性能进行一定程度的改良,所以最后没有选用这个方案,估计以后也不会接触这类机器学习的东西了,希望它对刚入门的人有点用。 SVM比较适合高维数据的二分类,本来准备对语音特征直接用SVM进行二分类,但是发....
分类:其他好文   时间:2014-08-12 12:53:24    阅读次数:210
高维数据的快速最近邻算法FLANN
高维数据的可伸缩最近邻算法FLANN 1.     简介 在计算机视觉和机器学习中,对于一个高维特征,找到训练数据中的最近邻计算代价是昂贵的。对于高维特征,目前来说最有效的方法是 the randomized k-d forest和the priority search k-means tree,而对于二值特征的匹配 multiple hierarchical clusteringtrees则...
分类:其他好文   时间:2014-07-15 10:42:24    阅读次数:727
主成分分析(PCA)
相对与网上很多人分享的有关PCA的经历,我第一次接触PCA却不是从人脸表情识别开始的,但我所在的实验室方向之一是人脸的研究,最后也会回到这个方向上来吧。PCA(principal components analysis)是一种非常有用的统计技术,它已经应用于人脸识别和图像压缩领域中,并且是高维数据计...
分类:其他好文   时间:2014-07-07 21:46:40    阅读次数:1324
99条   上一页 1 ... 8 9 10
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!