码迷,mamicode.com
首页 >  
搜索关键字:高维数据    ( 99个结果
特征选取--卡方选择器
特征选择(Feature Selection)指的是在特征向量中选择出那些“优秀”的特征,组成新的、更“精简”的特征向量的过程。它在 高维数据分析中十分常用,可以剔除掉“冗余”和“无关”的特征,提升学习器的性能。特征选择方法和分类方法一样,也主要分为有监督(Supervised)和无监督(Unsup ...
分类:其他好文   时间:2018-08-17 12:49:55    阅读次数:319
采样之Gibbs采样
前面我们讲到了M-H采样已经可以很好的解决蒙特卡罗方法需要的任意概率分布的样本集的问题。但是M-H采样有两个缺点:一是需要计算接受率,在高维时计算量大。并且由于接受率的原因导致算法收敛时间变长。二是有些高维数据,特征的条件概率分布好求,但是特征的联合分布不好求。因此需要一个好的方法来改进M-H采样, ...
分类:其他好文   时间:2018-08-16 00:57:09    阅读次数:146
MATLAB在数学建模中的应用(二)
size():获取矩阵的行数和列数 (1)s=size(A), 当只有一个输出参数时,返回一个行向量,该行向量的第一个元素为矩阵的行数,第二个元素是矩阵的列数。 (2)[r,c]=size(A), (3)size(A,n)如果在size函数的输入参数中再添加一项n,并用1或2为n赋值,则 size将 ...
分类:其他好文   时间:2018-08-14 18:51:34    阅读次数:116
Andrew Ng-ML-第十五章-降维
1.数据压缩 数据压缩不仅能够减小存储空间,并且能够加速学习算法。那么什么是数据压缩呢?下面给出了一个简单的例子: 图1.数据压缩的概念 举了两个例子,一个是横轴x1是厘米,纵轴特征x2是英尺,这明显是冗余的,但是在真正的实施过程中,这并不常见,这并不是一个好例子。 另一个例子是,横轴是驾驶员的技术 ...
分类:其他好文   时间:2018-08-10 23:04:11    阅读次数:165
线性判别分析(LDA)
降维的作用: 高维数据特征个数多,特征样本多,维度也很大,计算量就会很大,调参和最后评估任务时,计算量非常大,导致效率低。 高位数据特征特别多,有的特征很重要,有的特征不重要,可以通过降维保留最好、最重要的特征。 PCA是无类别信息,不知道样本属于哪个类,用PCA,通常对全体数据操作。 LDA有类别 ...
分类:其他好文   时间:2018-07-08 12:40:47    阅读次数:209
机器学习:PCA(高维数据映射为低维数据 封装&调用)
# 每个主成分向量的长度与数据集的特征数一样 # 主成分分析法的本质:将数据集从一个坐标系转换到另一个坐标系,原坐标系有 n 个维度(n 中特征),则转换的新坐标系也有 n 个维度,每个主成分表示一个维度,只是对于转换后的坐标系,只取前 k 个维度(也就是前 k 个主成分),此 k 个维度相对于数据 ...
分类:其他好文   时间:2018-06-24 20:53:26    阅读次数:144
聚类 高维聚类 聚类评估标准
高维数据的聚类分析 高维聚类研究方向 高维数据聚类的难点在于: 1、适用于普通集合的聚类算法,在高维数据集合中效率极低 2、由于高维空间的稀疏性以及最近邻特性,高维的空间中基本不存在数据簇。 在高维聚类的研究中有如下几个研究重点: 1)维度约简,主要分为特征变换和特征选择两大类。前者是对特征空间的变 ...
分类:其他好文   时间:2018-06-10 18:33:32    阅读次数:380
PCA算法详解——本质上就是投影后使得数据尽可能分散(方差最大),PCA可以被定义为数据在低维线性空间上的正交投影,这个线性空间被称为主?空间(principal subspace),使得投影数据的?差被最?化(Hotelling, 1933),即最大方差理论。
PCA PCA(Principal Component Analysis,主成分分析)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其 ...
分类:编程语言   时间:2018-06-02 23:58:29    阅读次数:460
Pandas三个数据结构
系列(Series) 数据帧(DataFrame) 面板(Panel) 这些数据结构构建在Numpy数组之上,这意味着它们很快。 考虑这些数据结构的最好方法是,较高维数据结构是其较低维数据结构的容器。 例如,DataFrame是Series的容器,Panel是DataFrame的容器。 构建和处理两 ...
分类:其他好文   时间:2018-05-25 19:37:50    阅读次数:210
浅谈CDQ分治
很久前就想写篇CDQ分治的blog了,现在填坑。 CDQ分治是一种分治算法,一般用于高维数据结构的降维。比如二维数据结构,可以通过CDQ分治变成一个一维的问题。 CDQ分治本质还是个分治。一般分治操作就是,我想知道一个长度为n的区间产生的贡献有多少,那我可以把区间平均划分成两部分,那么此时问题变成左 ...
分类:其他好文   时间:2018-05-01 23:35:35    阅读次数:164
99条   上一页 1 2 3 4 5 6 ... 10 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!