动机在机器学习领域中,我们常常会遇到维数很高的数据,有些数据的特征维度高达上百万维,很显然这样的数据是无法直接计算的,而且维度这么高,其中包含的信息一定有冗余,这时就需要进行降维,总的来说,我们降维的主要目的有如下几条:在原始的高维空间中,包含有冗余信息以及噪音信息,在实际应用例如图像识别中造成了误...
分类:
其他好文 时间:
2015-07-22 06:50:50
阅读次数:
420
机器学习中的数学(4)-线性判别分析(LDA), 主成分分析(PCA)版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com前言:第二篇的文...
分类:
其他好文 时间:
2015-07-21 21:56:35
阅读次数:
206
矩阵及其变换、特征值与特征向量的物理意义最近在做聚类的时候用到了主成分分析PCA技术,里面涉及一些关于矩阵特征值和特征向量的内容,在网上找到一篇对特征向量及其物理意义说明较好的文章,整理下来,分享一下。一、矩阵基础[1]:矩阵是一个表示二维空间的数组,矩阵可以看做是一个变换。在线性代数中,矩阵可以把...
分类:
其他好文 时间:
2015-07-21 16:39:32
阅读次数:
143
算法名称: k近邻算法 (kNN:k-NearestNeighbor)问题提出: 根据已有对象的归类数据,给新对象(事物)归类。核心思想:将对象分解为特征,因为对象的特征决定了事对象的分类。度量每个特征的程度,将其数字化。所有特征值构成元组,作为该对象的坐标。计算待检测对象和所有已知对象的距离,选择...
分类:
编程语言 时间:
2015-07-21 12:26:30
阅读次数:
107
原文:http://blog.codinglabs.org/articles/pca-tutorial.htmlPCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于...
分类:
其他好文 时间:
2015-07-21 01:17:43
阅读次数:
200
PCA的数学原理PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过程,而没有讲述其中的...
分类:
其他好文 时间:
2015-07-17 22:38:16
阅读次数:
234
本文参考:http://scikit-learn.org/stable/data_transforms.html
本篇主要讲数据预处理,包括四部分:
数据清洗、数据降维(PCA类)、数据增维(Kernel类)、提取自定义特征。哇哈哈,还是关注预处理比较靠谱。。。。
重要的不翻译:scikit-learn provides
a library of transformers, whi...
分类:
其他好文 时间:
2015-07-17 10:09:01
阅读次数:
145
本文基于台大机器学习技法系列课程进行的笔记总结。
一、主要内容
topic 1 深度神经网络结构
从类神经网络结构中我们已经发现了神经网络中的每一层实际上都是对前一层进行的特征转换,也就是特征抽取。一般的隐藏层(hidden layer)较少的类神经网络结构我们称之为shallow,而当隐藏层数比较多的类神经网络结构我们称之为deep。如下图所示:
从两者的对比中可以明显...
分类:
其他好文 时间:
2015-07-16 17:04:07
阅读次数:
267
实验中使用的数据依然是UCI上的Iris,实验中分别有样本数据和测试使用的数据,分别如下:样本数据是分别算则iris中三类数据各30个:5.1,3.5,1.4,0.2,Iris-setosa4.9,3.0,1.4,0.2,Iris-setosa4.7,3.2,1.3,0.2,Iris-setosa4...
分类:
编程语言 时间:
2015-07-16 15:52:24
阅读次数:
157
这个转自csdn,很贴近工程。协同过滤(Collective Filtering)可以说是推荐系统的标配算法。在谈推荐必谈协同的今天,我们也来谈一谈基于KNN的协同过滤在实际的推荐应用中的一些心得体会。我们首先从协同过滤的两个假设聊起。两个假设:用户一般会喜欢与自己喜欢物品相似的物品用户一般会喜欢与...
分类:
其他好文 时间:
2015-07-13 00:35:56
阅读次数:
172