问题由来在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。例如,考虑一下的三个特征:["male","female"]["from
Europe","from US","from Asia"]["uses Firefox","uses Chrome","uses
Safari","uses...
分类:
其他好文 时间:
2014-06-04 17:03:02
阅读次数:
344
KNN最邻近规则,主要应用领域是对未知事物的识别,即判断未知事物属于哪一类,判断思想是,基于欧几里得定理,判断未知事物的特征和哪一类已知事物的的特征最接近;K最近邻(k-Nearest
Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果...
分类:
其他好文 时间:
2014-06-04 16:22:30
阅读次数:
399
1.梯度上升优化1).
伪代码:所有回归系数初始化为1-------------------weights = ones((colNum,1))重复r次:
计算整个数据集的梯度gradient 使用alpha*gradient更新回归系数的向量 返回回归系数weights2). 迭代r次的代码...
分类:
其他好文 时间:
2014-06-02 18:11:41
阅读次数:
271
一、Mahout简单介绍查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦:
Mahout是一个非常强大的数据挖掘工具,是一个分布式机器学习算法的集.....
分类:
其他好文 时间:
2014-06-02 08:14:03
阅读次数:
273
机器学习算法中经常碰到非线性优化问题,如 Sparse Filtering
算法,其主要工作在于求解一个非线性极小化问题。在具体实现中,大多调用的是成熟的软件包做支撑,其中最常用的一个算法是
L-BFGS。为了解这个算法的数学机理,这几天做了一些调研,现把学习过程中理解的一些东西整理出来。目录...
分类:
其他好文 时间:
2014-06-02 07:31:21
阅读次数:
227
机器学习算法中经常碰到非线性优化问题,如 Sparse Filtering
算法,其主要工作在于求解一个非线性极小化问题。在具体实现中,大多调用的是成熟的软件包做支撑,其中最常用的一个算法是
L-BFGS。为了解这个算法的数学机理,这几天做了一些调研,现把学习过程中理解的一些东西整理出来。目录链接....
分类:
其他好文 时间:
2014-06-02 07:30:03
阅读次数:
249
机器学习算法中经常碰到非线性优化问题,如 Sparse Filtering
算法,其主要工作在于求解一个非线性极小化问题。在具体实现中,大多调用的是成熟的软件包做支撑,其中最常用的一个算法是
L-BFGS。为了解这个算法的数学机理,这几天做了一些调研,现把学习过程中理解的一些东西整理出来。目录链接....
分类:
其他好文 时间:
2014-06-02 07:28:41
阅读次数:
197
机器学习算法中经常碰到非线性优化问题,如 Sparse Filtering
算法,其主要工作在于求解一个非线性极小化问题。在具体实现中,大多调用的是成熟的软件包做支撑,其中最常用的一个算法是
L-BFGS。为了解这个算法的数学机理,这几天做了一些调研,现把学习过程中理解的一些东西整理出来。目录链.....
分类:
其他好文 时间:
2014-06-02 07:28:03
阅读次数:
210
机器学习算法中经常碰到非线性优化问题,如 Sparse Filtering
算法,其主要工作在于求解一个非线性极小化问题。在具体实现中,大多调用的是成熟的软件包做支撑,其中最常用的一个算法是
L-BFGS。为了解这个算法的数学机理,这几天做了一些调研,现把学习过程中理解的一些东西整理出来。目录链接(...
分类:
其他好文 时间:
2014-06-02 07:27:27
阅读次数:
274
最小二乘法又叫做最小平方法,是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。
通常情况下最小二乘法用于求回归问题。以简单的线性最小二乘为例,二维平面上给定个点的坐标,确定一条直线,
要求大致符合这个点的走向。
我们可以设这条直线的方程为,那么就要使在处的函数值与给定的值相
差达到最小,也就是说,要确定的值,使得
最小。根...
分类:
其他好文 时间:
2014-06-01 13:57:53
阅读次数:
206