推荐两篇讲解与实践KNN比较好博客,感谢原作者总结 http://blog.csdn.net/u012162613/article/details/41768407 http://www.cnblogs.com/ybjourney/p/4702562.html ...
分类:
编程语言 时间:
2017-05-09 23:10:25
阅读次数:
303
1.背景 PCA(Principal Component Analysis),PAC的作用主要是减少数据集的维度,然后挑选出基本的特征。 PCA的主要思想是移动坐标轴,找到方差最大的方向上的特征值。什么叫方差最大的方向的特征值呢。就像下图中的曲线B。一样。它的覆盖范围最广。基本步骤:(1)首先计算数 ...
分类:
编程语言 时间:
2017-05-07 11:45:56
阅读次数:
534
在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Descent)是最常采用的方法之一,另一种常用的方法是最小二乘法。这里就对梯度下降法做一个完整的总结。 1. 梯度 在微积分里面,对多元函数的参数求?偏导数,把求得的各个参数的偏导数以向量的形式写出来,就是梯度。比如函数 ...
分类:
其他好文 时间:
2017-05-03 17:30:08
阅读次数:
207
1.基础概念: (1) 10折交叉验证:英文名是10-fold cross-validation,用来測试算法的准确性。是经常使用的測试方法。将数据集分成10份。轮流将当中的9份作为训练数据。1分作为測试数据,进行试验。每次试验都会得出对应的正确率(或差错率)。10次的结果的正确率(或差错率)的平均 ...
分类:
编程语言 时间:
2017-04-24 19:05:17
阅读次数:
220
机器学习的入门,我们需要的一些基本概念: 机器学习的定义 M.Mitchell《机器学习》中的定义是: 算法分类 两张图片很好的总结了(机器学习)的算法分类: 评估指标 分类(Classification)算法指标: Accuracy准确率 Precision精确率 Recall召回率 F1 sco ...
分类:
编程语言 时间:
2017-04-21 16:49:26
阅读次数:
319
http://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/ In this post, we take a tour of the most popular machine learning algorithms. ...
分类:
编程语言 时间:
2017-04-09 22:08:43
阅读次数:
305
一,提高机器学习算法准确度的方法 当我们的机器学习算法不能准确预测我们测试数据时,我们可以尝试通过以下方法提高我们机器学习的算法准确度 1),获得更多的训练样例 2),减少特征数 3),增加特征数 4),增加多项式特征 5),增大或减小\(\lambda\) 二,评估机器学习模型 如果只是单独的使用 ...
分类:
编程语言 时间:
2017-04-09 18:20:03
阅读次数:
206
机器学习算法大致可以分为三种: 1. 监督学习(如回归,分类) 2. 非监督学习(如聚类,降维) 3. 增强学习 什么是增强学习呢? 增强学习(reinforcementlearning, RL)又叫做强化学习,是近年来机器学习和智能控制领域的主要方法之一。 定义: Reinforcement le ...
分类:
其他好文 时间:
2017-04-06 18:51:57
阅读次数:
218
词向量: 将词语"嵌入"到一个N维空间,使得词语相近的词语放到相近的位置。 机器翻译类不类似于矩阵的变换? 谷歌出品的一个工具Word2Vec,用于入门。 句向量?段向量?文档向量? 很多事情向量化,可以解决很多问题。 传统的one-hot 编码的原来是,有多少个字就有多少个维度. 科[1,0,0, ...
分类:
编程语言 时间:
2017-04-02 14:30:29
阅读次数:
173
朴素贝叶斯公式 Hmm隐马尔科夫 动态规划: 线性回归: 逻辑回归(sigmoid):在线性组合的基础上加了个非线性的激活函数,用于解决二分类问题,softmax,用于解决多分类问题。 集成学习(连续模型):针对错误的模型进行训练,设置多个模型,每个模型都有不同的权重,逐层进行逻辑回归、或则其他逐层 ...
分类:
编程语言 时间:
2017-04-02 11:35:31
阅读次数:
165