VectorIndexer
算法介绍:
VectorIndexer解决数据集中的类别特征Vector。它可以自动识别哪些特征是类别型的,并且将原始值转换为类别指标。它的处理流程如下:
...
分类:
编程语言 时间:
2016-12-02 16:21:36
阅读次数:
393
1、向量、矩阵求导 当然了,这里补充一下求解过程中的关于向量、矩阵求导的几个公式: 这里其实只需要明白第一个,后边的三个都可以由第一个简单的推导而来。 注意这里对列向量AX的每一项的求导写为行,不然就会得到一个超越矩阵,我们不采用这种方式。 ...
分类:
编程语言 时间:
2016-11-26 23:52:43
阅读次数:
397
这个是李政軒Cheng-Hsuan Li的关于机器学习一些算法的中文视频教程:http://www.powercam.cc/chli。 一、KernelMethod(A Chinese Tutorial on Kernel Method, PCA, KPCA, LDA, GDA, and SVMs) ...
分类:
编程语言 时间:
2016-11-23 07:00:24
阅读次数:
214
1、不平衡数据分类问题 对于非平衡级分类超平面,使用不平衡SVC找出最优分类超平面,基本的思想是,我们先找到一个普通的分类超平面,自动进行校正,求出最优的分类超平面 测试代码如下: 2、回归问题 支持分类的支持向量机可以推广到解决回归问题,这种方法称为支持向量回归 支持向量分类所产生的模型仅仅依赖于 ...
分类:
编程语言 时间:
2016-11-17 18:32:37
阅读次数:
357
原文地址:http://cs231n.github.io/classification/图像分类动机:在这个部分我们会介绍图片分类问题,这是一个为输入图片从一系列分类中挑选一个合适的标签的过程。这是计...
分类:
其他好文 时间:
2016-11-16 11:58:59
阅读次数:
297
在机器学习表现不佳的原因要么是过度拟合或欠拟合数据。 机器学习中的逼近目标函数过程 监督式机器学习通常理解为逼近一个目标函数(f)(f),此函数映射输入变量(X)到输出变量(Y). Y=f(X)Y=f(X) 这种特性描述可以用于定义分类和预测问题和机器学习算法的领域。 从训练数据中学习目标函数的过程 ...
分类:
编程语言 时间:
2016-11-13 17:10:10
阅读次数:
240
最近在《机器学习实战》里学习了一些基本的算法,对于一个纯新手我也在网上找了写资料,下面就我在书上所看的加上在其他博客上的内容做一个总结,博客请参照http://www.cnblogs.com/BaiYiShaoNian/p/4567446.html K-近邻算法 K-近邻算法就是采用测量不同特征值之 ...
分类:
编程语言 时间:
2016-11-11 17:29:00
阅读次数:
174
在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生成的功能,我们可以自己生成适合某一种模型的数据,用随机数据来做清洗,归一化,转换,然后选择模型与算法做拟合和预测。 ...
分类:
编程语言 时间:
2016-11-10 02:02:42
阅读次数:
296
前言:因为有接触过随机森林的基础知识,学习机器学习的时候也遇到过,最近又深入学习一次,以此mark一下。
一. 什么事随机森林?
作为新兴起的、高度灵活的一种机器学习算法,随机森林(Ran...
分类:
其他好文 时间:
2016-11-02 14:49:46
阅读次数:
414
遗传算法的灵感来源于自然界和进化论,进化和遗传是我们体会到的最好的具有普遍用途的机器学习算法。本文描述了整个算法的结构并用javascript实现了一个有趣的应用。 ...
分类:
编程语言 时间:
2016-11-02 14:38:28
阅读次数:
292