作为机器学习基础学习的开篇,记录一下自己对于机器学习基础的认识和实践选择。 参考书目: 机器学习实战 这里也给出电子版本的中英文pdf文件和code:here(azkx) 我不会告诉你Ctrl+A会有其它发现~ 1、基础 对于机器学习的相关方法,最直观的认识是可以将其分为有监督和无监督两大类,可以使 ...
分类:
其他好文 时间:
2016-09-17 16:13:16
阅读次数:
110
统计学习:统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,统计学习也成为统计机器人学习[1]。 统计学习分类:有监督学习与无监督学习[2]。 统计学习三要素:模型、策略与算法[1]。 统计学习的对象:统计学习的对象是数据。统计学习从数据出发,提取数据的特征,抽取 ...
分类:
其他好文 时间:
2016-09-11 12:46:44
阅读次数:
257
监督学习多用来解决分类问题,输入的数据由特征和标签两部分构成。我们由浅入深地介绍一些经典的有监督的机器学习算法。 这里介绍一些比较简单容易理解的处理线性分类问题的算法。 线性可分&线性不可分 首先,什么是线性分类问题?线性分类问题是指,根据标签确定的数据在其空间中的分布,可以使用一条直线(或者平面, ...
分类:
其他好文 时间:
2016-08-28 06:29:07
阅读次数:
225
一、自动编码器
目前为止,我们介绍了神经网络在有标签的训练样本的有监督学习中的应用.现在假设我们只有一个未标记的训练集{x(1),x(2),x(3),…},其中x是n维的.自动编码器神经网络是一种采用反向传播的无监督学习算法,让目标值和输入相等,即让y(i)=x(i).
这是一个自动编码器:
自动编码器试图学习函数hW,b(x)≈x.换句话说,它试图学习恒等函数的逼...
分类:
其他好文 时间:
2016-08-10 22:52:41
阅读次数:
336
监督学习,就是人们常说的分类,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具有了对未知数据进行分类的能力。在人对事物的 ...
分类:
其他好文 时间:
2016-08-02 00:45:25
阅读次数:
157
#1,概念 在机器学习领域,支持向量机SVM(Support Vector Machine)是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。 SVM的主要思想可以概括为两点:⑴它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转 ...
分类:
其他好文 时间:
2016-07-20 09:02:02
阅读次数:
469
恢复内容开始 人脸识别中最核心的部分就是特征表示,人脸识别的发展史更多是人脸特征的发展。 优秀的人脸特征必须满足以下条件: 人脸特征分类: 像素灰度值特征:最简单的人脸特征,包含全部人脸信息。 有监督特征:Haar, LBP, SIFT, HOG, Gabor, TPLBP, FPLBP ... 无 ...
分类:
其他好文 时间:
2016-07-08 23:02:56
阅读次数:
402
PCA 主成分分析方法,LDA 线性判别分析方法,可以认为是有监督的数据降维。下面的代码分别实现了两种降维方式: 结果如下 ...
分类:
其他好文 时间:
2016-06-25 14:57:36
阅读次数:
408
K-L变换的理论知识
K-L变换是除了PCA外的另一种常用的特征提取方法,它有很多种形式,最基本的形式跟PCA类似,它跟PCA的不同在于,PCA是一种无监督的特征变换,而K-L变换能够考虑到不同的分类信息,实现有监督的特征提取。
根据随机过程中的KL展开理论,将随机过程描述为无数个正交函数的线性组合,而在模式识别问题中,通常可以将一个样本看成是随机向量的某一次实现结果,所以假设有一d维随机向量...
分类:
其他好文 时间:
2016-06-23 18:55:45
阅读次数:
277
第4章 排序:智能收件箱 有监督学习与无监督学习:有监督学习已有明确的输出实例;无监督学习在开始处理数据时预先并没有已知的输出实例。 理论上邮件的优先级特征: 社交特征:收件人与发件人之间的交互程度 内容特征:收件人对邮件采取行为(回复、标记等)与某些特征词之间相关 线程特征:记录用户在当前线程下的 ...
分类:
其他好文 时间:
2016-06-10 21:34:44
阅读次数:
328