半监督学习 事实上,未标记样本虽然未直接包含标记信息,但若它们与有标记样本是从同样的数据源独立同分布采样而来,则它们所包含的关于数据分布的信息对建立模型将有很大的益。下图给出了一个直观的例子,若仅基于图中的一个正例和一个反例,则由于待判别样本恰位于两者正中间,大体上只能随机猜测;若能观察到图中的未标... ...
分类:
其他好文 时间:
2018-10-26 22:14:25
阅读次数:
683
机器学习的定义: 让机器代替人,实现人的工作。 现有的机器学习分类: (1)监督学习 > 分类问题 (2)半监督学习 > 聚类问题 (3)非监督学习 > 聚类问题 (4)强化学习 > 降维 归纳: 主要可分为:分类、回归/预测、聚类和维度下降。 机器学习“六步走”: a.收集数据; b.准备数据 c ...
分类:
其他好文 时间:
2018-09-25 17:26:11
阅读次数:
175
本文主要讲述的是基于自训练的半监督学习算法做文本分类,自训练算法是半监督学习中比较常见的方法之一,但是自训练方法有一个很大的问题,在迭代过程中,如果初始训练样本集中已标注样本的数量过少,则可能会出现错误标注,并通过迭代使错误逐渐被放大,最终导致错误累积。所以我们采用对未标注样本重复标记策略来优化自训... ...
分类:
编程语言 时间:
2018-09-23 16:27:25
阅读次数:
367
Introduction Why semi-supervised learning helps? outline Semi-supervised Learning for Generative Model 步骤: 原因: Low-density Separation 核心思想:非黑即白。典型的算法如 ...
分类:
其他好文 时间:
2018-08-10 13:11:45
阅读次数:
496
1.有监督学习:教计算机如何做事情。 对于机器学习来说,有监督学习就是训练数据既有特征又有标签,通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。 举例:高考前所做的练习题是有标准答案的。在学习的过程中,我们可以通过对照答案,来分析问题找出方法,下一次 ...
分类:
其他好文 时间:
2018-07-23 18:38:58
阅读次数:
201
机器学习类型 机器学习模型评估步骤 深度学习数据准备 特征工程 过拟合 解决机器学习问题的一般性流程 机器学习四分支 二分类、多分类以及回归问题都属于监督学习--目标是学习训练输入和对应标签之间的关系。 监督学习只是机器学习的冰山一角。机器学习主要分为4类:监督学习、非监督学习、半监督学习和强化学习 ...
分类:
编程语言 时间:
2018-07-18 23:33:11
阅读次数:
218
前提: 统计学习(统计分析)和机器学习之间的区别 金融公司采用机器学习技术及招募相关人才 了解不同类型的机器学习 有监督学习 vs 无监督学习 迭代和评估 偏差方差权衡 结合有监督学习和无监督学习(半监督学习) 了解机器学习语言和工具集 开源 vs 专有系统和软件 Python vs R vs Ma ...
分类:
其他好文 时间:
2018-07-03 15:18:30
阅读次数:
197
监督学习与无监督学习的区别_机器学习 最近发现很多人还是不能真正分清机器学习的学习方法,我以个人的愚见结合书本简单说一下这个 机器学习中,可以根据学习任务的不同,分为监督学习(Supervised Learning),无监督学习(Unsupervised Learning)、半监督学习(Semi S ...
分类:
其他好文 时间:
2018-04-28 21:05:38
阅读次数:
178
机器学习算法可以分为: 监督学习 非监督学习 半监督学习 增强学习 监督学习:给机器的训练数据拥有“标记”或者“答案”,例如: 我们需要告诉机器左边的画面是一只狗,而右边的照片是一只猫。同理对于MNIST数据集,给机器图像信息后还应该附上标记信息,如图所示: 运用监督学习的场景举例: 图像已经拥有了 ...
分类:
编程语言 时间:
2018-04-22 13:01:52
阅读次数:
199
学习 定义:如果一个系统能够通过执行某个过程改进他的性能,这就是学习。 统计学习的对象:数据 目的:对数据进行预测和分析 方法:监督学习、非监督学习、半监督学习、强化学习 统计学习的三要素:方法 = 模型+策略+算法 输入变量和输出变量均为连续变量的预测问题称为回归问题 输出变量为有限个离散变量的预 ...
分类:
其他好文 时间:
2018-04-16 21:57:26
阅读次数:
160