1.前言 对大量需要分类的文本数据进行标记是一项繁琐、耗时的任务,而真实世界中,如互联网上存在大量的未标注的数据,获取这些是容易和廉价的。在下面的内容中,我们介绍使用半监督学习和EM算法,充分结合大量未标记的样本,以期获得文本分类更高的准确率。本文使用的是多项式朴素贝叶斯作为分类器,通过EM算法进行 ...
分类:
编程语言 时间:
2018-02-07 14:55:24
阅读次数:
251
算法分类一: 有监督学习 无监督学习 半监督学习 算法分类二 分类与回归 聚类 标注 算法分类三 生成模型 (属于某类的概率) 识别模型 (直接告诉属于某类) ...
分类:
编程语言 时间:
2018-01-06 11:59:02
阅读次数:
153
一、监督学习 supervised learning 已有训练样本和分类器,通过训练样本来得到分类器的最佳模型,再利用这个模型来处理新样本。 (1)分类 (2)回归 (3)结构学习 structured learning (4)深度学习 常见算法: 反向传播算法 BP算法 二、半监督学习 semi- ...
分类:
其他好文 时间:
2017-11-29 21:58:14
阅读次数:
178
最近看了一下深度学习的表征学习,总结并记录与一下学习笔记。 1.在标签数据集中做的监督学习容易导致过拟合,半监督学习由于可以从无标签数据集中学习,可以有一定概率化解这种情况。 2.深度学习所使用的算法不能太复杂,否则会加大计算复杂度和工作量。 3.逐层贪婪的无监督预训练有这几个特点: (1)贪婪:基 ...
分类:
其他好文 时间:
2017-11-28 15:40:12
阅读次数:
154
概念:监督学习、无监督学习与半监督学习 监督学习 : supervised learning 无监督学习 : unsupervised learning 半监督学习 : semi-supervised learning 2 、 概念 监督学习:用一部分已知分类、有标记的样本来训练机器后,让它用学到的 ...
分类:
其他好文 时间:
2017-10-10 14:30:02
阅读次数:
269
学习的分类: 根据输出空间Y:分类(二分类、多分类)、回归、结构化(监督学习+输出空间有结构); 根据标签y:监督学习、无监督学习(聚类、密度估计、异常点检测)、半监督学习(标注成本高时)、强化学习; 根据数据喂给方式:批、在线(PLA、强化学习)、主动学习; 根据输入空间X:具体(相关物理意义)、 ...
分类:
其他好文 时间:
2017-10-07 19:38:44
阅读次数:
150
MICCAI 2017年论文 Overview: 视杯视盘精确分割后,就可以计算杯盘比了,杯盘比是青光眼疾病的主要manifestation。以往的方法往往采用监督学习的方法,这样需要大量的精确像素级别的标定。而这些标定非常费时间。所以本文为了解决这个问题,提出了一个半监督学习的方法,从一堆没有标签 ...
分类:
Web程序 时间:
2017-09-25 18:54:20
阅读次数:
344
1、基本概念:训练集,测试集,特征集,非监督学习,半监督学习,分类,回归 2、概念学习:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。 3、小例子 概念定义在实例(instance)集合之上,这个集合表示为X(X:所有可能的日子,每个日子的值由天气等6个属性表示)。 待学习的概 ...
分类:
其他好文 时间:
2017-08-11 11:01:22
阅读次数:
112
在机器学习(Machine learning)领域,主要有三类不同的学习方法: 监督学习(Supervised learning)、 非监督学习(Unsupervised learning)、 半监督学习(Semi-supervised learning), 监督学习:通过已有的一部分输入数据与输出 ...
分类:
其他好文 时间:
2017-08-07 22:08:38
阅读次数:
241
介绍了机器学习中的几类问题划分。 半监督学习能够避免标记成本昂贵的问题。 强化学习,可以看做是从反馈机制中来学习。 在线学习,数据一个接一个地产生并交给算法模型线上迭代。 主动学习,机器能针对自己没有信心的数据提问,得到答案后再学习。 针对特征空间也有分类,比如具体的特征、原始的(个人理解是人为可提 ...
分类:
其他好文 时间:
2017-06-20 16:24:28
阅读次数:
147