【machine learning】regularization

时间：2015-01-21 15:11:39 阅读：391 评论：0 收藏：0 [点我收藏+]

标签：machine learning regularization 正则化机器学习范式

一、机器学习范式

1、按数据类型划分(带标签与否)

技术分享

这是从样本的数据进行划分，现实中大部分属于半监督学习，并且大部分数据是没分类好的。

监督学习：

技术分享

例子：

分类

e.g. 文本分类垃圾邮件过滤搜索结果

回归分析

e.g. 房价预测股价预测

序列标注

e.g. 词性标注

输入:“我中了一张彩票”

输出:“我/r 中/v 了/y /一/m /张/q /彩票/n

无监督学习：

技术分享

例子：

聚类

e.g. 热点话题发现社团发现

密度函数估计(probability density estimation )

e.g. pdf估计

异常点检测(outlier detection)

e.g. one-class SVM, 去噪

半监督学习：

技术分享

核心思想

考虑如何利用少量的标注样本和大量的未标注样本进行训练和分类的问题

例子：

分类

e.g. 垃圾邮件过滤，半监督SVM

回归分析

聚类

e.g. GMM

2、按学习过程划分

主动学习、转导学习、强化学习

主动学习(Active Learning)

有少量标注的数据以及丰富的未标注数据，标注数据的成本很高，学习算法主动提出一些标注请求，将筛选过的数据交给专家进行标注，然后将标注的数据加入到训练集中，再进行训练。

核心问题：怎么样筛选数据才能使得请求标注的次数尽量少而最终的结果又尽量好

与半监督学习的区别：半监督学习算法不需要人工干预，基于自身对未标记数据加以利用，微博的用户推荐用户就是充当专家的角色。

问题可形式化为：

技术分享

转导学习(Transductive Learning)

一种通过观察特定的训练样本，进而预测特定的测试样本的方法在不同的测试集上会产生相互不一致的预测

特点：

1.建立一个更适用于问题域的模型，而非一个更通用的模型

2.利用无标注的测试样本的信息发现聚簇，进而更有效地分类

3.模型近似

与半监督学习的区别：半监督学习不知道测试案例是什么，转导学习知道测试案例是什么

半监督学习本质上是从特殊到一般(train)，一般到特殊(predict)的推理方法

转导学习本质上是直接从特殊到特殊的推理方法，自动修正模型。

强化学习(Reinforcement Learning)

从环境状态到行为映射的学习，以使系统行为从环境中获得的累积奖赏值最大。该方法不同与监督学习技术那样通过正例、反例来告知采取何种行为，而是通过试错（trial-and-error）的方法来发现最优行为策略

适用情况：适用于序列决策或者控制问题，很难有这么规则的样本。

e.g. 象棋AI程序

解决思路:我们设计一个回报函数（reward function），如果learning agent（象棋AI程序）在决定一步后，获得了较好的结果，那么我们给agent一些回报（比如回报函数结果为正），得到较差的结果，那么回报函数为负。如果我们能够对每一步进行评价，得到相应的回报函数，那么就好办了，我们只需要找到一条回报值最大的路径（每步的回报之和最大），就认为是最佳的路径。

备注:一个强化学习的比赛 http://ijcai-15.org/index.php/angry-birds-competition

二、正则化

1、模型选择：

a.若采用多项式拟合

技术分享