标签:
一.Learning with Different Output Space Y
二.Learning with Different Data Label yn
监督式学习,每个训练样本都有对应的label,相当于每个x都有一个y对应
非监督式学习,每个训练样本是没有label的,需要电脑自己划分,类似于聚类,只有x而没有y
有些时候样本过于庞大,没法完全标签,只能对其中一部分标签,所以诞生了半监督式学习
增强式学习,很难明确的定义一个label,很难给x一个明确的y,比如21点,很难给要牌或者不要牌定义一个确定的y,我们可以通过惩罚和奖励这种形式,对要牌不要牌这种行为给予惩罚或者奖励,让电脑去学到东西。在reinforcement learning 这种学习方法里面,data通常是一笔一笔喂进来的,一步一步的让电脑越来越好。
三.Learning with Different Protocol f =>(xn; yn)
标签:
原文地址:http://www.cnblogs.com/wanderingzj/p/4948731.html