码迷,mamicode.com
首页 > 其他好文 > 详细

绪论-1.1.2机器学习

时间:2020-07-06 15:47:44      阅读:70      评论:0      收藏:0      [点我收藏+]

标签:参数   sel   机器   ISE   常见   code   线性回归   网络   数据   

1.1.2 机器学习

  机器学习分为两部分:

    有监督学习(Surpervised Learning)

    无监督学习(Unsupervised Learning)

    强化学习(Reinforcement Learning,简称RL)

    如下图所示:

                     

 

           技术图片

  有监督学习 有监督学习的数据集包含了样本x与样本label y,算法模型需要学习到映射关系Fθ:x->y,其中Fθ代表模型函数,θ为模型参数。在训练时,通过计算模型的预测值Fθ(x)与真实值y之间的误差来优化网络参数θ,使得网络下一次能够预测的更精准。常见的有监督学习有线性回归,逻辑回归,支持向量机,随机森林等。

  无监督学习 收集带标签的数据往往代价比较昂贵,对于只有样本x的数据集,算法需要自行发现数据的模态,这种方式叫做无监督学习。无监督学习中有一类算法将自身作为监督信号,即模型需要学习的映射关系为Fθ:x->x,称为自监督学习(Self-supervised Learning),在计算时通过计算模型的预测值Fθ(x)与x之间的误差来优化网络参数θ。常见的无监督学习有自编码器,生成对抗网络等。

  强化学习 也称为增强学习,通过与环境进行交互来学习解决问题的策略的一类算法。与有监督、无监督学习不同,强化学习问题并没有明确的“正确的”动作监督信号,算法需要与环境进行交互,获取环境反馈的滞后奖励信号,因此并不能通过计算动作与正确动作之间的误差来优化网络。常见的学习算法有DQN,PPO等。

  

 

绪论-1.1.2机器学习

标签:参数   sel   机器   ISE   常见   code   线性回归   网络   数据   

原文地址:https://www.cnblogs.com/cropmodel/p/13254862.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!