标签:迷宫问题 化学 深度学习 概述 sch sse 特性 问题 pad
强化学习是近些年最火,最接近“真实情况”的深度学习方式。对比其他学习注重的是决策问题,通过智能体与周边环境的交互学会了如何能获得更多的奖励。
百度的paddle团队开源了强化学习PARL项目,该项目有几大特性:
这些特性是在实际开发中真实需要的,PARL库内置了很多强化学习算法,可以对轻量级问题进行很好的测试,找寻basseline。
PARL的多线程也是令人兴奋的特性,这可以使python原有的多线程起到真正的作用。
附录:课表
一、强化学习(RL)初印象
二、基于表格型方法求解RL
三、基于神经网络方法求解RL
四、基于策略梯度求解RL
五、连续动作空间上求解RL
标签:迷宫问题 化学 深度学习 概述 sch sse 特性 问题 pad
原文地址:https://www.cnblogs.com/MyBlog-MrY/p/13190594.html