首页 > 其他好文 > 详细

百度PARL初探

时间：2020-06-25 11:57:15 阅读：111 评论：0 收藏：0 [点我收藏+]

标签：迷宫问题化学深度学习概述 sch sse 特性问题 pad

强化学习是近些年最火，最接近“真实情况”的深度学习方式。对比其他学习注重的是决策问题，通过智能体与周边环境的交互学会了如何能获得更多的奖励。

百度的paddle团队开源了强化学习PARL项目，该项目有几大特性：

在实际任务中尝试使用强化学习解决问题
快速调研下不同强化学习算法在同一个问题上的效果
搭建分布式强化学习训练平台
加速python多线程代码

这些特性是在实际开发中真实需要的，PARL库内置了很多强化学习算法，可以对轻量级问题进行很好的测试，找寻basseline。

PARL的多线程也是令人兴奋的特性，这可以使python原有的多线程起到真正的作用。

附录：课表

一、强化学习(RL)初印象

RL 概述、入门路线
实践：环境搭建
课后作业：搭建GYM环境+PARL环境，把QuickStart 跑起来

二、基于表格型方法求解RL

MDP、状态价值、Q表格
实践： Sarsa、Q-learning代码解析，解决悬崖问题及其对比
课后作业：使用Q-learning和Sarsa解决16宫格迷宫问题。

三、基于神经网络方法求解RL

函数逼近方法
实践：DQN代码解析，解决CartPole问题
课后作业：使用DQN解决 MountianCar问题

四、基于策略梯度求解RL

策略近似、策略梯度
实践：Policy Gradient算法理解、代码解析，解决CartPole问题
课后作业：使用Policy Gradient解决Atari的Pong问题

五、连续动作空间上求解RL

连续动作空间、DDPG算法介绍
PARL DDPG代码解析
大作业题目：RLSchool 飞行器仿真环境介绍

百度PARL初探

标签：迷宫问题化学深度学习概述 sch sse 特性问题 pad

原文地址：https://www.cnblogs.com/MyBlog-MrY/p/13190594.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！