码迷,mamicode.com
首页 > 其他好文 > 详细

强化学习 常用平台

时间:2019-01-06 15:33:51      阅读:189      评论:0      收藏:0      [点我收藏+]

标签:api接口   学习   时间   www.   bsp   png   style   分享   不同的   

本篇博客主要是讲一下强化学习的一些常用平台, 强化学习的发展已经好多年了,以前都是大家做什么实验然后都是自己编写环境代码,由于很多人的代码都是不公开的所以其他人要继续做前人的工作就需要自己重新构建环境代码,这样做一方面做了很多重复工作,浪费了大量的时间,而且很没有必要,另一方面每个人都重新编写各自的环境代码导致每个人的环境多少是有所不同的,在一个环境下运行不是的算法代码往往在另一个环境平台上可能就难以达到之前的表现,这种情况下使得大家的代码不具备可复现性,而这本质上违背了学科科研的要求。

 

 

具体平台介绍如下:

1.    Gym

gym 是  openAI 公司出品的强化学习常用环境平台, 该平台应该是强化学习被人所熟知最多的, 集成的环境非常多,同时也有多个第三方环境为期提供接口。

 环境介绍页面:   http://gym.openai.com/envs/#classic_control

技术分享图片

 

文档介绍页面:

技术分享图片

 

具体如何安装 gym 前文已经介绍,这里就不在多说。 前文地址: https://www.cnblogs.com/devilmaycry812839668/p/10226829.html

 附注:

这里唯一要多说的是啥呢,就是Gym环境里面只提供了环境代码,并没有集成任何强化学习代码,具体强化学习代码需要自己按照其API接口来写,其最大优点就是接口比较好,众多强化学习环境都为其提供接口。

 

强化学习 常用平台

标签:api接口   学习   时间   www.   bsp   png   style   分享   不同的   

原文地址:https://www.cnblogs.com/devilmaycry812839668/p/10228987.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!