标签:api接口 学习 时间 www. bsp png style 分享 不同的
本篇博客主要是讲一下强化学习的一些常用平台, 强化学习的发展已经好多年了,以前都是大家做什么实验然后都是自己编写环境代码,由于很多人的代码都是不公开的所以其他人要继续做前人的工作就需要自己重新构建环境代码,这样做一方面做了很多重复工作,浪费了大量的时间,而且很没有必要,另一方面每个人都重新编写各自的环境代码导致每个人的环境多少是有所不同的,在一个环境下运行不是的算法代码往往在另一个环境平台上可能就难以达到之前的表现,这种情况下使得大家的代码不具备可复现性,而这本质上违背了学科科研的要求。
具体平台介绍如下:
1. Gym
gym 是 openAI 公司出品的强化学习常用环境平台, 该平台应该是强化学习被人所熟知最多的, 集成的环境非常多,同时也有多个第三方环境为期提供接口。
环境介绍页面: http://gym.openai.com/envs/#classic_control
文档介绍页面:
具体如何安装 gym 前文已经介绍,这里就不在多说。 前文地址: https://www.cnblogs.com/devilmaycry812839668/p/10226829.html
附注:
这里唯一要多说的是啥呢,就是Gym环境里面只提供了环境代码,并没有集成任何强化学习代码,具体强化学习代码需要自己按照其API接口来写,其最大优点就是接口比较好,众多强化学习环境都为其提供接口。
标签:api接口 学习 时间 www. bsp png style 分享 不同的
原文地址:https://www.cnblogs.com/devilmaycry812839668/p/10228987.html