任务是地图里面导航,让agent从起始点到达指定位置。
用了supervised learning + reinforcement learning + lstm
用supervised learning当做辅助训练,加速rl训练,用lstm当做memory。实验表明depth construction比较有用。
标签:com class gate environ lstm cti ons navigate super
任务是地图里面导航,让agent从起始点到达指定位置。
用了supervised learning + reinforcement learning + lstm
用supervised learning当做辅助训练,加速rl训练,用lstm当做memory。实验表明depth construction比较有用。
LEARNING TO NAVIGATE IN COMPLEX ENVIRONMENTS
标签:com class gate environ lstm cti ons navigate super
原文地址:https://www.cnblogs.com/huangshiyu13/p/8549262.html