码迷,mamicode.com
首页 > 其他好文 > 详细

Graying the black box: Understanding DQNs

时间:2017-08-13 16:18:55      阅读:145      评论:0      收藏:0      [点我收藏+]

标签:learn   learning   可视化   gray   mac   组成   nat   未来   模型   

Zahavy, Tom, Nir Ben-Zrihem, and Shie Mannor. "Graying the black box: Understanding DQNs." International Conference on Machine Learning. 2016.

 

这篇论文想要做QDN的可解释性。主要是用了t-SNE的可视化和Saliency maps。

 

然后他们提出了SAMDP(Semi Aggregated Markov Decision Process)模型。就是说类似的state的作为一个集合,有关的action组成一个skill。

 

他们希望在未来的工作中,能用他们的模型找出sub-goal。

Graying the black box: Understanding DQNs

标签:learn   learning   可视化   gray   mac   组成   nat   未来   模型   

原文地址:http://www.cnblogs.com/huangshiyu13/p/7353520.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!