标签:learn learning 可视化 gray mac 组成 nat 未来 模型
Zahavy, Tom, Nir Ben-Zrihem, and Shie Mannor. "Graying the black box: Understanding DQNs." International Conference on Machine Learning. 2016.
这篇论文想要做QDN的可解释性。主要是用了t-SNE的可视化和Saliency maps。
然后他们提出了SAMDP(Semi Aggregated Markov Decision Process)模型。就是说类似的state的作为一个集合,有关的action组成一个skill。
他们希望在未来的工作中,能用他们的模型找出sub-goal。
Graying the black box: Understanding DQNs
标签:learn learning 可视化 gray mac 组成 nat 未来 模型
原文地址:http://www.cnblogs.com/huangshiyu13/p/7353520.html