标签:学习 nbsp 思考 .com 解决 code 简介 img and
简介:
PGMRL: PGMRL就是把RL问题建模成一个概率图模型,如下图所示:
然后通过variational inference的方法进行学习:
PGMRL给RL问题的表示给了一个范例,对解决很多RL新问题提供了一种思路和工具。
Bayesian RL:
思考:为什么PGMRL推导过程中没有Beyesian RL的exploration-exploitation trade-off的问题。
thinking: what things does the Beyesian RL not consider?
标签:学习 nbsp 思考 .com 解决 code 简介 img and
原文地址:https://www.cnblogs.com/huangshiyu13/p/10654431.html