码迷,mamicode.com
首页 >  
搜索关键字:incremental learning    ( 4566个结果
Learning Parallax Attention for Stereo Image Super-Resolution
论文理解:https://blog.csdn.net/muyiyushan/article/details/89197083 https://blog.csdn.net/GracePro/article/details/100637822?utm_medium=distribute.pc_relev ...
分类:其他好文   时间:2020-11-06 02:08:42    阅读次数:19
3. Distributional Reinforcement Learning with Quantile Regression
C51算法理论上用Wasserstein度量衡量两个累积分布函数间的距离证明了价值分布的可行性,但在实际算法中用KL散度对离散支持的概率进行拟合,不能作用于累积分布函数,不能保证Bellman更新收敛;且C51算法使用价值分布的若干个固定离散支持,通过调整它们的概率来构建价值分布。 而分位数回归(q ...
分类:其他好文   时间:2020-11-06 01:13:28    阅读次数:22
1. Deep Q-Learning
传统的强化学习算法具有很强的决策能力,但难以用于高维空间任务中,需要结合深度学习的高感知能力,因此延展出深度强化学习,最经典的就是DQN(Deep Q-Learning)。 DQN 2013 DQN的主要思想是训练CNN拟合出Q-Learning算法,以此让智能体在复杂的RL环境中从原始视频数据学到 ...
分类:其他好文   时间:2020-11-06 01:12:42    阅读次数:18
2. A Distributional Perspective on Reinforcement Learning
本文主要研究了分布式强化学习,利用价值分布(value distribution)的思想,求出回报$Z$的概率分布,从而取代期望值(即$Q$值)。 Q-Learning Q-Learning的目标是近似Q函数,即在策略$\pi$下回报$Z_t$的期望值: \(Q^{\pi}(s,a)=\mathbb ...
分类:其他好文   时间:2020-11-06 01:12:19    阅读次数:18
推荐系统遇上深度学习(九十八)-[微信]推荐系统中更好地学习用户-标签偏好
推荐系统遇上深度学习(九十八)-[微信]推荐系统中更好地学习用户-标签偏好 2020.11.01 21:29:24 本文介绍CIKM20上微信发表的一篇文章《Learning to Build User-tag Profile in Recommendation System》,主要介绍了微信看一看 ...
分类:微信   时间:2020-11-02 10:43:24    阅读次数:49
一文带你了解基于视觉的机器人抓取自学习(Robot Learning)
作者:夏初 点击上方“计算机视觉工坊”,选择“星标” 干货第一时间送达 “一眼就能学会动作”,或许对人而言,这样的要求有点过高,然而,在机器人的身上,这个想法正在逐步实现中。马斯克(Elon Musk)创立的人工智能公司Open AI研究通过One-Shot Imitation Learning算法 ...
分类:其他好文   时间:2020-11-02 10:37:49    阅读次数:27
Online learning in higher education
Online learning involves courses offered by postsecondary institutions that are 100% virtual, excluding massively open online courses (MOOCs). Online ...
分类:其他好文   时间:2020-11-01 22:20:40    阅读次数:24
manpages: system-config-users
system-config-users(8) System Config Tools Manual system-config-users(8) NAME system-config-users - User and Group Management tool SYNOPSIS system-con ...
分类:其他好文   时间:2020-10-31 02:00:00    阅读次数:15
论文分享:A content-based recommendation algorithm for learning resources
A content-based recommendation algorithm for learning resources https://www.researchgate.net/profile/Xingchi_Zhou2/publication/315057561_A_content-bas ...
分类:其他好文   时间:2020-10-26 11:39:40    阅读次数:28
【元学习】Meta-learning与MAML
关于元学习,网上的很多教程不太说人话,大多是根据李宏毅教授的课进行的一个拓展,并没有去详细的讲解一些步骤性的问题; 关于原理或者说概要比较好的博客: https://zhuanlan.zhihu.com/p/108503451 https://zhuanlan.zhihu.com/p/5564319 ...
分类:Web程序   时间:2020-10-22 23:02:55    阅读次数:36
4566条   上一页 1 ... 6 7 8 9 10 ... 457 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!