搜索关键字：incremental learning，搜索到4566个结果！码迷,mamicode.com！

Learning Parallax Attention for Stereo Image Super-Resolution

论文理解：https://blog.csdn.net/muyiyushan/article/details/89197083 https://blog.csdn.net/GracePro/article/details/100637822?utm_medium=distribute.pc_relev ...

分类：其他好文时间：2020-11-06 02:08:42 阅读次数：19

3. Distributional Reinforcement Learning with Quantile Regression

C51算法理论上用Wasserstein度量衡量两个累积分布函数间的距离证明了价值分布的可行性，但在实际算法中用KL散度对离散支持的概率进行拟合，不能作用于累积分布函数，不能保证Bellman更新收敛；且C51算法使用价值分布的若干个固定离散支持，通过调整它们的概率来构建价值分布。而分位数回归(q ...

分类：其他好文时间：2020-11-06 01:13:28 阅读次数：22

1. Deep Q-Learning

传统的强化学习算法具有很强的决策能力，但难以用于高维空间任务中，需要结合深度学习的高感知能力，因此延展出深度强化学习，最经典的就是DQN(Deep Q-Learning)。 DQN 2013 DQN的主要思想是训练CNN拟合出Q-Learning算法，以此让智能体在复杂的RL环境中从原始视频数据学到 ...

分类：其他好文时间：2020-11-06 01:12:42 阅读次数：18

2. A Distributional Perspective on Reinforcement Learning

本文主要研究了分布式强化学习，利用价值分布(value distribution)的思想，求出回报$Z$的概率分布，从而取代期望值(即$Q$值)。 Q-Learning Q-Learning的目标是近似Q函数，即在策略$\pi$下回报$Z_t$的期望值： \(Q^{\pi}(s,a)=\mathbb ...

分类：其他好文时间：2020-11-06 01:12:19 阅读次数：18

推荐系统遇上深度学习(九十八)-[微信]推荐系统中更好地学习用户-标签偏好

推荐系统遇上深度学习(九十八)-[微信]推荐系统中更好地学习用户-标签偏好 2020.11.01 21:29:24 本文介绍CIKM20上微信发表的一篇文章《Learning to Build User-tag Profile in Recommendation System》，主要介绍了微信看一看 ...

分类：微信时间：2020-11-02 10:43:24 阅读次数：49

一文带你了解基于视觉的机器人抓取自学习(Robot Learning)

作者：夏初点击上方“计算机视觉工坊”，选择“星标” 干货第一时间送达 “一眼就能学会动作”，或许对人而言，这样的要求有点过高，然而，在机器人的身上，这个想法正在逐步实现中。马斯克（Elon Musk）创立的人工智能公司Open AI研究通过One-Shot Imitation Learning算法 ...

分类：其他好文时间：2020-11-02 10:37:49 阅读次数：27

Online learning in higher education

Online learning involves courses offered by postsecondary institutions that are 100% virtual, excluding massively open online courses (MOOCs). Online ...

分类：其他好文时间：2020-11-01 22:20:40 阅读次数：24

manpages: system-config-users

system-config-users(8) System Config Tools Manual system-config-users(8) NAME system-config-users - User and Group Management tool SYNOPSIS system-con ...

分类：其他好文时间：2020-10-31 02:00:00 阅读次数：15

论文分享：A content-based recommendation algorithm for learning resources

A content-based recommendation algorithm for learning resources https://www.researchgate.net/profile/Xingchi_Zhou2/publication/315057561_A_content-bas ...

分类：其他好文时间：2020-10-26 11:39:40 阅读次数：28

【元学习】Meta-learning与MAML

关于元学习，网上的很多教程不太说人话，大多是根据李宏毅教授的课进行的一个拓展，并没有去详细的讲解一些步骤性的问题；关于原理或者说概要比较好的博客： https://zhuanlan.zhihu.com/p/108503451 https://zhuanlan.zhihu.com/p/5564319 ...

分类：Web程序时间：2020-10-22 23:02:55 阅读次数：36

共4566条上一页 1 ... 6 7 8 9 10 ... 457 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)