码迷,mamicode.com
首页 >  
搜索关键字:强化学习    ( 328个结果
1.统计学习方法概论
1.统计学习 统计学习的对象:(1)data : 计算机及互联网上的各种数字、文字、图像、视频、音频数据以及它们的组合。(2)数据的基本假设是同类数据具有一定的统计规律性。统计学习的目的:用于对数据(特别是未知数据) 进行预测和分析。统计学习的方法:(1)分类: 监督学习无监督学习半监督学习强化学习 ...
分类:其他好文   时间:2020-01-25 19:28:51    阅读次数:155
【强化学习RL】必须知道的基础概念和MDP
本系列强化学习内容来源自对David Silver课程的学习 课程链接http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html 之前接触过RL(Reinforcement Learning) 并且在组会学习轮讲里讲过一次Policy Grad ...
分类:其他好文   时间:2020-01-25 10:22:59    阅读次数:302
多轮会话-1
开始了智能会话的研究。 算法的目标:让会话的轮数尽可能多;不要万能回复;不要回复说过的话 主要的方法:强化学习。 资料1 文献1: 宋皓宇 张伟男刘挺. (2018). 基于DQN的开放域多轮对话策略学习. 中文信息学报, 32(7), 99. http://jcip.cipsc.org.cn/CN ...
分类:其他好文   时间:2020-01-12 22:07:01    阅读次数:129
深度学习理论与实战PyTorch实现
课程目录: 01.预备内容(入门)02.Python基础(入门)03.PyTorch基础(入门)04.神经网络(进阶)05.卷积神经网络(进阶)06.循环神经网络(进阶)07.生成对抗网络GAN(进阶)08.强化学习(进阶)09.毕业项目 下载地址:深度学习理论与实战PyTorch实现 ...
分类:其他好文   时间:2020-01-06 09:16:54    阅读次数:80
第一章:统计学习及监督学习概论
[TOC] 统计学习 对象:data 目的:预测和分析 方法 监督,无监督,强化学习 基本分类 1. 监督学习 从标注数据中学习预测模型 建设$(X,Y)$遵循联合概率分布$P(X,Y)$, 样本独立同分布 假设空间:输入空间到输出空间映射的集合 2. 无监督 $X$是输入空间,$Z$是隐式结构空间 ...
分类:其他好文   时间:2020-01-05 10:13:03    阅读次数:95
强化学习杂谈
强化学习从入门到放弃 [TOC] 杂谈 我们不一样? no supervisor , only reward feedback is delayed. 当前行为产生的实际价值可能要很久才能知道 reward hypothesis All goals can be described by the m ...
分类:其他好文   时间:2020-01-02 22:38:01    阅读次数:88
Prioritized Experience Replay: PER
论文地址 "PER" PER的基本思路跟传统强化学习里面的Prioritized Sweeping基本一样。就是从replay buffer中sample的时候按照优先级sample,优先级用transition 的TD error来表示。transition 的TD error越大说明这个需要更好 ...
分类:其他好文   时间:2020-01-01 00:05:36    阅读次数:109
Deep Reinforcement Learning with Double Q-learning: DDQN 简约不简单
论文链接: "Double DQN" "Double Q learning" 在传统强化学习领域里面,学者们已经认识到了Q learning 存在overestimate的问题。overestimation 会损害performance,因为overestimate很可能是不均匀的.造成overes ...
分类:其他好文   时间:2019-12-31 14:13:24    阅读次数:135
Playing Atari with Deep Reinforcement Learning:打响DRL的第一枪
这篇文章就是DQN,DRL领域非常重要的一篇文章,也是David Silver大神的工作。文章本身没有什么难度。 文章说了RL和DL 的两个不同之处 DL 尤其是supervised learning 需要大量的labelled training data, 强化学习只有一个scalar Rewar ...
分类:其他好文   时间:2019-12-31 01:22:46    阅读次数:80
计划 2020-01-01
系统学习机器学习书本知识--每周两章节,列表如下: 1.模式评估与选择 线性模型 2.决策树 神经网络 3.支持向量机 贝叶斯分类器 4.集成学习 聚类 5.降维与度量学习 特征选择与稀疏学习 6.计算学习理论 半监督学习 7.概率图模型 规则学习 8.强化学习 ...
分类:其他好文   时间:2019-12-29 18:52:15    阅读次数:93
328条   上一页 1 ... 7 8 9 10 11 ... 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!