码迷,mamicode.com
首页 >  
搜索关键字:强化学习    ( 328个结果
强化学习网络中谷歌新型PlaNet最牛,它到底牛在哪里?
迁移学习是谷歌、Salesforce、IBM和微软Azure提供的多种自动机器学习管理服务的基础。由谷歌提出的BERT模型以及由Sebastian Ruder和Jeremy Howard共同提出的ULMFIT(通用语言模型微调文本分类)模型都重点突出了迁移学习,可见迁移学习是目前NLP(自然语言处理... ...
分类:Web程序   时间:2019-05-09 15:14:27    阅读次数:255
03 Types of Learning
一.学习的类型 1.根据输出空间:分类(二分类,多类别分类),回归,结构化 二分类:解决是非问题 多类别分类:邮递区号的辨识,邮件分类,图像辨识 回归:预测股票走势,预测天气 结构化:自然语言辨识 2.根据标签:监督学习,非监督学习,半监督学习,强化学习 非监督学习:聚类、密度分析、离群点检测(目标 ...
分类:其他好文   时间:2019-04-19 17:44:51    阅读次数:189
【转】《西瓜书机器学习详细公式推导版》发布
转自:https://github.com/datawhalechina/pumpkin-book https://mp.weixin.qq.com/s/FcwgjS4FXfGJPZEQEz3cVw 南瓜书PumpkinBook 周志华老师的《机器学习》(西瓜书)是机器学习领域的经典入门教材之一,周 ...
分类:其他好文   时间:2019-04-09 13:54:37    阅读次数:182
强化学习1
只是初步涉猎,因为读的论文涉及到了。 学习资料来自于网络,主要是udacity的cs600,佐治亚理工的老师 本来以为第一遍看视频就能完全搞懂了,并没有 还是写随笔好好整理一下 三种学习的类型:有监督,无监督,强化 实际的世界,系统,状态之间的转移由马尔可夫的状态转移概率确定。 States:$ s ...
分类:其他好文   时间:2019-03-14 16:34:24    阅读次数:126
【论文 PPT】 【转】Human-level control through deep reinforcement learning(DQN)
最近在学习强化学习的东西,在网上发现了一个关于DQN讲解的PPT,感觉很是不错,这里做下记录,具体出处不详。 ...
分类:其他好文   时间:2019-03-10 13:47:24    阅读次数:182
David Silver强化学习Lecture2:马尔可夫决策过程
课件 : "Lecture 2: Markov Decision Processes" 视频 : "David Silver深度强化学习第2课 简介 (中文字幕)" 马尔可夫过程 马尔可夫决策过程简介 马尔可夫决策过程(Markov Decision Processes, MDPs) 形式上用来描述 ...
分类:其他好文   时间:2019-02-28 14:37:20    阅读次数:190
David Silver强化学习Lecture1:强化学习简介
课件 : "Lecture 1: Introduction to Reinforcement Learning" 视频 : "David Silver深度强化学习第1课 简介 (中文字幕)" <! more 强化学习的特征 作为机器学习的一个分支,强化学习主要的特征为: 无监督,仅有奖励信号; 反馈 ...
分类:其他好文   时间:2019-02-26 22:15:59    阅读次数:304
github上DQN代码的环境搭建,及运行(Human-Level Control through Deep Reinforcement Learning)conda配置
最近师弟在做DQN的实验,由于是强化学习方面的东西,正好和我现在的研究方向一样于是我便帮忙跑了跑实验,于是就有了今天的这个内容。 首先在github上进行搜寻,如下图: 发现第一个星数最多,而且远高于其它的项目,于是拉取这个链接: https://github.com/devsisters/DQN- ...
分类:其他好文   时间:2019-02-26 13:02:12    阅读次数:678
强化学习-策略迭代代码实现
1. 前言 今天要重代码的角度给大家详细介绍下策略迭代的原理和实现方式。 "本节完整代码GitHub" 。 我们开始介绍策略迭代前,先介绍一个蛇棋的游戏 它是我们后面学习的环境,介绍下它的规则: 1. 玩家每人拥有一个棋子,出发点在图中标为“1”的格子处。 2. 依次掷骰子,根据骰子的点数将自己的棋 ...
分类:其他好文   时间:2019-02-15 23:54:17    阅读次数:403
百度PaddlePaddle再获新技能 智能推荐、对话系统、控制领域都能搞定!
引言:人工智能技术越来越广泛的应用于各行各业,而这一切都离不开底层深度学习框架的支持。近日,百度深度学习PaddlePaddle正式发布了强化学习框架PARL,同时开源了基于该框架,在NeurIPS2018强化学习赛事中夺冠的模型完整训练代码,再次向业界展示了百度在深度学习领域的技术能力。PARL的效果如何?PARL是基于百度PaddlePaddle打造的深度强化学习框架,覆盖了DQN、DDQN、
分类:其他好文   时间:2019-02-13 21:09:10    阅读次数:186
328条   上一页 1 ... 12 13 14 15 16 ... 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!