搜索关键字：强化学习，搜索到328个结果！码迷,mamicode.com！

强化学习网络中谷歌新型PlaNet最牛，它到底牛在哪里？

迁移学习是谷歌、Salesforce、IBM和微软Azure提供的多种自动机器学习管理服务的基础。由谷歌提出的BERT模型以及由Sebastian Ruder和Jeremy Howard共同提出的ULMFIT(通用语言模型微调文本分类)模型都重点突出了迁移学习，可见迁移学习是目前NLP（自然语言处理... ...

分类：Web程序时间：2019-05-09 15:14:27 阅读次数：255

03 Types of Learning

一.学习的类型 1.根据输出空间：分类（二分类，多类别分类），回归，结构化二分类：解决是非问题多类别分类：邮递区号的辨识，邮件分类，图像辨识回归：预测股票走势，预测天气结构化：自然语言辨识 2.根据标签：监督学习，非监督学习，半监督学习，强化学习非监督学习：聚类、密度分析、离群点检测（目标 ...

分类：其他好文时间：2019-04-19 17:44:51 阅读次数：189

【转】《西瓜书机器学习详细公式推导版》发布

转自：https://github.com/datawhalechina/pumpkin-book https://mp.weixin.qq.com/s/FcwgjS4FXfGJPZEQEz3cVw 南瓜书PumpkinBook 周志华老师的《机器学习》（西瓜书）是机器学习领域的经典入门教材之一，周 ...

分类：其他好文时间：2019-04-09 13:54:37 阅读次数：182

强化学习1

只是初步涉猎，因为读的论文涉及到了。学习资料来自于网络，主要是udacity的cs600，佐治亚理工的老师本来以为第一遍看视频就能完全搞懂了，并没有还是写随笔好好整理一下三种学习的类型：有监督，无监督，强化实际的世界，系统，状态之间的转移由马尔可夫的状态转移概率确定。 States:$ s ...

分类：其他好文时间：2019-03-14 16:34:24 阅读次数：126

【论文 PPT】【转】Human-level control through deep reinforcement learning（DQN）

最近在学习强化学习的东西，在网上发现了一个关于DQN讲解的PPT，感觉很是不错，这里做下记录，具体出处不详。 ...

分类：其他好文时间：2019-03-10 13:47:24 阅读次数：182

David Silver强化学习Lecture2：马尔可夫决策过程

课件： "Lecture 2: Markov Decision Processes" 视频： "David Silver深度强化学习第2课简介 (中文字幕)" 马尔可夫过程马尔可夫决策过程简介马尔可夫决策过程(Markov Decision Processes, MDPs) 形式上用来描述 ...

分类：其他好文时间：2019-02-28 14:37:20 阅读次数：190

David Silver强化学习Lecture1：强化学习简介

课件： "Lecture 1: Introduction to Reinforcement Learning" 视频： "David Silver深度强化学习第1课简介 (中文字幕)" <! more 强化学习的特征作为机器学习的一个分支，强化学习主要的特征为: 无监督,仅有奖励信号；反馈 ...

分类：其他好文时间：2019-02-26 22:15:59 阅读次数：304

github上DQN代码的环境搭建，及运行（Human-Level Control through Deep Reinforcement Learning）conda配置

最近师弟在做DQN的实验，由于是强化学习方面的东西，正好和我现在的研究方向一样于是我便帮忙跑了跑实验，于是就有了今天的这个内容。首先在github上进行搜寻，如下图：发现第一个星数最多，而且远高于其它的项目，于是拉取这个链接： https://github.com/devsisters/DQN- ...

分类：其他好文时间：2019-02-26 13:02:12 阅读次数：678

强化学习-策略迭代代码实现

1. 前言今天要重代码的角度给大家详细介绍下策略迭代的原理和实现方式。 "本节完整代码GitHub" 。我们开始介绍策略迭代前，先介绍一个蛇棋的游戏它是我们后面学习的环境，介绍下它的规则： 1. 玩家每人拥有一个棋子，出发点在图中标为“1”的格子处。 2. 依次掷骰子，根据骰子的点数将自己的棋 ...

分类：其他好文时间：2019-02-15 23:54:17 阅读次数：403

百度PaddlePaddle再获新技能智能推荐、对话系统、控制领域都能搞定！

引言：人工智能技术越来越广泛的应用于各行各业，而这一切都离不开底层深度学习框架的支持。近日，百度深度学习PaddlePaddle正式发布了强化学习框架PARL，同时开源了基于该框架，在NeurIPS2018强化学习赛事中夺冠的模型完整训练代码，再次向业界展示了百度在深度学习领域的技术能力。PARL的效果如何？PARL是基于百度PaddlePaddle打造的深度强化学习框架，覆盖了DQN、DDQN、

分类：其他好文时间：2019-02-13 21:09:10 阅读次数：186

共328条上一页 1 ... 12 13 14 15 16 ... 33 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)