码迷,mamicode.com
首页 >  
搜索关键字:强化学习    ( 328个结果
机器学习 | 机器学习概念理解与基本知识
机器学习概念理解与基本知识 1、机器学习是什么 在数据上通过算法总结出规律模式,应用在新数据上做预测。 2、机器学习基本概念 2.1、不同类型的问题 监督学习:分类问题(选择)、回归问题(计算) 无监督学习:聚类问题(抱团)、关联规则 强化学习:从环境行为到映射的学习 2.2、机器学习工业应用方向 ...
分类:其他好文   时间:2018-02-11 14:41:25    阅读次数:154
强化学习
1. 什么是强化学习(Refinancement Learning) 强化学习是机器学习大家族中的一类,使用强化学习能够让机器学者如何在环境中拿到高分,表现出优秀的成绩。而这些成绩的背后是算法不断的试错,不断的学习经验,累计经验的结果。 强化学习是一类算法,是让计算机实现从一开始什么都不懂,脑袋里什 ...
分类:其他好文   时间:2018-02-05 14:23:50    阅读次数:1240
马尔可夫决策过程中的动规
RL学习路线 记录强化学习入门的相关算法及实现。 DP Policy Evaluation 通过以下步骤进行 同步backup ,从而 评估 一个给定的 policy : 1. 在第 $k+1$ 轮, 2. 对于所有状态 $s\in S$, 3. 更新 $v_{k+1}(s)=\sum_{a\in\ ...
分类:其他好文   时间:2018-01-28 20:02:56    阅读次数:173
强化学习之猜猜我是谁--- Deep Q-Network ^_^
Deep Q-Network和Q-Learning怎么长得这么像,难道它们有关系? 没错,Deep Q-Network其实是Q-Learning融合了神经网络的一种方法 这次我们以打飞机的一个例子来讲解Deep Q-Network,什么打飞机?嘻嘻,我们接着看 简要 Deep Q-Network简称 ...
分类:Web程序   时间:2018-01-24 14:00:48    阅读次数:894
《Python 机器学习》笔记(一)
赋予计算机学习数据的能力涵盖:1.机器学习的一般概念2.机器学习方法的三种类型和基本术语3.成功构建机器学习系统所需的模块机器学习的三种不同方法1.监督学习2.无监督学习3.强化学习通过监督学习对未来事件进行预测监督学习的主要目的是使用有类标的训练数据构建模型,我们可以使用训练得到的模型对未来数据进... ...
分类:编程语言   时间:2018-01-21 21:32:38    阅读次数:164
分布式强化学习基础概念(Distributional RL )
分布式强化学习基础概念(Distributional RL) from: https://mtomassoli.github.io/2017/12/08/distributional_rl/ 1. Q-learning 在 Q-learning 中,我们想要优化如下的 loss: Distribut ...
分类:其他好文   时间:2018-01-14 18:43:54    阅读次数:185
Open AI Gym简介
介绍OpenAI Gym是一款用于研发和比较强化学习算法的工具包,它支持训练智能体(agent)做任何事——从行走到玩Pong或围棋之类的游戏都在范围中。OpenAI Gym 是一个用于开发和比较RL 算法的工具包,与其他的数值计算库兼容,如tensorflow 或者theano 库。现在主要支持的... ...
分类:其他好文   时间:2018-01-03 00:48:32    阅读次数:273
18 Issues in Current Deep Reinforcement Learning from ZhiHu
深度强化学习的18个关键问题 from: https://zhuanlan.zhihu.com/p/32153603 85 人赞了该文章 深度强化学习的问题在哪里?未来怎么走?哪些方面可以突破? 这两天我阅读了两篇篇猛文A Brief Survey of Deep Reinforcement Lea ...
分类:其他好文   时间:2017-12-21 12:00:12    阅读次数:174
NIPS 2017 — notes and thoughts 个人笔记
只写一下自己觉得很有趣的部分 keytrends 今年流行啥? 1. 深度学习还是很火。视觉图像等有了很多处理应用。多数是CNN的变种,比较牛逼的有Capsule Networks 和 WaveNet。 2. 强化学习 3. Meta Learning and One Shot learning 4 ...
分类:其他好文   时间:2017-12-16 13:23:26    阅读次数:161
深度强化学习之:模仿学习(imitation learning)
深度强化学习之:模仿学习(imitation learning) 2017.12.10 本文所涉及到的 模仿学习,则是从给定的展示中进行学习。机器在这个过程中,也和环境进行交互,但是,并没有显示的得到 reward。在某些任务上,也很难定义 reward。如:自动驾驶,撞死一人,reward为多少, ...
分类:其他好文   时间:2017-12-10 13:08:51    阅读次数:675
328条   上一页 1 ... 24 25 26 27 28 ... 33 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!