搜索关键字：强化学习，搜索到328个结果！码迷,mamicode.com！

机器学习 | 机器学习概念理解与基本知识

机器学习概念理解与基本知识 1、机器学习是什么在数据上通过算法总结出规律模式，应用在新数据上做预测。 2、机器学习基本概念 2.1、不同类型的问题监督学习：分类问题（选择）、回归问题（计算）无监督学习：聚类问题（抱团）、关联规则强化学习：从环境行为到映射的学习 2.2、机器学习工业应用方向 ...

分类：其他好文时间：2018-02-11 14:41:25 阅读次数：154

强化学习

1. 什么是强化学习（Refinancement Learning）强化学习是机器学习大家族中的一类，使用强化学习能够让机器学者如何在环境中拿到高分，表现出优秀的成绩。而这些成绩的背后是算法不断的试错，不断的学习经验，累计经验的结果。强化学习是一类算法，是让计算机实现从一开始什么都不懂，脑袋里什 ...

分类：其他好文时间：2018-02-05 14:23:50 阅读次数：1240

马尔可夫决策过程中的动规

RL学习路线记录强化学习入门的相关算法及实现。 DP Policy Evaluation 通过以下步骤进行同步backup ，从而评估一个给定的 policy ： 1. 在第 $k+1$ 轮， 2. 对于所有状态 $s\in S$， 3. 更新 $v_{k+1}(s)=\sum_{a\in\ ...

分类：其他好文时间：2018-01-28 20:02:56 阅读次数：173

强化学习之猜猜我是谁--- Deep Q-Network ^_^

Deep Q-Network和Q-Learning怎么长得这么像，难道它们有关系？没错，Deep Q-Network其实是Q-Learning融合了神经网络的一种方法这次我们以打飞机的一个例子来讲解Deep Q-Network，什么打飞机？嘻嘻，我们接着看简要 Deep Q-Network简称 ...

分类：Web程序时间：2018-01-24 14:00:48 阅读次数：894

《Python 机器学习》笔记（一）

赋予计算机学习数据的能力涵盖：1.机器学习的一般概念2.机器学习方法的三种类型和基本术语3.成功构建机器学习系统所需的模块机器学习的三种不同方法1.监督学习2.无监督学习3.强化学习通过监督学习对未来事件进行预测监督学习的主要目的是使用有类标的训练数据构建模型，我们可以使用训练得到的模型对未来数据进... ...

分类：编程语言时间：2018-01-21 21:32:38 阅读次数：164

分布式强化学习基础概念（Distributional RL ）

分布式强化学习基础概念（Distributional RL） from: https://mtomassoli.github.io/2017/12/08/distributional_rl/ 1. Q-learning 在 Q-learning 中，我们想要优化如下的 loss： Distribut ...

分类：其他好文时间：2018-01-14 18:43:54 阅读次数：185

Open AI Gym简介

介绍OpenAI Gym是一款用于研发和比较强化学习算法的工具包，它支持训练智能体（agent）做任何事——从行走到玩Pong或围棋之类的游戏都在范围中。OpenAI Gym 是一个用于开发和比较RL 算法的工具包，与其他的数值计算库兼容，如tensorflow 或者theano 库。现在主要支持的... ...

分类：其他好文时间：2018-01-03 00:48:32 阅读次数：273

18 Issues in Current Deep Reinforcement Learning from ZhiHu

深度强化学习的18个关键问题 from: https://zhuanlan.zhihu.com/p/32153603 85 人赞了该文章深度强化学习的问题在哪里？未来怎么走？哪些方面可以突破？这两天我阅读了两篇篇猛文A Brief Survey of Deep Reinforcement Lea ...

分类：其他好文时间：2017-12-21 12:00:12 阅读次数：174

NIPS 2017 — notes and thoughts 个人笔记

只写一下自己觉得很有趣的部分 keytrends 今年流行啥？ 1. 深度学习还是很火。视觉图像等有了很多处理应用。多数是CNN的变种，比较牛逼的有Capsule Networks 和 WaveNet。 2. 强化学习 3. Meta Learning and One Shot learning 4 ...

分类：其他好文时间：2017-12-16 13:23:26 阅读次数：161

深度强化学习之：模仿学习（imitation learning）

深度强化学习之：模仿学习（imitation learning） 2017.12.10 本文所涉及到的模仿学习，则是从给定的展示中进行学习。机器在这个过程中，也和环境进行交互，但是，并没有显示的得到 reward。在某些任务上，也很难定义 reward。如：自动驾驶，撞死一人，reward为多少， ...

分类：其他好文时间：2017-12-10 13:08:51 阅读次数：675

共328条上一页 1 ... 24 25 26 27 28 ... 33 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)